我正在从外部服务器加载HTML.HTML标记采用UTF-8编码,包含ľ、š、č、ť、ž等字符

$html = file_get_contents('http://example.com/foreign.html');

它会弄乱UTF-8字符,并加载?、?、?和类似的无稽之谈,而不是正确的UTF-8字符.

我该怎么解决这个问题?

更新:

我try 将HTML保存到一个文件中,并用UTF-8编码输出它.这两种方法都不起作用,因此这意味着file_get_contents()已返回损坏的HTML.

更新2:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="sk" lang="sk">
<head>

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
<meta http-equiv="Content-Style-Type" content="text/css" />
<meta http-equiv="Content-Language" content="sk" />
<title>Test</title>

</head>
<body>


<?php

$html = file_get_contents('http://example.com');
echo htmlentities($html);

?>

</body>
</html>

推荐答案

好吧我发现文件_get_contents()并没有导致这个问题.我在另一个问题中谈到了另一个原因.我真傻.

请看这个问题:Why Does DOM Change Encoding?

Php相关问答推荐

在WooCommerce checkout 时请求强制旅客信息并在感谢、邮箱和管理命令中显示

为什么PHP输出\n而不是实际创建一个新元素?

PHP邮件表单无法识别重音/特殊字符

如何隐藏x轴图表上的值

PHP:PHP手册-Manual

为什么正则表达式与得到的文本块之前得到的也行?

WooCommerce短代码,显示特定产品的购物车徽章中的当前数量

设置WordPress最近的帖子小部件按修改日期排序

htaccess重命名index.php以在URL中显示为SEO的友好名称

在WooCommercestore 页面上显示库存产品属性的值

扩展 WooCommerce 类触发未捕获错误:未找到WC_Coupon类

从 WooCommerce 购物车中删除总计部分,同时保留小计行

Woocommerce API - 图像问题

批量更新 WooCommerce 中所有产品的特定自定义字段

如何为自定义帖子类型的自定义角色提供功能

PHP简单地将物品装在盒子里会导致未使用的空间,但还有剩余容量

WooCommerce订单支付页面上的附加支付订单按钮

PHP使用三元运算符进行null合并(再次)

使用来自 PHP 表单的数据更新 xml 命名空间

按数字然后按字符串对关联 PHP 数组进行排序