我有一个抓取到$html变量中的站点。
现在我想用下面的表达式替换一些字符
$string1 = preg_replace('/[^A-Za-z0-9äöü!&_=\+-]/i', ' ', $string);问题是存在由不同字符集引起的特殊字符。
我有一个变量$charset,页面的字符集字符串保存在这个变量中。也就是说,$charset=" utf-8“或iso-8859-1在utf-8中是我要替换的德文字母ü,在iso-8859-1中是
有没有可能根据页面的字符集告诉replace函数,而不为每个可能的字符集创建单独的正则表达式?
发布于 2010-09-22 21:36:44
或者您可以尝试添加
utf8_encode($string);就在preg_replace之前。我不确定它是否会解决您的问题,但它可能会。
有关更多信息,请参阅:http://se2.php.net/manual/en/function.utf8-encode.php。
https://stackoverflow.com/questions/3769358
复制相似问题