我对selenium是个新手,我正在尝试几个用于测试的网站。遇到一个场景,泰米尔语和印地语字体被废弃为“?”
我尝试通过notepad++、sublimetext和excel打开输出,但仍然显示为“?”
Xpath tried - //h1//following::p[@id='topDescription']
Test URLs
"https://www.hooq.tv/catalog/7a6d593d-e8f3-47b6-92ae-469b8e08178e?__sr=feed"
"https://www.hooq.tv/catalog/d023630f-882b-4df4-8cb5-857ebfff20b4?__sr=feed"代码
d.get("https://www.hooq.tv/catalog/7a6d593d-e8f3-47b6-92ae-469b8e08178e?__sr=feed");
d.findElement(By.xpath("//h1//following::p[@id='topDescription']")).getText();这是关于编码的问题吗?
发布于 2017-05-17 18:06:53
首先,在将原始文本保存到外部文件之前,请确保可以正确获取原始文本。
我在java中测试了您的元素的.getText(),它将按原样返回字符串。

接下来,您需要确保在文件写入过程中,字符集编码为UTF-8。
下面是一个使用org.apache.commons.io.FileUtils的示例
FileUtils.write(new File("C:/temp/test.txt"), str, "UTF-8");
FileUtils.write(new File("C:/temp/test.csv"), str, "UTF-8");

希望能有所帮助。
https://stackoverflow.com/questions/43967568
复制相似问题