首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >无法刮除非英文字体- selenium

无法刮除非英文字体- selenium
EN

Stack Overflow用户
提问于 2017-05-15 02:40:31
回答 1查看 35关注 0票数 0

我对selenium是个新手,我正在尝试几个用于测试的网站。遇到一个场景,泰米尔语和印地语字体被废弃为“?”

我尝试通过notepad++、sublimetext和excel打开输出,但仍然显示为“?”

代码语言:javascript
复制
Xpath tried - //h1//following::p[@id='topDescription']

Test URLs
"https://www.hooq.tv/catalog/7a6d593d-e8f3-47b6-92ae-469b8e08178e?__sr=feed"
"https://www.hooq.tv/catalog/d023630f-882b-4df4-8cb5-857ebfff20b4?__sr=feed"

代码

代码语言:javascript
复制
d.get("https://www.hooq.tv/catalog/7a6d593d-e8f3-47b6-92ae-469b8e08178e?__sr=feed");
d.findElement(By.xpath("//h1//following::p[@id='topDescription']")).getText();

这是关于编码的问题吗?

EN

回答 1

Stack Overflow用户

发布于 2017-05-17 18:06:53

首先,在将原始文本保存到外部文件之前,请确保可以正确获取原始文本。

我在java中测试了您的元素的.getText(),它将按原样返回字符串。

接下来,您需要确保在文件写入过程中,字符集编码为UTF-8。

下面是一个使用org.apache.commons.io.FileUtils的示例

代码语言:javascript
复制
FileUtils.write(new File("C:/temp/test.txt"), str, "UTF-8");
FileUtils.write(new File("C:/temp/test.csv"), str, "UTF-8");

希望能有所帮助。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/43967568

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档