我正在创建一个从网站获取文本的小算法..然后找到答案(完成后将发布脚本)。
为此,我需要将内部的所有HTML代码转换为纯英语文本并将其转换为纯英语文本。
我已经手动删除了所有的html标签,但是一些css条目很难去掉。关于如何将html转换为纯英文文本,有什么简单的想法吗?
谢谢。
发布于 2009-05-11 06:30:18
some one已经为你制作了all the work。
发布于 2009-05-11 22:28:58
我开发了一些类似的东西,避免了正则表达式的性能损失:strip_tags equivalent for ASP.NET (也可以在桌面.NET程序集上运行)
https://stackoverflow.com/questions/846925
复制相似问题