首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用XMLWorker列出的HTML

使用XMLWorker列出的HTML
EN

Stack Overflow用户
提问于 2013-03-12 13:32:46
回答 1查看 6.6K关注 0票数 3

谁能提供一个使用iTextSharp中的XMLWorkerHelper (C#)将HTML解析为元素列表的示例?

文档中提供的JAVA版本为:

代码语言:javascript
复制
XMLWorkerHelper.getInstance().parseXHtml(new ElementHandler() {
        public void add(final Writable w) {

          if (w instanceof WritableElement) {
            List<Element> elements = ((WritableElement)w).elements();
          // write class names of elements to file
         }
        }

     }, HTMLParsingToList.class.getResourceAsStream("/html/walden.html"));
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-03-12 21:33:44

您需要在自己的类中实现IElementHandler接口:

代码语言:javascript
复制
public class SampleHandler : IElementHandler {
    //Generic list of elements
    public List<IElement> elements = new List<IElement>();
    //Add the supplied item to the list
    public void Add(IWritable w) {
        if (w is WritableElement) {
            elements.AddRange(((WritableElement)w).Elements());
        }
    }
}

下面是一个解析字符串的示例,而不是使用文件流。要使用文件,请用StreamReader替换StringReader

代码语言:javascript
复制
    string html = "<html><head><title>Test Document</title></head><body><p>This is a test. <strong>Bold <em>and italic</em></strong></p><ol><li>Dog</li><li>Cat</li></ol></body></html>";
    //Instantiate our handler
    var mh = new SampleHandler();
    //Bind a reader to our text
    using (TextReader sr = new StringReader(html)) {
        //Parse
        XMLWorkerHelper.GetInstance().ParseXHtml(mh, sr);
    }

    //Loop through each element
    foreach (var element in mh.elements) {
        //Loop through each chunk in each element
        foreach (var chunk in element.Chunks) {
            //Do something
        }
    }
票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/15354005

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档