首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >提取特定标题下的文本或仅提取listItems

提取特定标题下的文本或仅提取listItems
EN

Stack Overflow用户
提问于 2021-01-04 12:24:42
回答 2查看 100关注 0票数 0

我需要在一个特定的标题下提取文本。

word文档示例:

烘焙 Lorem ipsum dolor坐好了,敬请光临。[医]伊尼昂科莫多韧带;埃尼安·马萨。同时社会是自然的,不是分娩的,而是母体。多内克·夸姆·费利斯, 列表项目

  1. 列表项目
  2. 列表项目
  3. 列表项目

另一个标题

这是我不需要提取的文本。

因此,需要提取标题“afbakening”下的文本。

如果有人知道如何仅将列表项提取为该特定标题下的字符串,则会更好。

EN

回答 2

Stack Overflow用户

发布于 2021-01-04 13:35:33

我建议你在网上搜索它是如何工作的,当你处理文本和字符串时,有很多方法可以做到这一点。明确地坚持您的确切需要,您实际上可以简单地搜索"Afbakening“的标题,并将一个变量设置为文本的最大长度(即另一个文本的确切位置,或您希望它的确切位置),然后搜索您发现X+ ". List item”(为X‘an int)的任何实例,并将该列表项存储在适合您需要的变量中。有很多可能性,但由于问题中没有明确的用途或目的,所以这个答案和问题一样含糊不清。尽管如此,我还是建议您尝试一些技术,甚至字符串的Substring函数也会有所帮助。

票数 0
EN

Stack Overflow用户

发布于 2021-01-05 09:11:59

在这种情况下,可以使用DocumentVisitor从文档中提取内容。例如,请参见以下代码:

代码语言:javascript
复制
Document doc = new Document(@"C:\temp\in.docx");
MyVisitor visitor = new MyVisitor();
doc.Accept(visitor);
代码语言:javascript
复制
private class MyVisitor : DocumentVisitor
{
    public override VisitorAction VisitParagraphStart(Paragraph paragraph)
    {
        // Detect heading paragraph. Heading 1 style is used for demonstration purposes.
        if (paragraph.ParagraphFormat.StyleIdentifier == StyleIdentifier.Heading1)
        {
            Console.WriteLine("Heading Started: {0}", paragraph.ToString(SaveFormat.Text).Trim());
        }

        // Detect list items.
        if (paragraph.IsListItem)
        {
            Console.WriteLine("\t{0}", paragraph.ToString(SaveFormat.Text).Trim());
        }

        return VisitorAction.Continue;
    }
}
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/65562708

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档