我需要在一个特定的标题下提取文本。
word文档示例:
烘焙 Lorem ipsum dolor坐好了,敬请光临。[医]伊尼昂科莫多韧带;埃尼安·马萨。同时社会是自然的,不是分娩的,而是母体。多内克·夸姆·费利斯, 列表项目
另一个标题
这是我不需要提取的文本。
因此,需要提取标题“afbakening”下的文本。
如果有人知道如何仅将列表项提取为该特定标题下的字符串,则会更好。
发布于 2021-01-04 13:35:33
我建议你在网上搜索它是如何工作的,当你处理文本和字符串时,有很多方法可以做到这一点。明确地坚持您的确切需要,您实际上可以简单地搜索"Afbakening“的标题,并将一个变量设置为文本的最大长度(即另一个文本的确切位置,或您希望它的确切位置),然后搜索您发现X+ ". List item”(为X‘an int)的任何实例,并将该列表项存储在适合您需要的变量中。有很多可能性,但由于问题中没有明确的用途或目的,所以这个答案和问题一样含糊不清。尽管如此,我还是建议您尝试一些技术,甚至字符串的Substring函数也会有所帮助。
发布于 2021-01-05 09:11:59
在这种情况下,可以使用DocumentVisitor从文档中提取内容。例如,请参见以下代码:
Document doc = new Document(@"C:\temp\in.docx");
MyVisitor visitor = new MyVisitor();
doc.Accept(visitor);private class MyVisitor : DocumentVisitor
{
public override VisitorAction VisitParagraphStart(Paragraph paragraph)
{
// Detect heading paragraph. Heading 1 style is used for demonstration purposes.
if (paragraph.ParagraphFormat.StyleIdentifier == StyleIdentifier.Heading1)
{
Console.WriteLine("Heading Started: {0}", paragraph.ToString(SaveFormat.Text).Trim());
}
// Detect list items.
if (paragraph.IsListItem)
{
Console.WriteLine("\t{0}", paragraph.ToString(SaveFormat.Text).Trim());
}
return VisitorAction.Continue;
}
}https://stackoverflow.com/questions/65562708
复制相似问题