我有很多大型纯文本文档要用perl解析。每个文档中大部分都有英文段落,每个文档中都有几个纯文本标记的表格。
我已经创建了一个语法来描述表结构,但是不确定是使用Parse::RecDescent还是使用Regexp::Grammars来提取表。
我最初倾向于Parse::RecDescent,但我不确定在语法中如何处理我想要忽略的90%的文档文本,以便找到隐藏在每个文档中的几个表。
也许我需要Regexp::语法,这样我就可以在文档中“拉”出我的表达式,直到它找到匹配的表达式?
谢谢
发布于 2011-10-12 11:03:08
我想要的是Regexp::Grammars,因为它允许您从文档中提取语法,并像正则表达式一样查找匹配项。Parse::RecDescent似乎不适合扫描整个文档并只查找与语法匹配的文本。
https://stackoverflow.com/questions/7710893
复制相似问题