在输入时,我有一个纯文本(在我的例子中通常是HTML)和一个“语法规范”(从纯文本中提取数据到结构化数据的某种方法),然后在输出时,我需要一些结构化数据(JSON可以,但也许有更好的东西?)
是否有用于此任务的库?什么是指定“语法规范”的好方法?解决这类问题的最佳方法是什么?
发布于 2012-01-06 00:35:38
基于语法的转换的一些工具:
添加:
发布于 2012-01-06 00:41:23
看一下用于HTML解析的jsoup和用于Java to JSON的gson。
发布于 2012-01-06 00:42:32
要解析HTML,您将需要一个DOM解析器,根据html代码的质量,DOM解析器可以使用您的语法规范来解析它,然后您将需要提供一种您想要的数据结构类型,并且有库可以为您完成这些工作
https://stackoverflow.com/questions/8745989
复制相似问题