是否有任何可用的工具/库(最好是成熟的/可靠的商业产品或开源产品)可以从纯文本中提取结构化数据?通常,纯文本包含布尔或数学操作数,如(AND、OR、BETWEEN等)。
我喜欢AWS Comprehend,但我不确定它是否可以轻松地用于这项任务。
vehicle with 2 to 5 wheels
=>
SUBJECT: vehicle
EXPRESSION:
SUBJECT: wheels
OPERAND: BETWEEN
NUMBER: 2
NUMBER: 5发布于 2020-04-16 01:48:17
Comprehend不支持将文本原生转换为结构化格式。但是,您可以使用Syntax API派生词性,并从中创建基于规则的结构。
https://docs.aws.amazon.com/comprehend/latest/dg/how-syntax.html
在上面的例子中,"vehicle“和”车轮“将被检测为名词,"2”和"5“将被检测为数字/值,"to”和"with“将被检测为介词。
https://stackoverflow.com/questions/60563235
复制相似问题