OpenCalais系统给我留下了深刻的印象。它是一个web服务,您在其中发送文本,它们分析它,然后为您提供一系列您的文档所属的分类(启用了RDF)标记。
但是--目前--英语是唯一受支持的语言。
您是否知道类似的处理多语言文档的系统?(我对意大利语感兴趣,但多语种当然更好)
发布于 2013-03-27 17:50:13
Apache Stanbol可以分析多种不同语言的文本。到目前为止,支持以下语言(精确度和召回值可能会因语言而异):
29
H122丹斯克(丹麦)、العربية(阿拉伯语)、
עברית(希伯来语)、
<日本語(瑞典语)、丹斯克(丹麦)、
العربية(阿拉伯语)、
עברית(希伯来语)、
分析将返回发现的实体。分析输出格式可以是:
JSON-LD、RDF/XML、RDF/JSON、海龟、JSON
可以根据系统配置进一步定制文本的实体或标记。理想情况下,任何自定义词汇表都可以插入系统中。
有几个演示端点:
http://dev.iks-project.eu:8080/enhancerhttp://dev.iks-project.eu:8081/enhancer
不确定上述端点是否支持上述所有语言。
RedLink GmbH将提供基于Apache Stanbol和相关软件的云服务。
WordPress的WordLift plugin已经在WordPress中为提供了文本分析所有上述语言的(目前处于测试阶段)。您可以尝试一下,在WordPress中安装插件并在帖子正文中提交文本内容。
您还可以针对特定请求或信息订阅和写入Apache Stanbol mailing list。
发布于 2010-05-27 20:46:00
OpenCalais支持实体的法语和西班牙语元数据标记。这组实体将在将来的版本中进行扩展。请访问http://www.opencalais.com/documentation/calais-web-service-api查看我们的在线文档
https://stackoverflow.com/questions/320117
复制相似问题