特别是,我希望能够提取人物、地点、电影、音乐等实体,并在广泛使用的链接数据ID(如DBpedia、Freebase或OpenCyc )中提供这些实体。
发布于 2011-01-10 06:04:34
Extractiv是一种类似的服务,它将80legs的网络爬虫与Language Computer Corporation的自然语言处理相结合。该服务目前提供超过150种实体类型,例如您列出的实体类型,以及links them to DBpedia。
虽然还没有作为web服务部署到Extractiv,但LCC的CiceroLite命名实体标记器同时支持中文和日文。这可以作为独立的应用程序购买。另一家这样的公司是Basis Technology,尽管我不知道这些实体是否有联系。
https://stackoverflow.com/questions/4477791
复制相似问题