Ines Montani
2015年初,spaCy首次发布。它是一个用于工业级自然语言处理的开源库,专注于生产环境的使用。
当前统计数据:
2016年末,一家专注于AI开发者工具的新公司成立。
当前统计数据:
2017年末,第一个商业产品发布。它是一个现代化的标注工具,完全可以用Python脚本控制。
当前统计数据:
即将发布:
失败令人沮丧。
这是一个困难的“先有鸡还是先有蛋”的问题。
你需要迭代你的代码和你的数据。
#1
我们正在构建一个基于新闻报道的犯罪数据库。我们想要标注以下内容:
#2
我们正在将金融新闻中关于公司销售的数据添加到我们的内部数据库,以便将其连接到我们的分析系统。我们需要提取:
(使用pytorch预测包含价格和股票代码的公司收购案例。没有结果。)
现实并非端到端的预测问题。
一条文本的处理流程可以包括:
#1
实用NLP的一大优点是:你可以选择让问题变得更简单,让解决方案成本更低。
#2
最有趣的问题通常非常具体,也需要特定的解决方案。这正是它们的价值所在。
#3
迁移学习意味着我们不再总是需要“大数据”。但我们仍然需要一些数据。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。