首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >文字分类算法正反

文字分类算法正反
EN

Stack Overflow用户
提问于 2016-04-18 07:04:26
回答 1查看 150关注 0票数 3

至于大学项目,我需要构建一个软件,给出一些关于虚拟建筑网站的评论,来检测它的实际状态(just startedin constructionterminated)。

例如,考虑到以下评论:

  • “很高兴听到我们能走过英吉利海峡大桥”
  • 昨天我去了新建的桥,和我的朋友们一起去法国旅行
  • “他们刚刚完工,第五英里已经有裂缝了。真令人失望!”

该系统应检测到“英吉利海峡大桥”施工现场已经结束。

目前,我正在尝试选择用于此项目的单词分类算法。我在网上搜索,寻找使用的最佳分类算法。我读过关于SVC的文章,但是,由于我并不是这个领域的专家,所以我不确定SVC是否符合我的场景。

我想得到的不是我的问题的解决方案,而是一个可用算法的列表,以及它们的优缺点。

EN

回答 1

Stack Overflow用户

发布于 2016-04-18 15:45:45

你把你的问题描述得不正确,使人们很难给你一个正反两方面的清单。

您所描述的问题并不是真正的单词分类问题,因为您没有对单词进行分类。你想做的是:

  1. 建筑工程命名实体识别
  2. 根据提及上下文将每个命名实体划分为3种不同的类型。

算法不是真正的问题。大多数分类算法(线性回归、决策树、支持向量机等)会起作用的。

您实际遇到的问题(但基于您的问题并没有意识到)是,您没有找到名为实体的建设项目的培训数据,也没有将这些实体分类的培训数据。

我的建议是,您可以使用免费提供的NER工具包/库,在字典中添加与建设项目相关的功能(如桥梁、塔楼等)。看看你在第一部分的任务中能做得有多好。

更重要的考虑是:

  1. 你要花多少时间或多少钱才能得到带注释的数据?
  2. 你需要什么样的表演?
  3. 你愿意考虑哪种语言/库(IMHO最不重要的问题)

对不起,我意识到这可能不是你想听到的答案,但我怀疑这是你需要的答案。;)

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/36687365

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档