至于大学项目,我需要构建一个软件,给出一些关于虚拟建筑网站的评论,来检测它的实际状态(just started,in construction,terminated)。
例如,考虑到以下评论:
该系统应检测到“英吉利海峡大桥”施工现场已经结束。
目前,我正在尝试选择用于此项目的单词分类算法。我在网上搜索,寻找使用的最佳分类算法。我读过关于SVC的文章,但是,由于我并不是这个领域的专家,所以我不确定SVC是否符合我的场景。
我想得到的不是我的问题的解决方案,而是一个可用算法的列表,以及它们的优缺点。
发布于 2016-04-18 15:45:45
你把你的问题描述得不正确,使人们很难给你一个正反两方面的清单。
您所描述的问题并不是真正的单词分类问题,因为您没有对单词进行分类。你想做的是:
算法不是真正的问题。大多数分类算法(线性回归、决策树、支持向量机等)会起作用的。
您实际遇到的问题(但基于您的问题并没有意识到)是,您没有找到名为实体的建设项目的培训数据,也没有将这些实体分类的培训数据。
我的建议是,您可以使用免费提供的NER工具包/库,在字典中添加与建设项目相关的功能(如桥梁、塔楼等)。看看你在第一部分的任务中能做得有多好。
更重要的考虑是:
对不起,我意识到这可能不是你想听到的答案,但我怀疑这是你需要的答案。;)
https://stackoverflow.com/questions/36687365
复制相似问题