首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >NLTK协议与距离度量

NLTK协议与距离度量
EN

Stack Overflow用户
提问于 2015-09-23 07:28:09
回答 2查看 1.2K关注 0票数 4

我有一个任务要在注解协议中计算多标号分类,在每个示例中,可以分配多个标签。我发现NLTK可以基于距离度量来度量协议。

我正在寻找一个计算krippendorffα与MASI距离的例子。

这就是我所拥有的。

代码语言:javascript
复制
import nltk
from nltk.metrics import masi_distance


toy_data = [['1', 5723, [1,2]],['2', 5723, [2,3]]]

task = nltk.metrics.agreement.AnnotationTask(data=toy_data, distance=masi_distance)
print task.alpha()

此代码在

代码语言:javascript
复制
TypeError: unhashable type: 'list'

以下内容也不起作用:

代码语言:javascript
复制
toy_data = [['1', 5723, set([1,2])],['2', 5723, set([2,3])]]

你有一个有用的例子吗?谢谢!

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2016-08-10 15:28:37

更准确地说,需要冻结的东西(正如@alexis所指出的)只是三元组的第三个成员,这是分配给项目的标签。

代码语言:javascript
复制
toy_data = [['1', 5723, frozenset(1,2)],['2', 5723, frozenset(2,3)]]
票数 7
EN

Stack Overflow用户

发布于 2015-09-23 09:37:36

我认为数据应该是元组列表,而不是列表列表(元组是可理解的,列表不是),请尝试:

代码语言:javascript
复制
toy_data = [('1', 5723, (1,2)),('2', 5723, (2,3))]

(我制作了值元组,而不是列表,以防这也是一个问题)

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/32733510

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档