我正在尝试自动调整我的模型分类器的超参数。目前,分类器会给出给定单词的概率,无论它是不是食物。例如,
au_jus,0.987698
xiao_long_bao,0.9999957701
masago,0.9999957472
andouille_sausage,0.9999957196
-chicken,0.9999956648
broccoli_carrots,0.9999956072
sora,0.9999955529我需要从单词列表中找出误报。而不是手动地遍历每个单词并检查。我想知道,我是否可以在维基百科上查询这个词,并检查元数据。如果它列在“食品”类别下。那么可能我的分类器做得很好。否则,这是一个假阳性。其主要思想是将该过程自动化。
我最初认为维基百科是这方面的一个来源。欢迎任何其他替代方案/方法。我不介意发布代码,但它似乎与我目前的问题无关。因此,我不会张贴它。
发布于 2015-03-21 15:59:30
另一种选择是查询DBPedia而不是维基百科。正如其网站所说,DBPedia“是一个从维基百科中提取结构化信息并在网络上提供这些信息的众包社区”。例如,您可以使用SPARQL轻松地查询数据库,以收集“食物”类型的所有项。自动查询构建器显示some of the output of that query。
https://stackoverflow.com/questions/29159617
复制相似问题