现在我有一个看似简单但具有挑战性的任务,我需要开发一个数据集的问题集,我把这些问题分为两类:
。
现在,我需要知道雅虎的这两个类别的百分比!这样我就可以相应地维护我的数据集了,但是我不知道手动执行这个statistic.Doing的好方法似乎是不可能的,有人有主意吗?我会非常感激的,谢谢。
发布于 2010-09-20 09:33:38
你是说,认出一个和另一个?自动,没有任何分类从网站的结束?那可能是不可能的。
我认为你能做的最好的就是比较一些指标。“免费”问题可能会有更多的贡献和更多的文本;如果Y!答案有一个讨论系统的话,它们将被更多的讨论。“事实”问题可能以“什么是.”开头更多时候..。诸若此类。
也许取100个随机的问题,做一个手动检查,并写下百分比。
https://stackoverflow.com/questions/3750090
复制相似问题