我需要指导如何计算几个术语的 GoogleShare .
例如,以以下基本术语为例:
如果我们再加上第二个任期:
因此,汤姆克鲁斯和山达基的GoogleShare为(784000 * 100 / 12000000) = 6.53%,而约翰特拉沃尔塔和山达基的GoogleShare为(331000 * 100 / 4900000) = 6.76%。
现在,如果我们在查询中添加第三个术语:
现在我应该如何计算GoogleShare百分比?
// Tom Cruise
100 * 100 / 784000 = 0.01% // StackOverflow / Scientology
// or...
100 * 100 / 12000000 = 0.00083% // StackOverflow / Tom Cruise
// John Travolta
181 * 100 / 331000 = 0.05% // StackOverflow / Scientology
// or...
181 * 100 / 4900000 = 0.00369% // StackOverflow / John Travolta约翰·特拉沃尔塔( John )似乎比汤姆·克鲁斯( community )在SO社区中要多5倍。
,计算N项的GoogleShare的正确方法是什么?
发布于 2010-01-02 13:57:57
那得看情况。首先,让我们为GoogleShare是什么打下一点基础。
考虑一下你的搜索
"Tom Cruise" + "Scientology"
"John Travolta" + "Scientology"在这里计算GoogleShare时,计算的是对同时包含"Tom Cruise"的"Scientology"的搜索百分比,以及对同时包含"John Travolta"的"Scientology"搜索的百分比。因此,计算它的方法如下:
Google search for "Scientology": 4,730,000 hits与之相比:
Google search for "Tom Cruise" and "Scientology": 825,000 hits
Google search for "John Travolta" and "Scientology": 340,000 hits因此,"Tom Cruise" GoogleShare of "Scientology"为17.44%。"John Travolta" GoogleShare of "Scientology"为7.18%。我们认为相对于"Tom Cruise"而言,"Scientology"比"John Travolta"与"Scientology"更有关联。因此,我注意到,您对GoogleShare of "Tom Cruise"和GoogleShare of "John Travolta" in "Scientology"的初始计算是不正确的。关键是找出您的基本搜索是什么(这里是"Scientology"),以及您想知道它们在这个空间中的份额是什么(这里是"Tom Cruise"还是"John Travolta")。
现在考虑一下搜索
"Scientology" + "Tom Cruise" + keyword和
"Scientology" + "John Travolta" + keyword.有两种方法来看待这个问题。您是在( "Tom Cruise" + keyword)空间内度量"Tom Cruise"和keyword的份额,还是在"Scientology"空间中度量"Tom Cruise"+keyword的份额?这些是不一样的。
Google search for "Scientology" + "StackOverflow": 34,300
Google search for "Tom Cruise" and "Scientology" and "StackOverflow": 1,360
Google search for "John Travotla" and "Scientology" and "StackOverflow": 1,660如果您想在( "Tom Cruise" + "StackOverflow")空间内获得"John Travolta"和"Scientology"的份额,则计算如下:
"Tom Cruise": 1360 / 34300 = 3.97%
"John Travolta": 1660 / 34300 = 4.84%如果您想要在"Tom Cruise" + "StackOverflow"和"John Travolta" + "StackOverflow"空间中的"Scientology"空间中的份额,您将计算:
"Tom Cruise" + "StackOverflow": 1360 / 4730000 = .0029%
"John Travolta" + "StackOverflow" : 1660 / 4730000 = .0035%你看,这完全取决于你的基本搜索是什么,以及你试图找到他们在这个基本术语中的份额是什么条件。在第一个版本中,我们的基本搜索是"Scientology" + "StackOverflow",我们正在查看"Tom Cruise"和"John Travolta"对这个空间的共享。在第二个版本中,我们的基本搜索是"Scientology",我们正在查看"Tom Cruise" + "StackOverflow"和"John Travolta" + "StackOverflow"在这个空间中的共享。
发布于 2010-01-02 13:59:30
我看不出N项和2项的区别。每当您有超过一个术语时,您就隐式地获取了一个GoogleShare 关于的一些初始搜索项。对于任何N >= 2,对于窄查询的每个子集都有多个GoogleShares。
你说“汤姆克鲁斯和山达基的GoogleShare”是6.53%,但这有点误导,因为“和”一词倾向于暗示某种对称性,你可以在不改变含义的情况下转换“汤姆克鲁斯”和“山达基”。事实并非如此,因为你最初的任期是“汤姆克鲁斯”。
也许对你计算的分数的一个更好的描述是:“汤姆克鲁斯有‘山达基’GoogleShare为6.53%。”这消除了所有的模棱两可之处,因为现在我们知道“汤姆·克鲁斯”一词出现在“山达基”一词的6.53%的时间里,而不是相反的(即6.53%的山达基派结果提到汤姆·克鲁斯)。
当你这样想的时候,对N项的相应的推广就会消失。只需在“has/has”前面加上您想要的任何初始术语,然后再添加您喜欢的其他缩略语即可。根据你给出的数字,你可以说"John的山达基参考文献的堆栈溢出GoogleShare为0.05%“,或者"John有一个山达基+ Stack溢出GoogleShare为0.00369%”。选择哪一种方式在上下文中更能提供信息。
发布于 2010-01-02 13:58:42
这要看你在找什么了。第一个数字是衡量Stack溢出在显示Tom Cruise和山达基的所有结果中所占比例的一种度量,第二是衡量Stack溢出和山达基被提到的频率,它们在显示Tom Cruise的所有结果中所占比例。
https://stackoverflow.com/questions/1991586
复制相似问题