我在做一项研究。受访者进行调查,并被要求:
( 1)假设他们在购买一种产品(例如手机)时,在购买前收集信息(例如广告)的重要性在0-10级(第3级),他们被问到产品的具体特征导致他们按照他们所做的那样对营销信息进行评级。
一个样本回答如下: 1)重要性评级:8
2)“市场营销很重要,因为它突出了--许多产品替代的不同之处。手机是复杂的产品,我们无法收集和吸收所有可供选择的信息。此外,手机技术总是Advanced,这使这个问题更加严重。”
可以从这个单一的响应中手动提取的产品特性:产品复杂性、多种产品选择、产品技术进步的速度。
对13种其他产品进行了同样的调查,并对市场信息以外的3种其他信息来源进行了调查(共4种)。200名答复者。
目标:开发一个产品特性列表,以确定4个源信息的重要性。
问题:在R或Python中,我可以用什么定量方法从我的定性反应中提取出这个列表?
这对我来说是很重要的研究,我非常感谢你的建议。
发布于 2016-10-26 01:20:16
让我重新表述一下你想问的问题(希望我的猜测是正确的),从更广泛的意义上讲。例如,您有在线评论,并且希望对不同产品的各个方面进行建模。这是一个有趣的领域,研究人员正在研究,它的正式名称是方面-情感建模。有时人们将其命名为隐藏的主题建模或意见挖掘。我以前很少见过提出层次方面情感模型的工作。请看一下这个纸。
您也可以查看一些无监督方法。既然你想学习人们正在谈论的一套具体的特征,你可以把它们当作隐藏的话题。探索这个纸以获得更好的理解。你也可以将问题建模为情绪分析。有很多以前的工作,但仍然有人在工作。
python和R实现:我不是R方面的专家,所以我只是谈论Python。对于python中的主题建模,您可以按照这编写。对于情感分析,python中最好的东西是NLTK。这个GitHub存储库将为您介绍一组非常好的示例。你也会看到与意见挖掘相关的东西。请注意,这是一组非常好的示例,应该可以帮助您构建一个好的模型,为您的目标服务。最后,让我给出一些GitHub存储库的链接,这些链接可能有助于您更严格地理解这个问题域。
例子:(1) Yelp总结采矿器 (2) 联合方面与情感建模 (3) 共同建模方面,评级和情感 (4) 意见短语提取
发布于 2016-10-26 08:19:54
如果每个源的重要性等级已经从响应中获得,则只需要提取产品特性。然后,您可以确定每个产品的特性,它与一个评分的关系。
数据的大小似乎太小,不能用于像主题建模这样的方法。这样,您就可以在大量的同类产品评论集上培训主题模型。有一些这样的收藏,例如,参见此页上的链接(亚马逊语料库特别包含对各种电子产品的评论)。对于Python中的主题建模,可以使用gensim (教程)或科学知识-学习 (示例)。希望,大多数主题将与产品特性相对应。然后,您可以使用在更大的集合上进行培训的主题模型,在每个评论中分配主题。
如果您没有足够多的相关评论集合,可以使用描述的这里库从您的评论中提取关键短语。他们不会被安排成“主题”,所以你会在你的分析中使用实际的关键短语。
一旦您有了主题或关键短语,您就可以找到,例如,与每个主题或关键短语相关联的平均重要性等级。
https://stackoverflow.com/questions/40251623
复制相似问题