我想在一个openEdX论坛上收集所有的信息进行定量分析。最常用的专业词汇是什么,等等。但是如何下载/挖掘一个openEdX论坛?
发布于 2017-07-25 23:59:33
我想您有权访问开放式edX平台吧?您需要从所有线程和所有消息中提取文本。与论坛交互的库在lms.lib.comment_client中。例如,要获取特定课程的所有线程,请执行:
lms.lib.comment_client.Thread.search({
'course_id': course_id,
})对于每个线程,您必须迭代注释并提取它们的正文,最后提取它们的标题。我相信您可以使用thread.to_dict()方法从线程获取注释。
https://stackoverflow.com/questions/44920196
复制相似问题