我正在开发一个用于编程的智能辅导系统,在该系统中,导师用自然语言(英语)询问有关代码的问题和学生的答案。作为分析答案的一部分,我使用文本相似度。然而,这并没有告诉我答案有什么问题,也就是误解了一个概念。因此,我正在考虑使用ML来对响应进行分类,并识别任何误解。
我的问题是,在哪里可以找到包含编程任务(JAVA)的文本答案的数据集?
发布于 2020-02-03 18:18:44
您可以在Stack Overflow dataset中找到大量的JAVA问题/答案。
以下是用于下载数据和使用BigQuery API https://www.kaggle.com/stackoverflow/stackoverflow进行查询的链接
对tag JAVA进行过滤,你就可以很好地分析、探索你的数据,并对其进行一些自然语言处理。
https://stackoverflow.com/questions/60034218
复制相似问题