首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >聊天/对话数据库

聊天/对话数据库
EN

Stack Overflow用户
提问于 2016-02-17 00:02:11
回答 4查看 11.6K关注 0票数 2

出于个人兴趣,我试图定义一个基于他所学到的信息和互联网搜索的模拟人工智能,以便提供比系统所知更多的细节。

我举了一个孩子的例子,当他出生的时候,他需要学习所有的东西,他听到了很多东西,然后提出了一些答案。他的妈妈/爸爸告诉他答案是否合适。

为了做到这一点,我想在hadoop系统中存储大量的聊天对话,并对所有这些对话进行分析,以确定哪些是最常见的答案。有了这个,我想构建一个神经元数据库,其中包含带有确定答案的对话类型。

所以我的问题是,我可以在互联网上合法地找到一个或多个任何格式的聊天/对话数据库吗?(文件、数据库、csv ...)

我所拥有的最多的数据,我最好的机会是能够正确地确定答案;)

谢谢你的帮助和干杯,弗雷德里克

附言:英语不是我的母语

EN

回答 4

Stack Overflow用户

发布于 2016-04-30 05:29:03

There is a collection of conversational datasets。它们中的大多数都是从公开的来源收集的。对于您来说,最有趣的可能是Santa Barbara语料库(尽管它是语音对话的文字记录)或电影对话数据集。

票数 5
EN

Stack Overflow用户

发布于 2018-05-27 23:57:01

这里是一个相当全面的人-人和人机文本对话数据集,以及音频对话数据集。https://breakend.github.io/DialogDatasets/

票数 2
EN

Stack Overflow用户

发布于 2018-08-05 20:45:06

对于https://breakend.github.io/DialogDatasets/上广泛的人机、人机对话资源库,包括由芝加哥大学 https://github.com/DialRC/LetsGoDataset研究中心提供的让我们开始对话,这些资源也被用来训练https://any.company/的会话代理

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/35437278

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档