我正在写一个‘聊天机器人’,它通过读取真实人类聊天的集合来工作,并根据分析人类输入的最可能的答案来响应输入,但我需要大量的真实聊天来进行分析。
我的个人聊天记录是不够的,因为我需要更多的数据来进行概率分析
有没有以任何形式向公众开放的真实生活聊天的公共来源?
或者,如果你不介意的话,你可以捐出自己的私人聊天记录?为了科学去做吧!
谢谢
注意:我在开放聊天室中发现了很多数据,人们使用公共聊天室只是为了写一些随意的东西
发布于 2013-02-26 14:59:04
你可以找到相当多的谷歌聊天日志here,如果你想要更多使用谷歌的力量,我在FalconBot dork中找到的"ai bot chat logs filetype:txt“;)
发布于 2013-02-22 05:40:27
试着找到从公共论坛收集信息的方法。这让你不仅可以根据你使用的论坛类型来控制输入类型,还可以与各种各样的贡献者进行非常现实的、未经过滤的/未经审查的人类对话。Reddit可能会很有趣,但也会提供一些“有趣”的数据。
如果你有一个facebook或者是facebook的朋友。看看他们是否愿意让你从公众对帖子的评论中收集数据。这也可以从看似简短和琐碎的对话中提供数据。
发布于 2013-02-20 16:17:13
我可以帮你。当然,拉斐尔,首先看看沃利斯博士在AIMLbot上的出色工作。找到AAA列表。下一步,转到pandorabots。你需要的很多东西都在那里。那就看看Verbot吧。深入挖掘,但他们也有一些好东西。霍尔很奇怪,他的答案是基于用户推荐的输出。如果我能提供更多的帮助,请联系我。
https://stackoverflow.com/questions/14865906
复制相似问题