我可能对这件事有点不知所措,也许我问错了问题,但我来了。我希望建立一种习惯来形成AI,基本上它只做一次事情,然后根据结果确定它的优先级,以便以后再做一次或避免以后。我的主要问题是我不确定如何存储动作。有没有什么好的,基础的,学习人工智能的或者构建人工智能的指南?我使用python来做这件事,但我只是在寻找基础知识,这样我就可以理解他们在做什么。
发布于 2013-03-01 05:46:47
你所说的“习惯形成人工智能”的传统术语是“强化学习”,其中状态和动作的估计值是通过经验改进的。Q-learning和SARSA就是典型的例子。搜索这些,你应该会找到大量的书籍,例子,教程,代码示例等。
https://stackoverflow.com/questions/15145765
复制相似问题