我想开始使用Python中的AI工具。我看过一些项目,但我发现他们的例子令我望而生畏,因为我的经验有限等。例如,我想构建一种方法来比较两个html表,并构建一些东西,允许我确定这些表是否描述了相同的概念。现在,我正在使用蛮力方法来做这件事,例如,我有一组特定类型的已知表。我找到并提取所有行标签,并创建一组唯一的行标签。然后,我选择一个新表,并将新表中的行标签与集合中的行标签进行比较,如果行标签的交集足够大,则将其声明为该特定类型的表。
然而,我的阅读表明我应该能够做一些不那么机械和更巧妙的事情,但我正在为如何开始而苦苦挣扎。
谁能给我指出一些资源的方向,这些资源有可访问的例子,其中AI工具用于解决特定的问题。例如,假设我在文档中遇到一个表,我想看看这个表是否是我已经标识的几种类型的表之一。如何先传递样本表,再传递候选表进行检查。如何指定应该考虑的表的属性?
当我查看AI资源的文档和示例时,我发现它们太笼统了,我甚至不知道如何开始。
我在阅读了FAQ后添加了上面的内容,我认为这是一个很好的问题。我不想让某人在我的样例表中编写pyBrain来读取,我想找出其他人使用过它或类似的情况,这样我就可以研究他们的代码。
谢谢
我正在编辑这个在它关闭之后。Q上的流量似乎是相关的。NLTK是一个很好的起点。我从iTunes上得到了这本书的软拷贝,因为我发现这本书将是一个很好的资源。如果你需要在买书之前先扫描一遍,整个过程都是在线的NLTK Book,但是如果你觉得这本书有用,就买它吧。
发布于 2012-09-28 06:04:27
David Robinson建议使用朴素贝叶斯分类器来解决您的问题。这是一个很好的建议。查看nltk.classify模块,了解NB分类器和其他实现。
https://stackoverflow.com/questions/12629725
复制相似问题