我想学习编码,文字和文字的基础。理解这些对于处理大量文本非常重要,无论是日志文件还是用于构建集体智能算法的文本源。我目前的知识是相当基础的:“只要我使用UTF-8,我就没事了。”
我并不是说我需要马上学习高级课程。但我需要知道:
我还需要了解数学和语料库语言学。当前和未来的web (语义、智能、实时web)都需要对大文本进行处理、解析和分析.
我在找一些资源(也许是书?)让我从一些子弹开始。(我在这里发现了关于堆栈溢出的正则表达式的许多有用的讨论。因此,您不需要建议有关该主题的资源。)。
发布于 2010-05-01 03:08:40
发布于 2010-05-01 02:56:28
与大多数一般的“我想学习X主题”问题一样,维基百科是一个很好的起点:
编码
正在处理中
https://stackoverflow.com/questions/2748701
复制相似问题