我正在建设一个涉及自然语言处理的项目,因为nlp模块目前只处理英文文本,所以我必须确保用户提交的内容(不长,只有几个单词)是英文的。有没有既定的方法来实现这一点?最好使用Python或Javascript方式。
发布于 2008-10-13 07:47:58
如果内容足够长,我会建议在字母上添加一些frequency analysis。
但对于一些单词,我认为最好的办法是将它们与英语词典进行比较,如果其中一半匹配,则接受输入。
发布于 2008-10-13 08:05:27
检查Language Recognition Chart
发布于 2008-10-13 07:58:58
我认为最有效的方法是让用户只提交英文文本:)
您可以在文本区域上显示语言选择下拉列表,选项为英语/其他。当用户选择"Other“时,禁用文本区,并显示当前仅支持英语的消息。
https://stackoverflow.com/questions/196924
复制相似问题