我试着用德语和西班牙语处理文本。英语文本的工作是直接的,因为有无数的NLP包在这种语言上。但这对其他语言来说并不容易。我找到了一些德语文本的包裹,但我不知道哪个更准确。此外,考虑到西班牙语文本中有一些特殊的字符,很难找到西班牙语文本的NLP包。我需要对文本做的一些步骤是:分句、标记、Pos标记和词干。换句话说,我正在寻找在Java中这两种语言中的一种或两种语言都能工作的东西。
请提供有关这一主题的任何信息。
https://stackoverflow.com/questions/49251361
复制相似问题