我有一个歌曲的数据框架,它的歌手和歌词。有些歌曲的歌词不是英文的,但字母是拉丁字母。有没有办法将英语单词(在英语中有意义)和非英语单词(由拉丁字母书写,但没有英语含义)区分开来?有没有Python库或类似的代码?我的主要目标是根据歌词进行情感分析。
发布于 2020-06-21 04:57:28
在python中有一个称为langdetect的库来实现这一点。
下面是一个使用它的示例:
>>> from langdetect import detect
>>> detect("War doesn't show who's right, just who's left.")
'en'
>>> detect("Ein, zwei, drei, vier")
'de'https://stackoverflow.com/questions/62491540
复制相似问题