我想去掉孟加拉文本的单词云,但在打印时,每个单词的辅音都是单独打印的。
data = pd.read_csv('/content/gdrive/MyDrive/data.csv',encoding='UTF-8')
refined_sentence = " ".join(data)
regex = r"[\u0980-\u09FF]+"
wc = WordCloud(width=800, height=400, mode="RGBA",background_color=None, colormap="hsv",
stopwords = stopwords, font_path="kalpurush.ttf", regexp=regex).generate(refined_sentence)
plt.figure(figsize=(7, 7))
plt.imshow(wc, interpolation='none')
plt.axis("off")
plt.show()发布于 2021-10-14 19:03:10
我关注了this comment,最终可以在Ubuntu中解决这个问题。
第1步:!sudo apt-get install libfreettype6-dev libharfbuzz-dev libfribidi dev gtk-doc-tools
步骤2:!wget -O raqm-0.7.0.tar.gz https://raw.githubusercontent.com/python-pillow/pillow-depends/master/raqm-0.7.0.tar.gz
现在,raqm-0.7.0.tar.gz文件应该位于下载部分。
步骤3:!tar -xzvf raqm-0.7.0.tar.gz
步骤4:!cd raqm-0.7.0
配置步骤5前缀:!./--=/usr && make -j4 && sudo make -j4 install
Step 6:现在你只需要重新安装枕头库。激活正确的环境。然后运行以下命令:
python3 -m pip安装--升级pip python3 -m pip安装--升级枕头
就这样!现在,您有了一个可以正常工作的Pillow库,它可以在图像中生成适当的孟加拉和其他印度字体。
https://stackoverflow.com/questions/69280712
复制相似问题