首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >拆分并仅保留存储在python dataframe列中的英文文本

拆分并仅保留存储在python dataframe列中的英文文本
EN

Stack Overflow用户
提问于 2020-07-28 11:50:57
回答 1查看 49关注 0票数 0

我有一个数据帧"app_final“,其中一列"text_content”包含多种语言的文本。我只想在那一栏中保留英文文本。你知道我该怎么做吗?

我尝试使用下面的python代码创建一个新列"english_text“,方法是通过langdetect运行每个文本中的每个单词,只将英语单词添加到新列中。但是,我得到了一个错误"LangDetectException: No features in text“。我还应该如何处理这个问题?

代码语言:javascript
复制
for i in range(0,len(app_final['text_content'])):
    for x in range(0,len(app_final['text_content'][i].split())):
        english=[]
        language=detect(app_final['text_content'][i].split()[x])
        eng_text=np.where(language=='en',app_final['text_content'][i].split()[x],np.NaN)
        english.append(eng_text)
    app_final['english_text']=english

这是我尝试仅提取英文文本的记录的一个示例:

print(app_final['text_content'][635])

线路のプッシュメッセージのセグメント配信が可能です。フィルターを使って、线路公式アカウントでメッセージ配信可能なセグメント以外の独自セグメントへのメッセージ配信可能になります。メッセージ配信先を絞ることで、线路公式アカウントのコストの節約も可能。线路で自由度の高いリッチメニューが作成できます。线路公式アカウント上に自由度の高いリッチメニューの作成が可能になります。LINEのデフォルトでは対応していない9分割·12分割などおすすめしたい商品·ウェブページへのリンクだけ大きく表示など変則的なデザインに対応。LINEトーク上でコレクションの内商品の一括表示が可能LINEトーク上に設定したコレクション情報の表示が可能になります。セール·おすすめなどの独自コレクションをユーザに一括でレコメンド可能です.线路公式アカウント経由の購買率アップ。ユーザーの属性にあわせた特別なリッチメニュー表示·プッシュメッセージ配信が可能KisukeはLINEを新たな販売チャネルとして活用できるECマネジメントサービスです.线路公式アカウントの友達をセグメント化してメッセージ配信が可能になります。また、自由度の高いリッチメニューの配信も可能になります。线路では配信できない区分けのリッチメニューの配信が可能です。

所有しているLINE公式アカウントを上手くマーケティングに活用できていないEC事業社様に最適な選択肢です.Kisukeの主な機能1.プッシュ通知(行メッセージ配信)购物との連携により、例えば“特定の商品を買い替えそうなタイミングの方”“注文途中でサイトから離脱したカゴ落ちユーザ”といった様々なセグメントのユーザに対してマッチしたメッセージを一斉配信することが可能になります。

2.リッチメニュー配信画像の配置パターンやリンクエリアのカスタマイズ機能があるKisukeを使えば、様々な画像配置を試すことができ、ボタンの設置等も可能となります。线路公式アカウントでは対応していないリッチメニューのパターンも配信可能です。例えばこんな使い方も…1.カゴ落ちユーザに期間限定割引クーポンを送信…メールで送るより短時間でメッセージが認識されるため、1時間限定クーポンも有効です。2.购买のフィルターと連携して、1か月前に消耗品を買ったユーザにリピート促進メッセージを送信して、リピート購入を進める。など細分化したユーザの需要に応じてメッセージ配信が可能になります。

ご質問、ご要望等お待ちしております。使い方、カスタマイズのご依頼など、お気軽にお問い合わせください。

Kisuke是一种EC管理服务,可以使用LINE作为新的销售渠道。线路公众号好友可以分段传递消息。此外,还可以分发具有高度自由度的丰富菜单。不能通过线路分发的丰富菜单可以分发。

这是没有使用他们的线公众号进行营销的EC公司的最佳选择。Kisuke的主要功能

推送通知(线路消息传递)通过与Shopify合作,可以将匹配的消息广播给各个细分市场的用户,例如“何时购买特定产品”或“在订购时退出网站的用户”。丰富的菜单交付与Kisuke,它具有图像布局模式和链接区域定制功能,您可以尝试各种图像布局和设置按钮。也可以分发线路公众号不支持的丰富菜单模式。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-07-28 12:10:46

由于您的文本被拆分为多个段落,因此您可以尝试使用Polyglot来检测其中一个段落是否为英语。https://polyglot.readthedocs.io/en/latest/Installation.html

由于您的日语文本中包含英语单词,因此您应该使用段落中最可能的语言。例如:

代码语言:javascript
复制
from polyglot.detect import Detector

text = u"""
2.リッチメニュー配信 画像の配置パターンやリンクエリアのカスタマイズ機能があるKisukeを使えば、様々な画像配置を試すことができ、ボタンの設置等も可能となります。LINE公式アカウントでは対応していないリッチメニューのパターンも配信可能です。 例えばこんな使い方も… 1.カゴ落ちユーザに期間限定割引クーポンを送信…メールで送るより短時間でメッセージが認識されるため、1時間限定クーポンも有効です。 2.Shopifyのフィルターと連携して、1か月前に消耗品を買ったユーザにリピート促進メッセージを送信して、リピート購入を進める。 など細分化したユーザの需要に応じてメッセージ配信が可能になります。
"""

if Detector(text).languages[0].name == 'Japanese':
    do nothing
elif Detector(text).languages[0].name == 'English':
    append into string

对每个段落重复此过程,然后将该单元格替换为仅保留英文段落的新单元格。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63126760

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档