首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用TextBlob翻译pandas列

用TextBlob翻译pandas列
EN

Stack Overflow用户
提问于 2015-11-13 19:21:24
回答 1查看 4K关注 0票数 2

我正在尝试用Python (2.7.10Mac OS X Yosemite)的TextBlob包来阅读csv并将其中一篇用法语写成的专栏翻译成英语。

然而,Python向我抛出了以下错误消息:

代码语言:javascript
复制
AttributeError: 'Series' object has no attribute 'translate'

我的Python代码:

代码语言:javascript
复制
import pandas as pd
import numpy as np
from textblob import TextBlob

df = pd.read_csv('france_content.csv')
df2 = df[['HEADLINE', 'AUTHOR', 'CONTENT']]

TextBlob = df2['CONTENT'].str.strip()
TextBlob.translate(to="es")

转念一想,我真的觉得这里不需要numpy。但是如何让pandas读取内容字段并让textblob将其翻译成英语呢?最好将其放在名为'English‘的列中

编辑:更改为:

代码语言:javascript
复制
import pandas as pd
import numpy as np
from textblob import TextBlob

df = pd.read_csv('france_content.csv')

df['English'] = df['CONTENT'].str.encode('ascii', 'ignore').apply(lambda x:    TextBlob(x.strip()).translate(to='en'))

数据是非常基本的,在第一列作者姓名和第二列(‘内容’)的法语文本。

我仍然有以下错误:

代码语言:javascript
复制
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 9: ordinal not in range(128)
EN

回答 1

Stack Overflow用户

发布于 2016-04-25 13:51:57

代码语言:javascript
复制
import pandas as pd
from textblob import TextBlob
df = pd.read_csv('d:\lan.csv') # path to csv file

在dataframe中添加包含已转换单词的英语列

代码语言:javascript
复制
df['english'] = df['structure'].str.encode('ascii', 'ignore').apply(lambda x:TextBlob(x.strip()).translate(to='en'))
df.to_csv("cool.csv")# your documents folder

这是按照要求工作的。

谢谢

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/33691590

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档