文章/答案/技术大牛

发布

社区首页 >问答首页 >将包含单曲的Pandas字符串列转换为ascii以加载urls

问将包含单曲的Pandas字符串列转换为ascii以加载urls
EN

Stack Overflow用户

提问于 2018-06-13 12:43:29

回答 1查看 486关注 0票数 0

我有一个熊猫DataFrame，包含一个包含维基百科网址的专栏，我想要加载。但是，有些字符串不会加载，因为它们包含独角兽。例如，'Kruskal %E2%80%93Wallis_one-way_analysis_of_variance‘引发以下内容

PageError: Page id "Cauchy%E2%80%93Schwarz_inequality" does not match any      pages. Try another id!

有没有办法把所有的独角兽都变成ascii？因此，在本例中，我需要一个可以创建新列的函数：

old column                            new column
Cauchy%E2%80%93Schwarz_inequality     Cauchy–Schwarz_inequality
Markov%27s_inequality                 Markov's_inequality

python

pandas

wikipedia-api

python-unicode

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-06-13 12:52:36

urllib.parse.unquote应该能做到这一点。希望这能有所帮助。

In [1]: import urllib
   ...: 
   ...: import pandas as pd
   ...: 
   ...: 
   ...: df = pd.DataFrame({'url': ['Markov%27s_inequality', 'Cauchy%E2%80%93Schwarz_inequality']})
   ...: df['clean_url'] = df['url'].apply(urllib.parse.unquote)
   ...: 

In [2]: df
Out[2]: 
                                 url                  clean_url
0              Markov%27s_inequality        Markov's_inequality
1  Cauchy%E2%80%93Schwarz_inequality  Cauchy–Schwarz_inequality

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/50837619

复制

相似问题

问将包含单曲的Pandas字符串列转换为ascii以加载urls
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问将包含单曲的Pandas字符串列转换为ascii以加载urlsEN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问将包含单曲的Pandas字符串列转换为ascii以加载urls
EN