首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >将包含单曲的Pandas字符串列转换为ascii以加载urls

将包含单曲的Pandas字符串列转换为ascii以加载urls
EN

Stack Overflow用户
提问于 2018-06-13 12:43:29
回答 1查看 486关注 0票数 0

我有一个熊猫DataFrame,包含一个包含维基百科网址的专栏,我想要加载。但是,有些字符串不会加载,因为它们包含独角兽。例如,'Kruskal %E2%80%93Wallis_one-way_analysis_of_variance‘引发以下内容

代码语言:javascript
复制
PageError: Page id "Cauchy%E2%80%93Schwarz_inequality" does not match any      pages. Try another id!

有没有办法把所有的独角兽都变成ascii?因此,在本例中,我需要一个可以创建新列的函数:

代码语言:javascript
复制
old column                            new column
Cauchy%E2%80%93Schwarz_inequality     Cauchy–Schwarz_inequality
Markov%27s_inequality                 Markov's_inequality
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-06-13 12:52:36

urllib.parse.unquote应该能做到这一点。希望这能有所帮助。

代码语言:javascript
复制
In [1]: import urllib
   ...: 
   ...: import pandas as pd
   ...: 
   ...: 
   ...: df = pd.DataFrame({'url': ['Markov%27s_inequality', 'Cauchy%E2%80%93Schwarz_inequality']})
   ...: df['clean_url'] = df['url'].apply(urllib.parse.unquote)
   ...: 

In [2]: df
Out[2]: 
                                 url                  clean_url
0              Markov%27s_inequality        Markov's_inequality
1  Cauchy%E2%80%93Schwarz_inequality  Cauchy–Schwarz_inequality
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50837619

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档