我有以下描述,我想使用我的程序废品。
<hr>为AFROTC学员提供多达13个选项,通过接触美国空军的职能、部署和就业操作,进行实用的领导和专门培训。外语和文化沉浸也是可以的/可能的,但总体上仍然强调领导力、发展和实践。所有项目都是在选定的空军基地和美国国内外的其他地点进行的。<br>
我有以下代码:
findDescription = re.findall('<hr>(.*?)(?:<strong>|<br>)', coursePage)我得到了以下输出:
‘通过接触美国空军的职能、部署和就业操作,为AFROTC学员提供最多13个实际领导力和专门培训的选项。\xc2\xa0也可以/可能进行外语和文化沉浸,但总体上仍然强调领导力发展和实践。\xc2\xa0所有项目都在选定的空军基地和美国及国外的其他地点进行。\xc2\xa0
哪里出了问题?
我很感谢任何快速的提示。我只是在周五才听说了regex,我已经取得了巨大的进步,但这一次真的让我被绊倒了几个小时。
热烈的问候,GeekyOmega
发布于 2013-02-04 05:18:55
\xC2\xA0是unicode字符0xA0的UTF-8编码,它在html文件中通常写为“。
https://stackoverflow.com/questions/14677397
复制相似问题