我想从CSV文件中删除一些信息,但是我遇到了一些问题。
下面是我的CSV文件信息。

我用re.sub删除了一些信息,但是我会删除错误的内容。
下面的代码是我的示例:
new_html_code = re.sub('" target="_blank">.*</a>', " ", new_html_code)
我只想删除以下HTML代码:
" target="_blank"><img src="https://upload.cc/i1/2020/02/20/g7no03.jpeg" alt="https://upload.cc/i1/2020/02/20/g7no03.jpeg" data-src="https://upload.cc/i1/2020/02/20/g7no03.jpeg" onload="DrawImage(this)" width="300" height="617"></a>但是,我的代码将删除更多信息。它将删除以下内容中的更多信息:
" target="_blank"><img src="https://upload.cc/i1/2020/02/20/g7no03.jpeg" alt="https://upload.cc/i1/2020/02/20/g7no03.jpeg" data-src="https://upload.cc/i1/2020/02/20/g7no03.jpeg" onload="DrawImage(this)" width="300" height="617"></a><br><br>之前大家落咗名嘅口罩訂購-Waiting List:<br><a href="https://docs.google.com/forms/d/1gu33q5_XO3PqhwRm7rGLQrwNuScfDlvPvCCHRd81Fdk" target="_blank">https://docs.google.com/forms/d/1gu33q5_XO3PqhwRm7rGLQrwNuScfDlvPvCCHRd81Fdk</a><br><br>無收到PM訂口罩都可以訂搓手液, 要填呢張form<br><a href="https://forms.gle/YmQewsz1z689QtKx7" target="_blank">https://forms.gle/YmQewsz1z689QtKx7</a>我在每个领域都有很多</a>。我知道我的代码正在检测最后一个</a>。我想让它检测第一个</a>,而不是最后一个</a>。
发布于 2020-05-09 12:07:57
加一个?将解决你的问题,使你的regex不贪婪。但它会检测到所有的模式,在你的例子中,有3种。
尝试一下这样的方法:" target="_blank">.*?</a>
new_html_code = re.sub('" target="_blank">.*</a>', " ", new_html_code)
new_html_code = re.sub('" target="_blank">.*?</a>', " ", new_html_code ,1)参数1只替换第一项。
https://stackoverflow.com/questions/61696222
复制相似问题