我运行这个程序基本上是为了获得我放入的一个网站的页面源代码。它将它保存到一个文件中,我想要的是它查找一个特定的字符串,基本上是@的电子邮件。然而,我不能让它工作。
import requests
import re
url = 'https://www.youtube.com/watch?v=GdKEdN66jUc&app=desktop'
data = requests.get(url)
# dump resulting text to file
with open("data6.txt", "w") as out_f:
out_f.write(data.text)
with open("data6.txt", "r") as f:
searchlines = f.readlines()
for i, line in enumerate(searchlines):
if "@" in line:
for l in searchlines[i:i+3]: print((l))发布于 2019-09-08 12:01:05
您可以使用正则表达式方法findall查找文本内容中的所有电子邮件地址,并使用file.read()代替file.readlines()。将所有内容放在一起,而不是拆分成单独的行。
例如:
import re
with open("data6.txt", "r") as file:
content = file.read()
emails = re.findall(r"[\w\.]+@[\w\.]+", content)可能会转换为一个集合,然后保存为您喜欢的文件。
https://stackoverflow.com/questions/57839072
复制相似问题