我制作了一个新闻采集器,它获取一个名为"Phoronix“的网站的RSS提要,并将其保存在一个文本文件中。但由于某种原因,它得到了第二篇最新的文章,而不是最新的文章。
代码如下:
import feedparser
import time
def Log():
f = open("Logs/phoronixdb.txt", "a")
f.write("\n")
f.write("\n" + entry.published)
f.write("\n")
f.write("\n" + entry.title)
f.write("\n")
f.write("\n" + entry.summary)
f.write("\n")
f.write("\n" + entry.link)
f.close()
def CheckDate():
f2 = open("db/phoronixlastdate.txt", "r")
date = f2.read()
if date == entry.published:
f2.close()
else:
Log()
f2.close()
f2 = open("db/phoronixlastdate.txt", "w")
f2.write(entry.published)
f2.close()
while True:
NewsFeed = feedparser.parse("https://www.phoronix.com/rss.php")
entry = NewsFeed.entries[1]
CheckDate()
time.sleep(5)发布于 2020-04-27 11:38:01
我的猜测是这个
entry = NewsFeed.entries[1]应该是
entry = NewsFeed.entries[0]这是因为我认为条目以数组的形式返回文章列表,其中起始索引(0)对应于第一篇文章,依此类推。
https://stackoverflow.com/questions/61450993
复制相似问题