首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在没有RSS的地方获取RSS

在没有RSS的地方获取RSS
EN

Stack Overflow用户
提问于 2010-09-21 04:08:50
回答 2查看 126关注 0票数 0

抱歉,标题太长了,也许我们来的时候混淆了一半。我正在征求关于如何从默认没有启用RSS的页面获取RSS提要的建议或指导。但这并不是问题本身。问题是当我在页面上被要求输入用户名和密码时。如果不是这样的话.

问题:

获取没有启用RSS提要的论坛的RSS,并查看我们需要被记录的“新闻”。

想到的可能的解决方案

  1. 有几个网站提供英语服务,以便在不存在的页面上获取RSS。这很好,但问题是,当这些网站不提供用户名和密码登录到我想要获取信息的网页时,这些类型的网站就被排除在外。
  2. 我没有通过url登录,所以将该url放在上面列出的网站上(第1项),直接从url规范中获得用户名和密码变量:www.forosinrss/login.php?usuario = me & password = your pff和我被弹出了论坛,告诉我我不会得到正确的数据。另一个问题是密码是md5加密的,所以我无法登录到URL (fk T_T)。
  3. 尝试使用"SELECT * from DB“,或者换句话说,使用YQL。但是它的出现几乎和他们发现的一样多,他们没有办法插入和登录用户和密码,也没有办法为论坛生成一个曲奇,我投了一票。

我需要建议、建议、建议或抱怨。

EN

回答 2

Stack Overflow用户

发布于 2010-09-21 04:26:41

如果您觉得勇敢,可以使用cURL或fsockopen之类的工具下载页面,然后使用XSLT将页面从html转换为rss。

票数 0
EN

Stack Overflow用户

发布于 2010-09-21 04:47:16

很久以前,我用PHP编写了一个应用程序,用ok-ish结果来完成这个任务:

  • 使用curl获取页面,并保持副本
  • 运行自定义筛选器正则表达式来选择实际重要的页面位(有些站点在超时后具有动态文本(如ads或仅显示当前日期和时间)
  • ,使用curl再次获取页面,并在其上运行相同的过滤器--
  • 运行diff old_page、new_page并将结果导入rss模板

f 29

该系统运行良好,但仔细过滤到内容,我想得到的提要,它打破了很多,因为这类网站经常手工编辑,所以你不能保证任何一致性。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/3757241

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档