我终于有一秒钟的时间来研究流、守护进程、cron任务以及围绕它们构建的所有整洁的gem!但我不清楚如何/何时使用这些东西。
我有几个问题:
1)如果我想要一个不断更新的网站,实时更新我的Facebook好友的活动提要,我最喜欢的书上的最新亚马逊书评,以及我的Twitter提要,我是否只需要使用Daemon gem、用于流式传输内容的ruby-yali gem和and gem创建一些自定义的流式传输实现,它可以每3-10秒检查一次这些站点,看看我正在寻找的内容是否发生了变化?这是它的工作方式吗?或者它是典型的/最好是不同的方式?
2) (1)处理器密集度是否过高?如果你想要实时更新的网站没有流api,有没有更好的方式,更好的直播内容流?我正在考虑在一个单独的小ruby应用程序中每隔几秒钟发送一个请求(带有守护进程和cronjob),获得json/xml结果,使用nokogiri删除我不需要的东西,然后只是浏览评论/书籍/帖子/等的小列表,构建一个更改内容的提要,并使用Juggernaut或其他工具将这些更改推送到某个rails应用程序。这样行得通吗?
我想这一切都可以归结为一个问题:
一些网站的最新内容的实时流式传输是如何工作的?你是怎么做到的?...so如果有人在我的网站上,他们可以实时看到刚刚发布的新消息或新书?
期待你的回答,兰斯
发布于 2009-10-01 12:13:30
首先,如果一个网站不提供API,那么这是一个强烈的迹象,表明解析和提取他们的数据是不合法的,但是你最好检查他们的使用条款和隐私政策。
就我个人而言,我不知道有什么叫做“流API”的东西,但是假设他们有一个API,你仍然需要提取它提供的结果(xml,json,...),解析它们,并将它们返回给用户。策略将根据应用类型的不同而有所不同:
https://stackoverflow.com/questions/1502193
复制相似问题