我在按类型抓取论坛网站(文章、网页、视频),我想如果红宝石能以某种方式提取视频的长度。网页的相应html部分如下所示。
<div align="center"><script type="text/javascript" src="http://somedomain.com/wp-content/themes/thesis/custom/swfobject.js"></script>
<div id="player">This text will be replaced</div>
<script type="text/javascript">
var so = new SWFObject('http://somedomain.com/forum/yota/audio_player/player.swf','mpl','640','500','9');
so.addParam('allowscriptaccess','always');
so.addParam('allowfullscreen','true');
so.addParam('flashvars','&file=http://somedomain.net/flv/ezinearticles/ezinearticles.flv&dock=false');
so.write('player');
</script></div>有趣的是,我可以直接访问flv文件,所以我很高兴下载所有视频,然后以某种方式提取长度。大多数文件是flv,有些是wmv。
请注意,我已获得论坛网站管理员的许可做刮擦。
发布于 2010-02-14 15:22:11
红宝石看起来像做你想做的事。
发布于 2010-02-14 14:45:27
我不知道ruby,但是您总是可以调用外部程序,比如ffmpeg或带有文件作为参数的mplayer,然后解析输出。看一看:
http://www.linuxquestions.org/questions/linux-software-2/getting-file-information-with-ffmpeg-601817/
https://stackoverflow.com/questions/2260638
复制相似问题