我使用Perl脚本和Net::Flickr::Backup模块在本地备份我的Flickr图片。这将拉取RDF-XML文件中的原始图片、缩略图和相关的元数据(标题、标签等)。
我想提取这个元数据的一个子集,这样我就可以生成一个“穷人的Flickr”HTML页面。这将显示缩略图和指向较大版本的链接,以及选定的元数据(标题、标签和Flickr中设置的权限)。
我想从Unix命令行执行此操作,将其指向一个文件目录,然后获取一个HTML文档。
从RDF-XML文件中提取特定数据的最佳方法是什么?Perl中的支持看起来有点粗略。我愿意尝试Python或Ruby,如果它们更容易用于RDF spelunking。
发布于 2009-09-16 12:45:19
如果您有RDF-XML,则可以使用XML CPAN模块对其进行解析,如下所示:
但是,您可能想看看Net::Flickr::RDF,因为它看起来满足了您的需求。
发布于 2009-09-16 11:57:28
我不确定我是否理解了您的问题,但是您不一定需要SPARQL引擎来提取元数据。如果RDF/XML看起来总是一样的,那么可以使用一个简单的XSLT样式表从文档中提取特定的内容。
https://stackoverflow.com/questions/1432099
复制相似问题