搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

1回答

产品信息分析及产品评论

我正在创建一个爬虫来获取产品信息和产品评论，并从一个特定的类别导出到csv文件。例如，我需要从裤子类别中获取所有信息，所以我的爬行从那里开始。 yield {"product_url": item.css('.category-good-na

浏览 0提问于2020-03-11得票数 1

回答已采纳

1回答

使用导入IO搜索数据

如何在importIO中的爬虫中使用crawler？我需要抓取一个公司的详细信息，以及每个公司的“所有”评论。

浏览 0修改于2016-01-28得票数 0

1回答

python爬行以提取评论计数

我试着用python让评论成为爬虫。in bsObj.findAll(attrs={'class': 'product-reviews-count'}) 但是我不能得到标签enter image description here之间的评论计数实际上，由于我不是开发人员，这将是一个棘手的问题如果你需要更多的信息来解决这个问题，请发表评论。

浏览 10提问于2020-07-19得票数 0

回答已采纳

1回答

为什么Google索引管理不适用于实时版本？

我有一个任务，防止谷歌的爬虫索引一些内容。我读过，如果我有这样的html：然后googleoff告诉Google的爬虫不要索引内容，而googleon告诉Google的爬虫要索引内容。到现在为止还好。因此，不应该被Google的爬虫索引的内容应该在这些评论之间。我已经使用googleoff和googleon功能将应该排除在Google索引之外的所有内容打包到这些评论中

浏览 5修改于2013-08-10得票数 0

回答已采纳

2回答

注释不使用Api进行刮擦

我正在使用刮除从一个网站上对书籍的评论。到目前为止，我已经做了一个爬虫和刮评论的单一的一本书，把它的网址作为启动网址由我自己，我甚至不得不给标签的评论，由我自己从页面的源代码找到它。它起作用了。也就是说，我想要某种方式，爬虫应该能够找到书的网页在网站上，并刮它的评论。我从goodreads中提取评论，它没有为url提供统一的方法，甚至对于不同的书籍，标签也是不同的。而且我不想用Api。

浏览 10提问于2014-05-02得票数 0

回答已采纳

1回答

更改Apify-ready模板中的.tld

我们的目标不仅是获得英语评论，还包括德语、法语等评论。如何在不编写新爬虫的情况下调整脚本？

浏览 8提问于2019-12-31得票数 0

1回答

用Scrapy创建站点地图

站点地图的格式不一定是XML，它只是关于信息。此外，我希望保存爬行页面的完整HTML源代码，以供进一步分析，而不是只从其中抓取某些元素。对有经验的网络爬虫者的评论:考虑到这是可能的，你认为Scrapy甚至是正确的工具吗？或者用请求之类的库来编写自己的爬虫会更容易吗？

浏览 0提问于2017-11-07得票数 5

3回答

Facebook Graph API SEO评论和脏话过滤器

我正在考虑尝试整合Facebook在我们网站上留下的评论，这样内容就可以被搜索引擎抓取，也可以供那些没有在浏览器上启用Javascript的人使用(尽管我非常怀疑会有很多人)。目前，我们的Facebook评论是通过Facebook评论社交插件(使用<fb:comments href="MY_URL" num_posts="50" width="665"></fb:comments这最终会呈现一个iFrame (搜索引擎爬虫通常会忽略它)

浏览 0修改于2011-10-21得票数 4

回答已采纳

2回答