搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

1回答

开了ai爬虫处置，会不会影响我的网站seo?

搜索引擎、网站、爬虫、seo、EdgeOne

eo的这个ai爬虫处置，开了之后其他搜索引擎还能爬到我的网站吗，影响seo吗

浏览 59提问于2026-04-27

1回答

Scrapy -基于正则表达式处理的异地请求

我必须抓取5-6个域名。我想写一个爬虫，这样离线请求如果包含一些子字符串的例子设置为aaa，bbb，ccc，如果离线url包含来自上面设置的子字符串，那么它应该被处理，而不是过滤掉。

浏览 11提问于2016-08-23得票数 0

回答已采纳

1回答

泽西2.8，灰熊，SSE:我要下载哪些jar文件？

aI正在尝试将我的jar文件从1x升级到2.8版本。要下载它们，每个人都指向。显然，我可以下载和导入所有这些，但我相信5-6对我来说应该足够了。我已经搜索过了，但是我没有找到可以下载的东西。

浏览 4修改于2015-05-07得票数 0

回答已采纳

1回答

有没有办法在python中通过http来调整jpgs的大小？

我正在编写一个网络爬虫，找到并保存在网站上的所有图像的网址。我可以毫不费力地买到这些。我需要上传这些网址，连同它们的缩略图版本，通过http请求到服务器，这将渲染图像和收集各种AI应用程序中使用的功能信息。对于某些urls，这是没有问题的。

浏览 15提问于2017-02-17得票数 0

回答已采纳

1回答

在Java中加速嵌入式Groovy

我正在尝试为一个游戏引擎创建脚本AI，我正在开发一个有趣的游戏引擎。我决定尝试使用Groovy来创建作为GroovyClasses加载的.groovy行为文件，然后将其转换为我的behavior接口。我在每个游戏周期执行更新，脚本化的AI类将程序带入爬虫。我的问题是，有没有办法加快嵌入式groovy的速度，或者有没有更好的方法来做我正在做的事情？谢谢你的帮助。

浏览 3提问于2011-05-07得票数 1

1回答

爬虫-无法访问爬行内存

我对Screep比较陌生，我一直致力于构建自己的基本AI系统。然而，我在最初的测试中遇到了一个问题。我有一个确定要做的作业的脚本，然后爬虫请求可用的作业。我已经能够将Job对象存储到爬虫的内存中，但稍后我无法再调用它。

浏览 14提问于2017-08-18得票数 1

2回答

我正在尝试使用PHP和cURL库来编写我的第一个爬虫。我的目标是系统地从一个站点获取数据，这意味着代码不会跟踪给定站点上的所有超链接，而只是特定的链接。一旦完成，爬虫就会转到页面上的那些分类站点，并查看该分类是否有多个页面。如果是这样，它还会将子页面存储在另一个数组中。最后，我合并数组以获得需要抓取的站点的所有链接，并开始获取所需的数据。问题是爬虫运行了5-6分钟，然后停止，并且没有获取所有需要的子页面链接。我打印数组的内容来检查结果。我在日志中看不到任何http错误，所有站点都给出了http 200状态代码。我假设网站在

浏览 0修改于2013-01-01得票数 1

回答已采纳

2回答

有没有一种简单快速的方法来生成JavaScript？

(在5-6次点击后)页面通过执行javascript生成更多的评论。也许有某种技术，或者其他任何东西可以改进我的解决方案，我们将非常感谢您的帮助。

浏览 0修改于2015-05-04得票数 0

2回答

Azure表单识别器性能慢

它位于本地区域的S0层上，我们使用的是Azure.AI.FormRecognizer v3.1.1 .NET客户端： }; //https://learn.microsoft.com/en-us/dotnet/api/overview/azure/ai.

浏览 6提问于2022-01-12得票数 0

2回答

根据条件在现有列中添加新行

range weather flag calculation 5-6 good n 14 5-6 worse y 5 输出如下： range weather flag calculation 0-5 worse n null 0-5 worse y

浏览 11提问于2020-01-13得票数 1

回答已采纳

1回答

智能答疑引擎的AIML

我是一名网页开发人员，有一个使用Python2.7构建网页爬虫的网站，并为维基百科建立了索引.所以我想用python构建一个应答引擎，它使用一个字符串变量(它是一个包含整个维基百科的巨大变量)作为信息来源，并使用AI来回答.我可以在AIML中编写这种应答代理程序吗？如果是，请提供教程的链接，其中告诉我如何做到这一点？

浏览 2修改于2014-12-27得票数 6

2回答

jq合并json数组元素

我的数据位于以下json数组中： { "min": 5, "max": 6}]1-2,5-6.[] |[ .min, .max|tostring ] | join("-")"1-2"我不知道如何从那个表达到想要的"1-2"，"5-6“。

浏览 0提问于2018-12-10得票数 3

回答已采纳

1回答

爬虫和爬虫架构

当我遇到这个设计问题时，我一直在用php构建一个刮板和爬虫。我想知道创建一个分离爬行和抓取任务的系统(大多数专业系统似乎都是这样做的)和一个在爬虫爬行时抓取任务的系统之间的权衡。

浏览 4修改于2012-04-16得票数 2

回答已采纳

1回答

从长文本文件中的字符串数组中找到相应的数字。

我有一个文本文件，它的单个字符串格式如下，每个数字nad名称都是唯一的：我还有一个Python数组，它包含200个唯一的名称字符串，我想遍历这个数组来找到匹配的5-6位数字，并将其存储为一个元组。由于文本文件中的单个字符串有"5-6位数字“：”name“位24,000次，所以问题是不确定有什么合适的方法来做到这一点。

浏览 2提问于2021-11-23得票数 1

回答已采纳

1回答

HTML流的SEO/爬行性影响

随着HTML流(例如反应18流)的兴起，我想知道爬虫是如何处理HTML的。谷歌爬虫是如何处理这个问题的？谷歌确实提到了流这里，但它没有说明谷歌爬虫如何处理HTML。其他爬虫(DuckDuckGo，Bing，Facebook，Twitter等)怎么样？我假设爬虫会等到HTML流结束时，这个假设安全吗？

浏览 0提问于2021-07-27得票数 7

4回答

如何停止云主机上的爬虫？

云服务器

我在云主机上运行了一个scrapy爬虫，这个爬虫可以一直运行，假如我没有停止爬虫就和主机断开了连接，是不是除了关机就没有办法停止爬虫了？

浏览 510提问于2018-01-27

1回答

PHP使用解析器创建多维数组

', '116 (5-6)', 1921, 'n.A.', '128 (7-8)', 4626, 'n.A.', '140 (9-10)', 4222, 'n.A.', '116 (5-6)', 18834, 'n.A.', '128 (7-8)', 30662, 'n.A.', '140 (9-10)', 28981, '

浏览 3修改于2011-11-17得票数 1

2回答

Rails 5-6:获取完整URL

我想知道在Rails5或6中是否有获取当前访问的完整url的方法。例如： http://localhost:3000/#about http://localhost:3000/books/#reference 我尝试过request.fullpath，但它不能处理特殊字符，如来自http://localhost:3000/#about或http://localhost:3000/books/#reference的# 我只需要完整的网址，因为它是。有没有办法做到这一

浏览 12提问于2020-01-30得票数 1

1回答

如何在docker中使用此文件？

我想使用爬虫实验室仪表板与我的爬虫代码。爬虫实验室是爬虫仪表板。链接为我要安装(？)docker(?)中的chromedriver。

浏览 44提问于2021-03-11得票数 0

2回答

如何将新的URL传递给Scrapy Crawler

我想让一个抓取爬虫在芹菜任务工人内部不断运行，可能使用。或者，正如所建议的，这个想法是使用爬虫程序来查询返回XML响应的外部API。一旦爬虫程序开始运行，我如何将我想要获取的这个新URL传递给爬虫程序。我不想在每次想要给爬虫一个新的URL时都重新启动爬虫，而是希望爬虫无所事事地等待URL爬行。我发现的在另一个python进程中运行scrapy的两个方法使用一个新进程来运行爬虫程序。我不希望每次我想要抓取一个URL时，都必须派生和拆卸一个新的进程，因为这

浏览 0修改于2017-05-23得票数 2

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

开了ai爬虫处置，会不会影响我的网站seo?

Scrapy -基于正则表达式处理的异地请求

泽西2.8，灰熊，SSE:我要下载哪些jar文件？

有没有办法在python中通过http来调整jpgs的大小？

在Java中加速嵌入式Groovy

爬虫-无法访问爬行内存

PHP cURL crawler无法获取所有数据

有没有一种简单快速的方法来生成JavaScript？

Azure表单识别器性能慢

根据条件在现有列中添加新行

智能答疑引擎的AIML

jq合并json数组元素

爬虫和爬虫架构

从长文本文件中的字符串数组中找到相应的数字。

HTML流的SEO/爬行性影响

如何停止云主机上的爬虫？

PHP使用解析器创建多维数组

Rails 5-6:获取完整URL

如何在docker中使用此文件？

如何将新的URL传递给Scrapy Crawler

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐