腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(3139)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
使用DQS清理数据时,“值已作为校正值存在”错误
在SQL Server 2012数据质量服务中,我需要按照基于术语的关系清理数据,如下所示:
沃尔玛
**Wlt
沃尔玛
** 任何解决
方案
的建议
浏览 0
修改于2013-02-01
得票数 1
2
回答
GraphDB:节点作为关系的属性
我试图将graphDB作为问题域的关系数据库管理系统的替代
方案
进行分析。下面是我正试图解决的一个问题的类比。P:Michael和P:Angela r:like_to_eat G:Apple和G:coder:available_in G:苹果和G:面包是:
沃尔玛
和S:Whole 。到目前为止还是很简单的。问题是当我试图明确安琪拉喜欢全食苹果和
沃尔玛
面包的时候。迈克尔喜欢吃
沃尔玛
的苹果和全食的面包。我怎么能用图表来表示这样的东西呢?这能用Neo4j或CosmosDB这样的标准图形解决
方案
解决吗?有人能帮我一下
浏览 5
修改于2020-04-23
得票数 2
回答已采纳
1
回答
使用AWS Glue Crawler创建列名时删除/重命名特殊字符
我正在使用AWS
爬虫
爬行S3桶,它在雅典娜中创建表模式。据我所知,雅典娜不支持具有特殊字符的列名,比如(
反
斜杠)等等。这是一种可以在
爬虫
从S3桶中爬行时排除/重命名这些列名的方法。
浏览 3
修改于2021-10-14
得票数 2
回答已采纳
1
回答
在数据库中查找和替换URL,而不尾随URL末尾的斜杠
但是,一些放置内容的人在<a href""></a> URL的末尾没有添加
反
斜杠(尾斜杠)的情况下就生成了URL。它会自动添加一个
反
斜杠到末尾,这可以算作谷歌
爬虫
的重定向。TL;博士 如何在没有
反
斜杠的情况下替换WordPress内容中的所有URL,使用(https://test.com/testpage)并添加
反
斜杠(https://test.com/testpage/
浏览 0
修改于2020-10-16
得票数 0
1
回答
向商店供应商发送资金/资金的应用程序,如Google Pay,Paytm
我们希望实现一个支付解决
方案
,最终用户可以把钱发送给其他用户,商人(如
沃尔玛
,商店商贩)。现在我们通过NFC、扫描QR代码等方式向商店小贩(如
沃尔玛
)、个人、POS发送货款。
浏览 7
修改于2021-06-16
得票数 1
回答已采纳
1
回答
沃尔玛
库存更新不面向400
我试图更新
沃尔玛
库存使用curl,但面临400错误响应代码的问题。 echo $httpcode = curl_getinfo($ch, CURLINFO_HTTP_CODE); 这正是
沃尔玛
浏览 1
修改于2018-10-12
得票数 2
回答已采纳
0
回答
WordPress如何通过静态化解决高并发
爬虫
抓取问题?
负载均衡
、
爬虫
、
wordpress
、
解决方案
、
网页爬虫
wordpress如何实现全站静态化,有没有好的解决
方案
?现在装了缓存插件,但是还是无法应对大量的
爬虫
,又想被
爬虫
抓取收录,又无法应对大量的
爬虫
,加了cdn也没有好转,wordpress如何实现全站静态化,有没有好的解决
方案
?
浏览 90
提问于2025-12-15
0
回答
使用Python
爬虫
,怎么处理
反
爬机制?
python
、
爬虫
、
验证码
、
requests
、
数据
我用Python requests来请求数据,但经常出现bug,要没ip无效,要么需要验证码,怎么处理呢?
浏览 167
提问于2025-07-19
1
回答
Python代码,根据售出的书籍数量来查找所有的人
嗨,我被下面的代码卡住了,当我试图为这个问题找到解决
方案
时:根据售出的书籍数量找到所有的人。下面是文件1711.txt的内容 下面是我写的代码,请帮助我用正确的代码显示正确的结果,谢谢!
浏览 2
修改于2020-06-20
得票数 1
回答已采纳
2
回答
爬行时管理URL的常见方法是什么?
我正在尝试编写一个网络
爬虫
程序,但现在我想知道:存储所有urls的最佳方法是什么,这样
爬虫
就可以一起工作,但不会干扰。 将所有已找到的URL保存在由所有Queue实例共享的PriorityQueue如果数据库最终是一致的,我如何防止多个
爬虫
获得相同的URL两次
浏览 5
提问于2011-12-28
得票数 0
回答已采纳
5
回答
.Net 4中的多线程C#队列
我正在开发一个简单的网页
爬虫
。我搜索并找到了很多实现多线程
爬虫
的解决
方案
。创建线程安全队列以包含唯一URL的最佳方法是什么? 编辑:.Net 4.5中有没有更好的解决
方案
?
浏览 3
修改于2012-04-10
得票数 1
回答已采纳
1
回答
托管
爬虫
的最佳解决
方案
?
我有一个
爬虫
,爬行几个不同的领域为新的帖子/内容。总内容数为十万页,每天都有很多新的内容添加。因此,为了能够通过所有这些内容,我需要我的
爬虫
爬行24/7。目前,我将
爬虫
脚本托管在与
爬虫
添加内容的站点相同的服务器上,而且我只能在夜间运行cron作业来运行脚本,因为当我这样做时,网站基本上停止工作,因为脚本的加载。换句话说,一个非常糟糕的解决
方案
。所以基本上,我想知道对于这种解决
方案
,我的最佳选择是什么? 是否有可能继续从同一主机运行
爬虫
,但在某种程
浏览 3
修改于2014-03-06
得票数 10
回答已采纳
3
回答
如何让
爬虫
忽略我的免责声明
问题是,我根本不想让
爬虫
遇到免责声明。它所做的就是忽略了Googlebot用户代理。这是唯一的解决
方案
吗?通过
爬虫
的UA来识别
爬虫
?如何检测cookie -如果我没有cookie,这意味着它是一个
爬虫
? 谢谢
浏览 1
提问于2011-12-14
得票数 1
回答已采纳
2
回答
如何允许用户复制我的电子邮件地址而不是
爬虫
?
我有一个问题,一些
爬虫
爬虫
从我的网站上的电子邮件地址,并发送垃圾邮件。解决
方案
1 .name::after {} content: '.com';
浏览 3
提问于2020-09-15
得票数 2
回答已采纳
7
回答
对使用Lucene或Solr的
爬虫
工具的建议?
对于HTML和XML文档(本地或基于web),什么是一个好的
爬虫
(
爬虫
),并且在Lucene / Solr解决
方案
空间中工作得很好?可以是基于Java的,但不一定是。
浏览 13
提问于2008-11-12
得票数 16
回答已采纳
1
回答
将默认表属性分配给
爬虫
创建的表
我试图将表属性分配给用
爬虫
创建的表。我检查了
爬虫
创建界面中的选项,但没有看到这样的选项。如果这在默认的
爬虫
功能中是不可能的,那么将表属性附加到使用某个
爬虫
创建的每个表上的可行方法是什么?编辑:一个可能的解决
方案
是创建一个lambda函数,检查胶水表中是否存在自定义参数,如果没有创建它们。
浏览 2
修改于2021-01-25
得票数 0
回答已采纳
2
回答
在它们的真实符号中变成utf
我刚刚自己做了第一个网络
爬虫
,它上了维基百科,下载了整个页面的html。我设法获得了一个列表的内容。列表中的值包含正数或负数。但它给了我一个'\xe2\x88\x922',而不是打印出一个'-2'。我尝试了string.replace("\xe2\x88\x92","-"),但由于
反
斜杠的原因,这似乎不起作用。你知道我怎样才能把这些utf东西转换成它们真正的符号吗?
浏览 18
修改于2020-07-04
得票数 3
1
回答
如何在AJAX网站上实现结构化数据进行SEO?
我们有一个网站,所有的数据都是通过javascript加载,我称之为AJAX网站,搜索引擎优化是当前的大任务,我结束了我自己的解决
方案
后,通过网络搜索:,但现在我被结构化数据:,因为它不需要的最终用户,我想要一个解决
方案
,像我自己的解决
方案
,只提供
爬虫
这样的信息。问:是否可以在页面中生成仅供
爬虫
使用的JSON-LD信息?
浏览 0
提问于2015-05-11
得票数 1
4
回答
是否存在任何开放的、简单的可扩展的网络
爬虫
?
我寻找一个网络
爬虫
解决
方案
,可以是足够成熟的,可以简单地扩展。我对以下特性感兴趣..。
爬虫
应该能够为我探索Web的一部分,并且它应该能够决定哪些站点符合给定的标准 上面的这些事情可以一个一个地完成,而无需付出很大的努力,但我对提供可定制的、可扩展的
爬虫
的任何解决
方案
都感兴趣。
浏览 1
修改于2021-02-13
得票数 7
回答已采纳
1
回答
Laravel删除站点地图生成器中的重复urls
我有这个GenerateSitemap.php文件,我可以在其中配置
爬虫
程序,但我不知道如何让
爬虫
程序删除一些特定的URL,例如() () ()。我将spatie in laravel用于此解决
方案
,并尝试下面的解决
方案
,但它不起作用 { SitemapGenerator
浏览 2
修改于2021-09-22
得票数 0
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券