腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(28)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
使用
ManifoldCF
提取文件内容
我正在尝试将
ManifoldCF
与文件系统连接器一起使用。但是..。如何配置文本以获得与此命令等效的内容: java -jar tika-
ManifoldCF
-1.9.jar --text我的意思是,我希望获得文件的内容并将其推送到输出连接中。这怎么可能呢?
浏览 1
提问于2015-10-23
得票数 1
1
回答
阿帕奇
ManifoldCF
TIKA
我试图使用Apache集成在
ManifoldCF
上提取PDF的文本内容,以便在我的笔记本电脑上在Elasticsearch服务器中摄取一些PDF文件。
浏览 7
提问于2017-11-16
得票数 1
1
回答
使用
ManifoldCF
进行Apache身份验证
我正在尝试将
ManifoldCF
连接到我公司的一个内部维基。apache连接器为wiki api提供了用户名和密码字段,但是,在我的公司中,需要用户名和密码才能连接到运行wiki站点的
ManifoldCF
服务器,在进行身份验证之后,这些凭据将传递给wiki api因此,本质上,我需要一种方法来让
ManifoldCF
在尝试建立连接时传递我的windows凭据。使用api登录字段不起作用。 有什么建议吗?
浏览 4
提问于2013-05-11
得票数 1
1
回答
作业
ManifoldCF
工作,但几秒钟后就会冻结。
我安装了
ManifoldCF
,它们是连接器和postgres。我的
ManifoldCF
上有两份工作: 在这张图片上,你可以看到问题。我需要重新启动
manifoldCF
以中止和/或重新启动它们的作业(如果是冻结的话)。你有解决办法吗? PS :冻结前的时间,不是固定的。文档数量索引也是如此。而不是相关。-name * | grep -R ERROR | grep 2017-04-21只返回
ManifoldCF
浏览 6
修改于2017-04-24
得票数 1
1
回答
Manifoldcf
文档爬行速度慢
我们使用
ManiFoldCF
documentum连接器从DCTM存储库中抓取数据,并将抓取的数据写入MongoDB。使用节流值500触发了爬网。
浏览 19
修改于2019-01-17
得票数 0
1
回答
Alfresco社区版、
ManifoldCF
和Elasticsearch优化全文搜索
如何通过Apache
ManifoldCF
对Elasticsearch中的组合元数据建立索引来构建聚集索引,从而优化全文搜索,如何集成milions Alfresco Edition CMIS存储库和
浏览 30
修改于2020-04-24
得票数 0
1
回答
如何通过REST API和Apache
ManifoldCF
获取“文档状态”数据
我们使用的是Apache
ManifoldCF
。在管理UI中,有状态报告->文档状态的报告。是否可以通过
ManifoldCF
的获取该内容 我找到的最接近的东西是下的org.apache.
manifoldcf
.crawler.RunDocumentStatus,但我还不能确定它是否可以通过HTTP
浏览 4
提问于2015-04-20
得票数 1
1
回答
使用
manifoldcf
的Web抓取
我试图用
Manifoldcf
从一个特定的网站抓取数据,但不幸的是,我一直得到0的结果--我不知道我做错了什么。
浏览 5
提问于2022-04-14
得票数 0
3
回答
如何使用
ManifoldCF
或nutch抓取具有SAML身份验证的网站?
我正在尝试抓取一个网站,更具体地说是一个使用
ManifoldCF
的Google Site,它具有SAML身份验证,并将抓取的数据索引到Apache Solr中。在
manifoldCF
中,我们可以选择HTTP basic身份验证、NTLM authentication和Session-based访问凭据身份验证方法。有没有人用具有SAML身份验证的
manifoldCF
抓取过网站?如果不是
manifoldCF
,有没有人能够通过Apache Nutch实现这一点,因为我担心它也只提供HTTP basic、Digest和NTLM身
浏览 9
修改于2016-08-30
得票数 18
2
回答
创建
ManifoldCF
输出连接器时出现ElasticSearch错误
我在同一个netowrk中的另一个VM上运行
ManifoldCF
2.3。使用
ManifoldCF
的浏览器UI,我添加了ElasticSearch输出连接器,当我保存它时,会得到连接器状态中的一个错误:Description: Elastic
浏览 6
提问于2016-02-08
得票数 0
回答已采纳
1
回答
ManifoldCF
作业调度是如何进行的?
我正在使用CMIS查询和存储所有索引的solr作为存储库连接器,将
manifoldcf
或mcf与alfresco cms集成。我能做的很好&可以在solr索引中搜索文档。
浏览 4
提问于2014-02-18
得票数 3
1
回答
用
Manifoldcf
和Solr - String索引在范围外爬行Jira
我使用
Manifoldcf
v2.7.1和Solr v5.2.1,并试图使用Jira连接器爬行Jira,并在
Manifoldcf
中得到以下错误: Error: Repeated service interruptions
浏览 2
提问于2017-10-19
得票数 1
回答已采纳
1
回答
ManifoldCF
和Postgresql将抓取150万个文档
我们使用
ManifoldCF
和PostgreSQL9.6来抓取我们的网站。在500.000个文档之前,爬行的速度很好(大约为20.000个文档/小时)。
浏览 24
提问于2019-02-08
得票数 0
1
回答
Apache :通过REST
ManifoldCF
获取存储库连接的历史记录报告
我正在尝试通过
ManifoldCF
REST API获取存储库连接的历史记录报告。根据文档: https://
manifoldcf
.apache.org/release/release-2.11/en_US/programmatic-operation.html#History+query
浏览 11
提问于2019-02-13
得票数 0
回答已采纳
2
回答
Apache
ManifoldCF
。无法创建到FileNet的存储库连接
我正在尝试从
ManifoldCF
连接到FileNet,但没有成功。
浏览 21
修改于2016-09-08
得票数 8
回答已采纳
1
回答
正在为
manifoldcf
编写Mongo DB输出连接器
我们正在尝试通过apache manifold CF将存储库内容推送到MongoDb。谢谢!!
浏览 4
提问于2018-05-16
得票数 0
1
回答
solr在authority-example.jar中加载
manifoldcf
搜索组件时出错
我正在使用Solr4.0alpha和
manifoldcf
.5.1,我下载并构建了.5.1-example.jar,并将其放到了solrconfig.xml / solr /lib中,并添加了适当的行。
浏览 2
提问于2012-08-01
得票数 0
回答已采纳
2
回答
是否有AmazonS3连接器可用于
ManifoldCF
?
我想要爬一个亚马逊的s3桶,使用多种方式将爬行转发到OpenSearchServer。我见过其他产品都安装了amazon连接器,我只是想知道是否有一个用于S3的公开可用的连接器。
浏览 7
提问于2015-04-27
得票数 1
回答已采纳
2
回答
ApacheManifoldCF elasticsearch输出连接器版本兼容性
我正在尝试从apache 7.1.X版本连接elasticsearch作为输出连接器,但
ManifoldCF
.Using elasticsearch 7.1.X不工作。你能建议
maniFoldCF
在最新的elasticsearch版本上工作吗? 已尝试使用elasticsearch配置存储库和输出插件。已执行作业,但在elasticsearch中未找到任何内容。
浏览 40
提问于2019-09-24
得票数 0
1
回答
基于Sharepoint声明的身份验证与传统身份验证
我正在使用
ManifoldCF
连接到这些网站,以提取所有内容以及权限。
ManifoldCF
连接器连接到启用了经典身份验证的站点,并按预期工作。但是,尝试爬行基于声明的网站会生成401未经授权的错误。
ManifoldCF
提供了一个名为MCPermissions.asmx的web服务包,可供访问。SPContext.Current.Web.Url+"'", ex.StackTrace); throw RaiseException(ex.Message, "1000", ex.Source
浏览 2
修改于2014-05-07
得票数 0
第 2 页
领券