首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在Heritrix 3.1.0中更改MirrorWriterProcessor的路径

在Heritrix 3.1.0中更改MirrorWriterProcessor的路径
EN

Stack Overflow用户
提问于 2013-07-04 05:00:50
回答 1查看 247关注 0票数 0

我正在使用Heritrix 3.1.0进行爬行。我正在尝试使用MirrorWriterProcessor保存文件。但是,此选项在crawler-beans.cxml中不可用。

我所做的就是将"org.archive.modules.writer.WARCWriterProcessor“的"warcWriter”替换为"org.archive.modules.writer.MirrorWriterProcessor“

但是,此处理器将镜像内容写入$HERITRIX_HOME/mirror

我将“路径”配置为"${launchId}/mirror",希望Heritrix将镜像目录写入作业目录下。

如何将作业目录下的MirrorWriterProcessor路径更改为?

EN

回答 1

Stack Overflow用户

发布于 2013-07-23 06:19:20

目前,你不能使用像warcWritter接受的那样的标签。但是,您可以编写一些spring魔术来创建您自己的带戳文件夹。这将为SimpleDateFormat的format函数创建一个工厂,并输出一个可用于创建带戳文件夹的字符串。

代码语言:javascript
复制
<bean id="dateFormat" class="java.text.SimpleDateFormat">
  <constructor-arg value="ddMMyyyy" />
</bean>
<bean id="formatedDate" factory-bean="dateFormat" factory-method="format">
  <constructor-arg>
    <bean class="java.util.Date" />
  </constructor-arg>
</bean>
<bean id="mirrorWriter" class="org.archive.modules.writer.MirrorWriterProcessor">
  <property name="path">
    <bean class="java.lang.String">
      <constructor-arg value="#{formatedDate + '/mirror'}" />
    </bean>
  </property>
...
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/17458047

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档