我使用Alfresco将TIFF转换为PDF,使用Tiger OCR库()
我的自定义转换xml (ocr-转换器-上下文)是
<?xml version='1.0' encoding='UTF-8'?>
<!DOCTYPE beans PUBLIC '-//SPRING//DTD BEAN//EN' 'http://www.springframework.org/dtd/spring-beans.dtd'>
<beans>
<bean id="transformer.Ocr.Tiff2Pdf" class="org.alfresco.repo.content.transform.RuntimeExecutableContentTransformerWorker">
<property name="checkCommand">
<bean class="org.alfresco.util.exec.RuntimeExec">
<property name="commandsAndArguments">
<map>
<entry key=".*">
<list>
<value>c:\ocr\ocr.exe</value>
<value>--about</value>
</list>
</entry>
</map>
</property>
</bean>
</property>
<property name="transformCommand">
<bean class="org.alfresco.util.exec.RuntimeExec">
<property name="commandsAndArguments">
<map>
<entry key="Windows.*">
<list>
<value>c:\ocr\ocr.exe</value>
<value>--replace</value>
<value>--replace</value>
<value>--language en</value>
<value>--pdf</value>
<value>--output-file</value>
<value>${target}</value>
<value>${source}</value>
</list>
</entry>
</map>
</property>
</bean>
</property>
<property name="explicitTransformations">
<list>
<bean class="org.alfresco.repo.content.transform.ExplictTransformationDetails" >
<property name="sourceMimetype"><value>image/tiff</value></property>
<property name="targetMimetype"><value>application/pdf</value></property>
</bean>
<bean class="org.alfresco.repo.content.transform.ExplictTransformationDetails" >
<property name="sourceMimetype"><value>image/tiff</value></property>
<property name="targetMimetype"><value>text/plain</value></property>
</bean>
</list>
</property>
</bean>
</beans>当我将TIFF文件导入到“公司主页”文件夹中时,我现在希望将该内容转换为PDF。现在,假设转换是自动的,还是需要在空间上调用规则,这是正确的吗?
另外,我已经将转换上的日志设置为DEBUG,这就是我在Alfresco日志中看到的。
调试util.exec.RuntimeExec执行结果: os:
Windows XP命令:
c:\ocr\ocr.exe,-关于
成功:真退出代码:0
out: Intelliant命令行实用程序,版本1.1.0。版权(2006年)。
演职人员:
TIFF图书馆版权(c) 1988-1997 Sam Leffler版权(c) 1991-1997硅图形公司
独立JPEG组库
版权(C) 1991-19用户:管理调试content.transform.ContentTransformerRegistry搜索转换器:源mimetype:图像/tiff目标mimetype:文本/普通变压器:[]
当我真的需要它来转换成PDF时,它似乎是在搜索文本/普通的目标。我在这里错过了什么?请帮帮忙
发布于 2011-04-15 20:03:14
唯一自动运行的转换是文本纯文本转换,它用于全文索引。
如果您使用的是共享,那么共享将尝试为您执行两个更多的转换。首先,当您查看包含文件的文件夹时,它将尝试生成一个缩略图(通过呈现服务)。为此,通常需要定义一个从新的mime类型到映像/jpeg的转换器。此外,当您在共享中查看文档详细信息时,它将尝试为您提供web预览。
如果希望在上传文档时生成PDF版本的文档,则需要定义规则。您可以使用transform content规则来实现这一点,或者,如果您想要对其进行大量控制,可以编写一个脚本来使用呈现服务。
https://stackoverflow.com/questions/5680687
复制相似问题