我正在创建一个在线服务,我完全不知道从哪里开始多语言pdf到mobi文件转换。我已经为英语创建了一个应用程序,这很容易,但pdf和多字节字符集的问题是,它们被解释为图像,这意味着它们不被解释为mobi文件格式的单词。
有没有办法/在线服务/api/代码来实现这一点?任何可以在文件到文件的基础上做到这一点的windows应用程序都会很好……
发布于 2011-08-05 01:09:44
您将需要为此编写自己的插件,因为在市场上没有对此的支持。但是,您可以使用自定义字母映射对其进行转换,这意味着每个图像首先由ocr读取,然后用于查找utf等效项。
https://stackoverflow.com/questions/6889710
复制相似问题