文章/答案/技术大牛

发布

社区首页 >问答首页 >尝试打开一个PDF，我得到错误“无法找到图像数据或EI”与lib ItextSharp 7

问尝试打开一个PDF，我得到错误“无法找到图像数据或EI”与lib ItextSharp 7
EN

Stack Overflow用户

提问于 2017-07-06 10:29:29

回答 1查看 332关注 0票数 0

我正在尝试用下面的代码(lib itext7)从pdf (附件链接)中提取文本：

       public static PageDescribe GetTextFromPage(PdfDocument fullDoc, int pageNum)
    {
        if (pageNum < 1)
            return null;
        else
        {
            PdfPage page = fullDoc.GetPage(pageNum);
            if (page == null)
                return null;                                                
            else
            {


                LocatedTextStrategy lStrat = new LocatedTextStrategy();
                string s = PdfTextExtractor.GetTextFromPage(page, lStrat,);

                DateTime _startPoint = DateTime.Now;
                lStrat.Points.Defragmentation();

                PageDescribe _res = new PageDescribe(pageNum, lStrat.Points);  
                return _res;                                                
            }
        }
    }
}

但我得到的错误是无法找到图像数据或EI：

See Image Error

如果我手动删除pdf的初始徽标，则不会发生此错误。但我不能更改提供此文件的源系统。

Sample of pdf here

有人有什么建议吗？

itext

itext7

回答 1

Stack Overflow用户

发布于 2017-07-06 11:37:18

我下载了你的PDF文件，并尝试了以下代码，它对我有效(我在第1页尝试过)：

public string GetTextFromPage(string path, int pagenum)
{
    PdfReader reader = new PdfReader(path);
    string text = PdfTextExtractor.GetTextFromPage(reader, pagenum, new LocationTextExtractionStrategy());
    reader.Close();
    return text;
}

您可以修改上面的方法以返回您的PageDescribe类。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/44938864

复制

相似问题

问尝试打开一个PDF，我得到错误“无法找到图像数据或EI”与lib ItextSharp 7
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问尝试打开一个PDF，我得到错误“无法找到图像数据或EI”与lib ItextSharp 7EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问尝试打开一个PDF，我得到错误“无法找到图像数据或EI”与lib ItextSharp 7
EN