文章/答案/技术大牛

发布

社区首页 >问答首页 >修复指向通过PdfMerger添加的未来页面的链接

问修复指向通过PdfMerger添加的未来页面的链接
EN

Stack Overflow用户

提问于 2020-08-24 23:27:34

回答 1查看 62关注 0票数 0

我正在尝试合并几个PDF，其中第一个PDF有一堆链接到后来合并的其他PDF。

我首先将HTML转换为PDF，然后将一些PDF合并到其中。

HTML PDF具有简单的ancher链接，如下所示

<a href="#some-id">Click here</a>

<div id="some-id">...</div>

如果通过HtmlConverter.ConvertToDocument生成PDF时目标id已经存在，这将非常有效。

但这就是问题所在。稍后将通过PdfMerger添加目的地。我尝试使用https://kb.itextpdf.com/home/it7kb/examples/named-destinations所引用的NamedDestinations

public void AppendPdf(string key, Document sourceDocument, Stream pdfStream)
{
    var pdfReader = new PdfReader(pdfStream);
    var pdfDocument = new PdfDocument(pdfReader);
    pdfDocument.AddNamedDestination(key, pdfDocument.GetFirstPage().GetPdfObject());

    var merger = new PdfMerger(sourceDocument.GetPdfDocument());
    merger.Merge(pdfDocument, 1, pdfDocument.GetNumberOfPages());

    var nameTree = sourceDocument.GetPdfDocument().GetCatalog().GetNameTree(PdfName.Dests);
    nameTree.SetModified();
}

但无济于事

我也尝试检查它们自己的链接，但GetAsArray抛出了一个空预期

var obj = sourceDocument.GetPdfDocument().GetFirstPage().GetPdfObject();
var annots = obj.GetAsArray(PdfName.Annots); // throws

请帮助:)

编辑

这段代码会让它更容易运行

using var stream = new MemoryStream();
var pdfWriter = new PdfWriter(stream);
var pdfDocument = new PdfDocument(pdfWriter);
var key = "future-id";
var html = $@"
<a href=""#some-id"">This link works!</a>
<a href=""#{key}"">Click here to go the first page of the merged PDF, but it does not work</a>

<div id=""some-id"" style=""page-break-before: always;"">Hello PDF</div>
";
var sourceDocument = HtmlConverter.ConvertToDocument(html, pdfDocument, new ConverterProperties());

using var pdfStream = File.OpenRead("path/to/pdf"); // change path to an actual pdf
AppendPdf(key, sourceDocument, pdfStream);

sourceDocument.Close();
var pdfBytes = stream.ToArray();
File.WriteAllBytes("path/to/result.pdf", pdfBytes); // change to desired path

Nuget包

<PackageReference Include="itext7" Version="7.1.12" />
<PackageReference Include="itext7.pdfhtml" Version="3.0.1" />

itext

itext7

html-to-pdf

回答 1

Stack Overflow用户

发布于 2020-09-01 07:04:06

添加命名目标在以下三行代码中不起作用，因为您是在只读模式(使用PdfReader)下打开文档的：

var pdfReader = new PdfReader(pdfStream);
var pdfDocument = new PdfDocument(pdfReader);
pdfDocument.AddNamedDestination(key, pdfDocument.GetFirstPage().GetPdfObject());

相反，您应该获取合并到的源文档中的总页数，该数字+1将是合并到源文档中的文档的第一页的索引，从而是输出文档中要跳转到的页码：

int sourceDocumentPageCount = sourceDocument.GetPdfDocument().GetNumberOfPages();

接下来，添加一个目的地就有点棘手了，因为你需要创建一个关于如何跳转到你的页面的描述(哪个位置等等)。可以通过以下方式完成：

PdfPage firstPageOfMergedDocument = sourceDocument.GetPdfDocument().GetPage(sourceDocumentPageCount + 1);
sourceDocument.GetPdfDocument().AddNamedDestination(key, PdfExplicitDestination.CreateFit(firstPageOfMergedDocument).GetPdfObject());

为我生成正确结果的完整AppendPdf代码：

public static void AppendPdf(string key, Document sourceDocument, Stream pdfStream)
{
    var pdfReader = new PdfReader(pdfStream);
    var pdfDocument = new PdfDocument(pdfReader);

    var merger = new PdfMerger(sourceDocument.GetPdfDocument());
    
    int sourceDocumentPageCount = sourceDocument.GetPdfDocument().GetNumberOfPages();
    
    merger.Merge(pdfDocument, 1, pdfDocument.GetNumberOfPages());

    PdfPage firstPageOfMergedDocument = sourceDocument.GetPdfDocument().GetPage(sourceDocumentPageCount + 1);
    sourceDocument.GetPdfDocument().AddNamedDestination(key, PdfExplicitDestination.CreateFit(firstPageOfMergedDocument).GetPdfObject());
}

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/63564041

复制

相似问题

问修复指向通过PdfMerger添加的未来页面的链接
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问修复指向通过PdfMerger添加的未来页面的链接EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问修复指向通过PdfMerger添加的未来页面的链接
EN