我几天前刚刚发现了Mammoth Python包,它是一个很棒的工具,可以从Word文档中创建干净的HTML代码。它近乎完美。只有一件东西我不明白。它从单词标题创建的标题元素(h1-h6)包含几个具有奇怪的TOC的<a>元素。看起来像这样:
<h1><a id="_Toc48228035"></a><a id="_Toc48288791"></a><a id="_Toc48303673"></a><a id="_Toc48306159"></a><a id="_Toc48308644"></a><a id="_Toc48311128"></a><a id="_Toc48313611"></a>Arteriosklerose</h1>
有谁知道怎么处理这些东西吗?
提前感谢
干杯,彼得
发布于 2020-08-20 21:20:37
这只是一个猜测,但我希望它能有所帮助:
TOC很可能是“目录”的缩写。当你想跳转到页面中的一个元素时(比如某一章节),你需要给该章节一个ID,并在你的url后面加上#ID。这样,浏览器将直接滚动到该点。
我猜你是在以某种方式使用一个目录,里面有链接,当你检查它们时,你会填充,找到像<a href="#_Toc48228035">Arteriosklerose</a>这样的东西
https://stackoverflow.com/questions/63505785
复制相似问题