是否有一种简单的方法来处理HTML文件,以便可以删除匹配某个CSS选择器的标记?我的动机是pandoc生成的HTML在我看来过于冗长,它围绕着<span class="math inline"> ... </span>的任何数学表达式,而通常情况下,...已经足够了。对于显示数学,输入和输出往往有换行现象,所以专用工具可能比grep或类似工具更好。目标是减少带宽的使用,所以任何客户端都会被淘汰。
发布于 2016-12-02 14:11:37
Pandoc插入那些span标记以使javascript库(如mathjax )能够正确地显示数学.当然,您可以使用您选择的html处理工具(例如,Nokogiri )删除它们,如果您使用的是红宝石,请将类似的内容放在removespans.rb中。
require 'nokogiri'
doc = Nokogiri::HTML(File.open("file.html"))
doc.search('span').remove
puts doc然后执行:
pandoc -s -o file.html input.md
ruby removespans.rb > output.htmlhttps://stackoverflow.com/questions/40698349
复制相似问题