我有一个MHTML文件,我正在尝试将其转换为HTML。
我已经安装了HtmlAgilityPack并尝试了以下代码:
var doc = new HtmlAgilityPack.MixedCodeDocument();
doc.Load("C:\\Users\\DickTracey\\Downloads\\Club Membership Report.mhtml");
var ms = new MemoryStream();
var sw = new StreamWriter(ms);
doc.Save(sw);
ms.Position = 0;
var sr = new StreamReader(ms);
return sr.ReadToEnd();但是它总是返回null。
谁能解释一下把MHTML转换成HTML的正确步骤?
发布于 2019-07-14 14:43:11
用C#实现MHTML to HTML解码!
string mhtml = "This is your MHTML string"; // Make sure the string is in UTF-8 encoding MHTMLParser parser = new MHTMLParser(mhtml); string html = parser.getHTMLText(); // This is the converted HTML
git link:https://github.com/DavidBenko/MHTML-to-HTML-Decoding-in-C-Sharp.git
发布于 2020-06-13 22:35:23
我用HxD快速浏览了一下MHTML文件。尽管如上所述,HtmlAgilityPack对MHTML的支持很少或根本不支持,但格式本身看起来很简单。它似乎由常见的可疑元素(未编码的HTML、CSS、JS、用Base64编码的图形等)以某种方式(带有mime类型的头)连接在一起,只要花一点力气就能弄清楚。话虽如此,这种格式可能在某个地方有完整的文档记录--因此,在浏览器上重新编写一些C#来解析它,然后将结果输入到HtmlAgilityPack中。
https://stackoverflow.com/questions/22985000
复制相似问题