我一直想知道如何使用IFilter提取文本的编码。
IFilter::GetText()检索WCHAR*,但是如果文件是用ASCII编码的呢?其他Unicode编码(例如UTF-8或UTF-16?)怎么办?
在我看来,要么是IFilter负责将提取的文本转换为单个编码(如果是这样的话--这种编码是什么?),如果不是,我怎么知道是哪种编码?
发布于 2014-08-08 18:39:21
输出文本为UTF-16 (在Windows中使用WCHAR的所有内容都是UTF-16)。无法查询输入数据的编码,如果需要,您必须自己分析该数据。
https://stackoverflow.com/questions/25209577
复制相似问题