首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >CFHTTP编码问题

CFHTTP编码问题
EN

Stack Overflow用户
提问于 2010-06-04 12:42:43
回答 3查看 4K关注 0票数 2

我试图使用cfhttp从其中提取一个解析信息的页面。我调用的页面标题是:

内容-编码: gzip 连接:保持-活着 内容长度: 19066 服务器: IBM_HTTP_Server 可变:接受编码,用户代理 内容-语言: en-US 缓存-控制:无缓存=“设置-cookie, 套餐-2“ 内容-类型: text/html;charset=ISO-8859-1

我将字符集设置为ISO-8859-1,但是我在FileContent中得到了以下内容(下面只显示了一个小的示例,但我认为它可以通过)。

EðÑq·Oã?·Ì\ZóL¯þ´Vú5ðbä£ÿæ¾_HÉÒñQãO\Çþãë85ÁÜà±°xsll}&b?,u?2SùQyk5g?UÛ3Ѹfã×ARÃi_iûRã_28-CA-."b /¯ßíWÝÆ´}w~,°iøÜCáÇþ@ÃZ5¤ïsÁ8½°ì* ZÜéjOÝK/Ë4§ÈG5×ä*¬6ÚwÇ0]ã:àÑþé¬G"ÅÁl/t° jlá»5¶&¯lìYìºØ'yDð½|#ý<ñìTé%¾ï¬ùƪx¶}«±o9»ë¼ÂÆÒï'w8Y?χxsll 6íqüg CAüg sóxóx·mbq xàz{ío xàmbq源

我尝试了其他字符集,并认为gzip编码是造成问题的原因,但我不确定测试是否是问题所在。任何建议或帮助都将得到极大的重视。

以下是我的代码

代码语言:javascript
复制
<cfhttp 
    METHOD="get"
    throwonerror="yes" 
    CHARSET="ISO-8859-1"
    URL="http://www.cars.com/for-sale/searchresults.action?sf1Dir=DESC&prMn=1&crSrtFlds=stkTypId-feedSegId-pseudoPrice&rd=100000&zc=44203&PMmt=0-0-0&stkTypId=28881&sf2Dir=ASC&sf1Nm=price&sf2Nm=miles&feedSegId=28705&searchSource=UTILITY&pgId=2102&rpp=10">

    <cfhttpparam type="Header" name="Accept-Encoding" value="deflate;q=0">
    <cfhttpparam type= "Header" name= "TE" value= "deflate;q=0" >
</cfhttp>

<cfset listings = #cfhttp.FileContent#>
<cfoutput>
    #listings#
</cfoutput>

我还尝试了标题:

代码语言:javascript
复制
    <cfhttpparam type="Header" name="Accept-Encoding" value="*">
    <cfhttpparam type= "Header" name= "TE" value= "deflate;q=0" >

并尝试删除“接受-编码”头,然后离开TE。

更新:我还没有弄清楚,但我发现了一些可能帮助我的东西。当我使用我的一个测试php服务器在同一个页面上运行file_get_contents时,它运行得很好,那么如果我运行相同的cfhttp代码来调用调用该页面的php页面,那么它就能正常工作。到目前为止,谢谢你的建议。

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2010-11-04 15:47:54

cars.com的问题似乎是他们两次压缩输出(基于这条线)

所以我们需要解压缩内容..。再一次..。

首先,我们需要以二进制的形式获取内容,因此CFHTTP调用需要包括

代码语言:javascript
复制
getasbinary="yes"

然后,我们需要解开它。

我们可以用java.util.zip来做这件事。gunzip是这个cflib.org函数的修改版本。

代码语言:javascript
复制
<cfhttp
    getasbinary="yes"
    METHOD="get"
    throwonerror="yes"
    CHARSET="ISO-8859-1"
    URL="http://www.cars.com/for-sale/searchresults.action?sf1Dir=DESC&prMn=1&crSrtFlds=stkTypId-feedSegId-pseudoPrice&rd=100000&zc=44203&PMmt=0-0-0&stkTypId=28881&sf2Dir=ASC&sf1Nm=price&sf2Nm=miles&feedSegId=28705&searchSource=UTILITY&pgId=2102&rpp=10" >

    <cfhttpparam type="Header" name="Accept" value="application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5">
    <cfhttpparam type="Header" name="User-Agent" value="Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_5_8; en-US) AppleWebKit/534.7 (KHTML, like Gecko) Chrome/7.0.517.41">
    <cfhttpparam type="Header" name="Accept-Encoding" value="deflate">
    <cfhttpparam type="Header" name="TE" value="deflate, chunked, identity, trailers">

</cfhttp>

<cfset unzippedHTML = gunzip(cfhttp.FileContent)>

<cfoutput>
    #unzippedHTML#
</cfoutput>

<cfscript>

    function gunzip(inBytes) {
        var gzInStream = createObject('java','java.util.zip.GZIPInputStream');
        var outStream = createObject('java','java.io.ByteArrayOutputStream');
        var inStream = createObject('java','java.io.ByteArrayInputStream');
        var buffer = repeatString(" ",1024).getBytes();
        var length = 0;
        var rv = "";

        try {
            inStream.init(inBytes);
            gzInStream.init(inStream);
            outStream.init();
            do {
                length = gzInStream.read(buffer,0,1024);
                if (length neq -1) outStream.write(buffer,0,length);
            } while (length neq -1);
            rv = outStream.toString();
            outStream.close();
            gzInStream.close();
            inStream.close();
        }
        catch (any e) {
            rv = "";
            try {
                outStream.close();
            } catch (any e) { }
                try {
                    gzInStream.close();
                } catch (any e) {
                    try {
                        inStream.close();
                    } catch (any e) {}
                }
        }
        return rv;
    }
</cfscript>

确保对函数的var作用域进行双重检查。我可能漏掉了什么。

票数 10
EN

Stack Overflow用户

发布于 2010-06-04 13:30:40

在标题中,您看到的是文件的压缩内容。在它对你有用之前,它需要被解压缩。我想你可以用cfzip做这件事,但还没有任何经验。

这个职位似乎表明您可以在请求中添加一个标头,以便在返回之前将其解压缩/压缩:

代码语言:javascript
复制
<cfhttp ...>
    <cfhttpparam type="Header" name="Accept-Encoding" value="deflate;q=0">
    <cfhttpparam type="Header" name="TE" value="deflate;q=0">
</cfhttp>
票数 3
EN

Stack Overflow用户

发布于 2010-06-04 12:59:00

我要做的第一件事是,通过对其他页面尝试相同的代码,确保不是源内容/服务器造成的问题。如果它们运行良好,那么很可能是您试图使用的服务器/内容。如果他们有同样的问题,那么问题就在您的代码中。如果您发布了您的代码,也将是有帮助的。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/2974197

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档