首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >HTTP重定向的Cyrillic :这个例子工作,没有URL被编码。为什么?

HTTP重定向的Cyrillic :这个例子工作,没有URL被编码。为什么?
EN

Server Fault用户
提问于 2016-03-18 10:19:43
回答 1查看 1.2K关注 0票数 1

根据https://www.rfc-editor.org/rfc/rfc5987,应使用ISO8859-1字符编码返回header字段。

这也适用于用于重定向的位置字段。但是,看看下面的示例,我不知道尽管URL没有编码,重定向工作是如何进行的。

http://goo.gl/m5fDF0

我运行了不同的工具,包括谷歌Chrome开发者,位置字段肯定是编码的,但使用卷发或软件,比如尖叫青蛙,返回一个用西里尔字符写的位置。理论上,重定向应该在404中解决,但我得到了200。

知道这怎么可能吗?

EN

回答 1

Server Fault用户

发布于 2016-03-18 11:15:12

是的,实际上重定向包含大于7位(大于0x80十六进制)的八位字节。不同的应用程序将把这些八进制转换成屏幕上的各种可视表示;这取决于它们决定使用什么编码。

如果有人使用UTF-8,他们可能会得到一个很好的西里尔文字,但这是偶然的,偏离主题的问题。

https://www.rfc-editor.org/rfc/rfc7230#section-3.2非常精确地指出:

历史上,HTTP允许在 ISO-8859-1字符集ISO-8859-1中包含文本的字段内容,通过使用RFC2047编码支持其他字符集only。实际上,大多数HTTP header字段值只使用use字符集USASCII.新定义的标头字段的子集,应该限制它们的字段值to US-ASCII八进制。接收方应将field内容中的其他八进制(obs-text)视为不透明数据。

文本= %x80-FF

这意味着,几乎任何八位数都可以发送。显示标题的软件,例如将八进制转换为屏幕上某些可见表示的浏览器,应该使用ISO-8859-1进行此转换。

但是,在HTTP会话中接收数据的服务器也可以为其操作使用octets,这不涉及在任何屏幕上显示任何视觉表示形式。在本例中,HTTP服务器使用octets为您提供页面。由于HTTP服务器只获得一些八进制的输入并产生一些八进制的输出,所以“编码”并不真正适用于这里( HTTP服务器从来不需要将字节转换为它在屏幕或打印机上显示的东西)。

票数 1
EN
页面原文内容由Server Fault提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://serverfault.com/questions/764564

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档