根据https://www.rfc-editor.org/rfc/rfc5987,应使用ISO8859-1字符编码返回header字段。
这也适用于用于重定向的位置字段。但是,看看下面的示例,我不知道尽管URL没有编码,重定向工作是如何进行的。
http://goo.gl/m5fDF0
我运行了不同的工具,包括谷歌Chrome开发者,位置字段肯定是编码的,但使用卷发或软件,比如尖叫青蛙,返回一个用西里尔字符写的位置。理论上,重定向应该在404中解决,但我得到了200。
知道这怎么可能吗?
发布于 2016-03-18 11:15:12
是的,实际上重定向包含大于7位(大于0x80十六进制)的八位字节。不同的应用程序将把这些八进制转换成屏幕上的各种可视表示;这取决于它们决定使用什么编码。
如果有人使用UTF-8,他们可能会得到一个很好的西里尔文字,但这是偶然的,偏离主题的问题。
https://www.rfc-editor.org/rfc/rfc7230#section-3.2非常精确地指出:
历史上,HTTP允许在 ISO-8859-1字符集ISO-8859-1中包含文本的字段内容,通过使用RFC2047编码支持其他字符集only。实际上,大多数HTTP header字段值只使用use字符集USASCII.新定义的标头字段的子集,应该限制它们的字段值to US-ASCII八进制。接收方应将field内容中的其他八进制(obs-text)视为不透明数据。
和
文本= %x80-FF
这意味着,几乎任何八位数都可以发送。显示标题的软件,例如将八进制转换为屏幕上某些可见表示的浏览器,应该使用ISO-8859-1进行此转换。
但是,在HTTP会话中接收数据的服务器也可以为其操作使用octets,这不涉及在任何屏幕上显示任何视觉表示形式。在本例中,HTTP服务器使用octets为您提供页面。由于HTTP服务器只获得一些八进制的输入并产生一些八进制的输出,所以“编码”并不真正适用于这里( HTTP服务器从来不需要将字节转换为它在屏幕或打印机上显示的东西)。
https://serverfault.com/questions/764564
复制相似问题