首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏别先生

    Linux下文件字符编码格式检测和转换

    不过有时, 我们有可能会遇到非UTF-8编码的文件, 比如中文的GBK编码, 或者俄语的CP1251编码. 而文本文件一般不带有自身编码格式的信息, 这就给我们处理带来很多麻烦. 首先, 我们需要看看当前系统下 enca 支持的语言和对应的编码类型: # enca --list languages belarusian: CP1251 IBM866 ISO-8859-5 KOI8 -UNI maccyr IBM855 KOI8-U bulgarian: CP1251 ISO-8859-5 IBM855 maccyr ECMA-113 czech: ISO-8859-2 baltic polish: ISO-8859-2 CP1250 IBM852 macce ISO-8859-13 ISO-8859-16 baltic CORK russian: KOI8-R CP1251 -2 IBM852 KEYBCS2 macce KOI-8_CS_2 CORK slovene: ISO-8859-2 CP1250 IBM852 macce CORK ukrainian: CP1251

    6.4K21发布于 2020-10-10
  • 来自专栏信数据得永生

    readability-lxml 源码解析(一)

    CHARSETS = { "big5": "big5hkscs", "gb2312": "gb18030", "ascii": "utf-8", "maccyrillic": "cp1251 ", "win1251": "cp1251", "win-1251": "cp1251", "windows-1251": "cp1251", } # 通过查表,将输入编码替换成它的超集

    57250编辑于 2023-10-13
  • 来自专栏建站知识

    linux服务器修改ftp默认21端口方法

    1、登录服务器,打开vsftp.conf文件 # vim /etc/vsftpd/vsftpd.conf 2、在文件末尾增加listen_port=8021 #remote_charset=CP1251

    9.6K20发布于 2021-07-20
  • >> 技术应用:MySQL - 字符编码表

    chinese_ci 2 binary Binary pseudo charset binary 1 cp1250 Windows Central European cp1250_general_ci 1 cp1251

    60410编辑于 2023-10-10
  • 来自专栏云计算与大数据

    MySQL字符集学习

    | 1 | | cp1250 | Windows Central European | cp1250_general_ci | 1 | | cp1251 | 50 | | Yes | 1 | PAD SPACE | | cp1251_bulgarian_ci | cp1251 | 14 | | Yes | 1 | PAD SPACE | | cp1251_general_ci | cp1251 | 51 | Yes | Yes | 1 | PAD SPACE | | cp1251_general_cs | cp1251 | 52 | | Yes | 1 | PAD SPACE | | cp1251_ukrainian_ci | cp1251 | 23 | | Yes

    3.7K20编辑于 2023-03-18
  • 【Linux】自动执行Mysql常用命令脚本

    14 Yes 1 cp1251_ukrainian_ci cp1251 23 Yes 1 cp1251_bin cp1251 50 Yes 1 cp1251_general_ci cp1251 51 Yes Yes 1 cp1251_general_cs cp1251 52 Yes 1 utf16_general_ci utf16 54 Yes Yes 1 utf16 | 14 | | Yes | 1 | | cp1251_ukrainian_ci | cp1251 | 23 | | Yes _general_ci | cp1251 | 51 | Yes | Yes | 1 | | cp1251_general_cs | cp1251

    65910编辑于 2024-08-16
  • 来自专栏Owen's World

    PHP函数

    Unicode ISO-8859-1 - 西欧 ISO-8859-15 - 西欧(加入欧元符号 + ISO-8859-1 中丢失的法语和芬兰语字母) cp866 - DOS 专用 Cyrillic 字符集 cp1251

    4.3K40编辑于 2021-12-08
  • 来自专栏别先生

    在Linux中对文件的编码及对文件进行编码转换操作

    soft]# 我们需要看看当前系统下 enca 支持的语言和对应的编码类型: 1 [root@slaver1 soft]# enca --list languages 2 belarusian: CP1251 IBM866 ISO-8859-5 KOI8-UNI maccyr IBM855 KOI8-U 3 bulgarian: CP1251 ISO-8859-5 IBM855 maccyr ECMA- polish: ISO-8859-2 CP1250 IBM852 macce ISO-8859-13 ISO-8859-16 baltic CORK 11 russian: KOI8-R CP1251 IBM852 KEYBCS2 macce KOI-8_CS_2 CORK 13 slovene: ISO-8859-2 CP1250 IBM852 macce CORK 14 ukrainian: CP1251 24 CP1156, CP1157, CP1158, CP1160, CP1161, CP1162, CP1163, CP1164, CP1166, 25 CP1167, CP1250, CP1251

    11.2K41发布于 2020-10-10
  • 来自专栏用户8644135的专栏

    PHP htmlspecialchars() 函数实例代码及用法大全

    ISO-8859-1 - 西欧 ISO-8859-15 - 西欧(加入欧元符号 + ISO-8859-1 中丢失的法语和芬兰语字母) cp866 - DOS 专用 Cyrillic 字符集 cp1251

    1.2K30发布于 2021-07-13
  • 来自专栏Albert陈凯

    文本编码转换工具iconv 附批量转换文件编码命令

    16 ISO_8859-16 ISO_8859-16:2001 L10 LATIN10 KOI8-R CSKOI8R KOI8-U KOI8-RU CP1250 MS-EE WINDOWS-1250 CP1251

    7.3K90发布于 2018-04-04
  • 来自专栏前端儿

    Node.js爬虫数据抓取乱码问题总结

    所有这里主要说的是 Windows-1251(cp1251)编码与utf-8编码的问题,其他的如 gbk就先不考虑在内了~ 2.解决方案 1. 使用js原生编码转换  但是我现在还没找到办法哈..  

    3.2K10发布于 2018-09-03
  • 来自专栏Java学习网

    MYSQL数据库各种编码的差异--Java学习网

    克罗地亚语, 不区分大小写 cp1250_czech_cs 捷克语, 区分大小写 cp1250_general_ci 中欧 (多语言), 不区分大小写 cp1251

    1.5K20发布于 2021-07-09
  • 来自专栏CaiRui

    LAMP之Mysql源码配置安装

    charset_name可以是一种 binary,armscii8, ascii,big5, cp1250,cp1251, cp1256,cp1257, cp850,cp852, cp866,cp932

    1.4K10编辑于 2022-05-09
  • 来自专栏Nicky's blog

    MySQL字符类型学习笔记

    general_ci 1 latin7 ISO 8859-13 Baltic latin7_general_ci 1 utf8mb4 UTF-8 Unicode utf8mb4_general_ci 4 cp1251

    85010发布于 2019-10-28
  • 来自专栏全栈程序员必看

    java native2ascii的用法介绍

    Standard Code for Information Interchange windows-1250 Cp1250 Windows Eastern European windows-1251 Cp1251

    98310编辑于 2022-10-02
  • 来自专栏DBA随笔

    mysql中的字符集和校验规则

    general_ci | 1 | | utf8mb4 | UTF-8 Unicode | utf8mb4_general_ci | 4 | | cp1251

    2.8K10发布于 2019-11-06
  • 来自专栏用户7095785的专栏

    MySQL的字符集和乱码问题

    general_ci | 1 | | utf8mb4 | UTF-8 Unicode | utf8mb4_general_ci | 4 | | cp1251

    2.5K30发布于 2020-03-20
  • 来自专栏开源部署

    DDL语句

    | 1 | | cp1250 | Windows Central European | cp1250_general_ci | 1 | | cp1251

    1.1K20编辑于 2022-09-15
  • 来自专栏用户2910674的专栏

    7 个令人惊叹的 Python 库

    可以理解解码为以下任何编码的文本: 拉丁语-1 (ISO-8859–1) Windows-1252 (cp1252 — 用于微软产品) Windows-1251 (cp1251 — cp1252的俄语版本

    1.8K31编辑于 2023-10-24
  • 来自专栏萝卜大杂烩

    7 个令人惊叹的 Python 库

    可以理解解码为以下任何编码的文本: 拉丁语-1 (ISO-8859–1) Windows-1252 (cp1252 — 用于微软产品) Windows-1251 (cp1251 — cp1252的俄语版本

    1.8K10编辑于 2023-09-22
领券