如何处理Linux汉字乱码 - 代码天地

如何处理Linux汉字乱码

企业开发 2018-06-01 04:48:16 阅读次数: 0

在Linux下，你有没有这样的经历，文本文件里面的汉字显示都是正常的，可一插到数据库里就变成了乱码；文件名在本机显示都很正常，一传到服务器上显示的都变成乱码了，最近就差点被这个问题搞死，最后还算小有收获，这里写一下心得：

　　 1 ，首先要知道文件自己的编码方式 ，就是文件是以 utf8 还是以 gbk 等编码方式存储的，因为这是根本。以 xxx ． dat 文件为例

　　用 vi 命令打开 xxx ． dat 文件

　　在命令行模式：输入 set fileencoding 这时会在终端的底部显示文件的编码方式，显示的结果如果是 cp936 （等同于 gbk ）或者 utf8 等，那说明文件的编码方式已经被正确判断出来了，如果是 latin1 ，我们就可能要设定 VI 的 fileencodings 这个环境变量的值，打开 vimrc 这个文件， RHEL 的这个文件在 /etc 目录下、 Ubuntu 在 /etc/vim 目录下；或者你也可以建一个～ / ． vimrc 文件

　　然后把里面 merge 成： set fileencodings ＝ ucs － bom ， utf － 8 ， cp936 ， gb18030 ， big5 ， euc － jp ， euc － kr ， latin1 然后重新 vi xxx ． dat

　　 PS ：我们打开文件的时候， VIM 按顺序使用 fileencodings 中的编码进行尝试解码，如果成功的话，就使用该编码方式进行解码，并将 fileencoding 设置为这个值，如果失败的话，就继续试验下一个编码。而 latin1 是一种非常宽松的编码方式，任何一种编码方式得到的文本，用 latin1 进行解码，都不会发生解码失败 —— 当然，解码得到的结果自然也就是理所当然的“乱码”

　　 2 ，下一个比较重要的就是 LANG 这个环境变量了 （关于这个变量的含义和作用自己百度，可以搜出一堆）

　　假如 xxx ． dat 是以 utf8 编码，往数据库里插的时候，我们就需要把 LANG 这个环境变量设成 LANG ＝ zh_CN ． utf8 ，如果 xxx ． dat 是以 cp936 、 LANG 就需要设成 LANG ＝ zh_CN ． gbk

　　这样在插入的时候，就不需要用程序对文件的字符进行转换，可以直接插入

　　 PS ：用 locale － a 命令查看可以把 LANG 设成哪些值， locale － m 查看系统支持哪些字符集，假如 locale － a 没有你所需要的值，比如 zh_CN ． gbk ，那就需要手动安装，安装方法也很简单

　　 a ． sudo cp /var/lib/locales/supported ． d/local /var/lib/locales/supported ． d/local ． old 【可选，备份】

　　 b ． sudo cp /usr/share/i18n/SUPPORTED /var/lib/locales/supported ． d/local

　　编辑 /var/lib/locales/supported ． d/local 去掉大多数不用的行（ locales ）

　　 c ． sudo dpkg － reconfigure locales

　　编辑 /etc/environment 文件，设置一下要用的 LANG

　　也可以用 locale － gen 命令设置默认的 locale ，如 sudo locale － gen zh_CN ． UTF － 8

　　 3 ，还有一个同事， LANG 环境变量（这里要注意环境变量生效的范围）也已经改过了，把 windows 的文件重新传到了 Linux 服务器上，通过网页浏览，文件名仍然是乱码，这是因为 LANG 还未在 apache 服务器上生效，重启一下apache服务就可以了。

猜你喜欢

转载自lwx522.iteye.com/blog/1435361

如何处理Linux汉字乱码

MATLAB复制汉字到word时乱码如何处理

如何处理SecureFX中的中文乱码

如何处理Tomcat中文乱码的问题？

Linux 僵尸进程如何处理

linux如何处理多连接请求？

Linux磁盘满了如何处理

Linux如何处理僵尸进程

linux 硬盘满了如何处理

PostgreSQL: 如何处理导出的数据中文显示乱码问题？

Mysql存储过程内中文乱码，如何处理

解析excel如何处理法文乱码问题

javaHttp请求,接收到的是中文乱码如何处理

如何处理Tomcat启动的时候的乱码的问题？

如何处理navicat导出csv文件中文乱码？

遇到Mac app中菜单文字乱码如何处理？

python程序中出现汉字，运行程序时出错，该如何处理？

如何处理Corncob

如何处理数据

如何处理死锁

如何处理BUG

如何解决POST请求中文乱码问题，GET的又如何处理

如何解决POST请求中文乱码问题，GET的又如何处理呢？

SpringMVC中如何解决POST请求中文乱码问题，GET的又如何处理？

如何解决POST请求中文乱码问题，GET的又如何处理呢

Linux服务器磁盘满了如何处理

若linux 的分区硬盘满，如何处理？

KALI Linux中GURB安装失败如何处理

如何处理Linux中的僵尸进程defunct

LINUX SHELL中echo如何处理特殊字符

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)