利用纯c++和windows api实现gb2312和utf-8两种编码格式的转换 - 代码天地

利用纯c++和windows api实现gb2312和utf-8两种编码格式的转换

其他 2018-12-03 02:53:02 阅读次数: 0

为什么同样的字符串在两台主机上，会出现一个显示正常，一个显示乱码的情况呢？

答案：编码方式不匹配。

解释：任何内容在计算机中的存储形式都是二进制，不论是在内存中还是在硬盘中。所以，同一个字符串在两台主机上的二进制存储是一模一样的。只是将这个二进制数据呈现时，发生了变化。呈现字符串的过程就是对字符串进行编码，并按照字符集找到该编码对应的符号，并显示出来的过程。所以出现了上面乱码的问题。所以，在utf8编码和gb2312编码下都显示正确、且相同的汉语文本，那么他们对应的二进制数据肯定不一样。这样表达可能更容易理解。

出现乱码怎么办？按下面的步骤办：

1，找到传过来的字符串的原始编码方式

2，找到你主机显示字符串的默认编码方式

3，转码

原文地址：点击打开

//UTF-8到GB2312的转换

std::string U2G(const char* utf8)
{
int len = MultiByteToWideChar(CP_UTF8, 0, utf8, -1, NULL, 0);
wchar_t* wstr = new wchar_t[len+1];
memset(wstr, 0, len+1);
MultiByteToWideChar(CP_UTF8, 0, utf8, -1, wstr, len);
len = WideCharToMultiByte(CP_ACP, 0, wstr, -1, NULL, 0, NULL, NULL);
char* str = new char[len+1];
memset(str, 0, len+1);
WideCharToMultiByte(CP_ACP, 0, wstr, -1, str, len, NULL, NULL);
if(wstr) delete[] wstr;
std::string strGb2312 = str;
if(str) delete[] str;
return strGb2312;
}

//GB2312到UTF-8的转换

std::string G2U(const char* gb2312)
{
int len = MultiByteToWideChar(CP_ACP, 0, gb2312, -1, NULL, 0);
wchar_t* wstr = new wchar_t[len+1];
memset(wstr, 0, len+1);
MultiByteToWideChar(CP_ACP, 0, gb2312, -1, wstr, len);
len = WideCharToMultiByte(CP_UTF8, 0, wstr, -1, NULL, 0, NULL, NULL);
char* str = new char[len+1];
memset(str, 0, len+1);
WideCharToMultiByte(CP_UTF8, 0, wstr, -1, str, len, NULL, NULL);
if(wstr) delete[] wstr;
std::string strUtf8 = str;
if(str) delete[] str;
return strUtf8;
}

猜你喜欢

转载自blog.csdn.net/jigetage/article/details/83352720

利用纯c++和windows api实现gb2312和utf-8两种编码格式的转换

编码格式简介（ANSI、GBK、GB2312、UTF-8、GB18030和 UNICODE）

nginx支持GB2312和UTF-8编码

编码GBK和GB2312、Unicode、UTF-8

UTF-8、GB2312、GBK编码格式详解和编码示例

字符编码 utf-8 与 gb2312之间的转换 C 实现

PHP iconv 解决utf-8和gb2312编码转换问题

字符编码和python使用encode,decode转换utf-8, gbk, gb2312

编码格式简介（ANSI、GBK、GB2312、UTF-8、UTF-16、GB18030和 UNICODE）

ANSI、GBK、GB2312、UTF-8、GB18030和 UNICODE 编码那些事儿

ANSI、GBK、GB2312、UTF-8、GB18030和 UNICODE网页编码

视频安防监控平台-GB2312和UTF-8在linux下面的转换

ASCII、GB2312、GBK、Unicode、UTF-8介绍和转换

C++中GB2312字符串和UTF-8之间的转换

UTF-8 GBK UTF8 GB2312 之间的区别和关系

UTF-8 GBK UTF8 GB2312 之间的区别和关系（转）

【转】彻底搞明白 GB2312、GBK 、GB18030和UTF-8

unicode 、utf-8 、utf-16、ascii 、gbk 、gb2312之间的联系和区别

ANSI和ASCII、GBK和GB2312、Unicode和UTF-8的区别

URL链接中汉字乱码转UTF-8和gb2312

<meta>标签charset=gb2312和charset=utf-8的问题

UTF-8 GBK GB2312 之间的区别和关系

ASP教程:gb2312和utf-8乱码问题解决

【C语言】ASCII、GB2312以及UTF8编码格式

设置vim 支持中文编码GB2312和Unicode编码UTF8

编辑器（Win记事本、Sublime、Notepad++）对常见字符编码的处理和区别：GB2312、GBK、ANSI、Unicode、UTF-8

JS 中的GB2312转UTF8和UTF8转GB2312

嵌入式utf-8转码gb2312的c语言实现，附源码

PHP字符串截取函数(解决中文乱码问题!支持UTF-8和GB2312)

Qt QString中文 char* UTF-8 QByteArray QTextCodec unicode gb2312 GBK 乱码和转码问题

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)