首頁技術文章正文

黑馬程序員C/C++培訓專家:C++中GB2312字符串和UTF-8之間的轉換

更新時間:2017-11-21 來源:黑馬程序員 瀏覽量:

在編程過程中需要對字符串進行不同的轉換,特別是Gb2312和Utf-8直接的轉換。在幾個開源的魔獸私服中,很多都是國外開發(fā)的,而暴雪為了能夠兼容世界上的各個字符集也使用了UTF-8。在中國使用VS(VS2005以上版本)開發(fā)基本都是使用Gb2312的Unicode字符集,所以當在編程過程中就需要進行字符轉換,這樣才能兼容游戲,否則就是亂碼。而在控制臺顯示字符串時,正好相反需要將UTF-8的字符串轉換成Gb2312才能正常顯示。

為了解決這個問題,轉換如下;其實很多地方都可以使用到字符串的編碼轉換,代碼如下:


//UTF-8到GB2312的轉換  
char* U2G(const char* utf8)  
{  
int len = MultiByteToWideChar(CP_UTF8, 0, utf8, -1, NULL, 0);  
wchar_t* wstr = new wchar_t[len+1];  
memset(wstr, 0, len+1);  
MultiByteToWideChar(CP_UTF8, 0, utf8, -1, wstr, len);  
len = WideCharToMultiByte(CP_ACP, 0, wstr, -1, NULL, 0, NULL,   NULL);  
char* str = new char[len+1];  
memset(str, 0, len+1);  
WideCharToMultiByte(CP_ACP, 0, wstr, -1, str, len, NULL, NULL);  
if(wstr) delete[] wstr;  
return str;  
}  
 
//GB2312到UTF-8的轉換  
char* G2U(const char* gb2312)  
{  
int len = MultiByteToWideChar(CP_ACP, 0, gb2312, -1, NULL, 0);  
wchar_t* wstr = new wchar_t[len+1];  
memset(wstr, 0, len+1);  
MultiByteToWideChar(CP_ACP, 0, gb2312, -1, wstr, len);  
len = WideCharToMultiByte(CP_UTF8, 0, wstr, -1, NULL, 0, NULL,  NULL);  
char* str = new char[len+1];  
memset(str, 0, len+1);  
WideCharToMultiByte(CP_UTF8, 0, wstr, -1, str, len, NULL, NULL);  
if(wstr) delete[] wstr;  
return str;  
}  

 無論是GB2312到UTF-8的轉換,還是UTF-8到GB2312的轉換,都需要注意的是在使用字符串后,需要刪除字符串指針;這是因為以上兩個方法返回的是字符串指針,如果沒有刪除將會內存泄漏,可別說我沒提醒你哦。


本文版權歸黑馬程序員C/C++學院所有,歡迎轉載,轉載請注明作者出處。謝謝!


作者:黑馬程序員C/C++培訓學院


首發(fā):http://c.itheima.com/


分享到:
在線咨詢 我要報名
和我們在線交談!