C++中std::string与std::wstring转换需显式编码转换:Windows推荐WideCharToMultiByte/MultiByteToWideChar(UTF-8),跨平台可用utf8cpp或ICU;C++11的std::wstring_convert已弃用,不可依赖locale,必须明确源/目标编码。
在 C++ 中,std::string(窄字符串,通常为 UTF-8 或本地多字节编码)和 std::wstring(宽字符串,Windows 下为 UTF-16,Linux/macOS 一般为 UTF-32)之间的转换不能直接赋值,必须通过编码转换。核心在于明确源/目标编码,并借助系统 API 或标准库(C++11 起)完成。
推荐使用 std::wstring_convert(C++11–C++17,已弃用但广泛可用)或更现代的 std::iconv / 第三方库(如 ICU、utf8cpp),但 Windows 下最稳妥的是 Win32 API:WideCharToMultiByte。
WideCharToMultiByte(CP_UTF8, ...),先查长度再转换,避免截断std::wstring_convert<:codecvt_utf8>>,注意该类在 C++17 被标记为 deprecated,仅限简单场景同样需明确输入编码。若 std::string 存的是
UTF-8(推荐),则转 std::wstring 就是 UTF-8 → UTF-16;若存的是本地 ANSI(如 GBK),则需指定对应代码页。
MultiByteToWideChar(CP_UTF8, ...)(推荐 UTF-8 输入)或 CP_ACP(系统默认 ANSI)std::wstring_convert<:codecvt_utf8>> conv; auto wstr = conv.from_bytes(str);
string 实际是 GBK/Big5 等,却按 UTF-8 解码,结果必然乱码字符编码不是“自动识别”的——你必须清楚原始数据的编码,否则转换必错。
std::locale 的 codecvt 在不同平台行为不一致,且 C++17 已移除wcout 输出 wstring 正常,但若用 cout 输出 UTF-8 字符串,需先调用 SetConsoleOutputCP(CP_UTF8)
fopen(..., "wb") 写二进制,或用 std::wofstream 配合 imbue 设置 UTF-16 编码(需配合 BOM)标准库不再提供内置编码转换,推荐轻量方案:
WideCharToMultiByte/MultiByteToWideChar,它们稳定、高效、支持所有代码页