先前与海外客户在使用.txt文档确认合作细节时, 发现有些字符会因为编码区别导致乱码问题, 自此格外关注字符在不同编码中的兼容性问题.

最近发现了一个新的小问题, 有一些字符, 在windows系统自带的记事本应用中保存后会变为乱码, 但另外一些不会. 一个典型的例子是, 如果在记事本中以GB编码输入"力量", 当系统默认语言不是中文, 并且记事本应用修改为UTF编码后, "力量"二字会变成Unicode中的问号标志符号, 也就是0xFFFD. 但是类似"张三""李四"等字符, 不会因此发生问题.

但是当我使用Visual Studio Code编辑器时, 无论是"力量", 还是"张三""李四", 只要修改了编码, 都会产生乱码.

我想了解一下这其中的原因, 记事本应用是如何保证"张三""李四"这些字符的跨编码兼容的?      您好,

点赞(95) 打赏

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部