UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xac in position 7620: illegal multibyte sequence

正常流程

出现这种错误是说明‘gbk’编码规则不能对某个特殊字符进行编码操作,因此只要对文件打开时加入encoding='utf-8'命令即可,具体语句如下所示bpe_out = open('output1.txt', 'r', encoding='utf-8')即打开文件时使用‘utf-8’编码规则。

其他情况

相信上面的一些知识大家都是清楚了解的,正常在对文件进行操作打开时,都会规定使用‘utf-8’编码。因此我在对文件进行操作时使用下面语句
bpe_out = open('output1.txt', 'r', encoding='utf-8')
可以看出,我在打开文件进行操作时已经设定使用utf-8编码规则了,但是运行时竟然会报错说:
UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xac in position 7620: illegal multibyte sequence。
这让我感觉很奇怪,为什么我用’utf-8’进行编码会报错说‘gbk’编码出问题。经过多次查找资料发现是我的Pycharm设定的编码格式是‘gbk’,只需要通过以下步骤将其设定为‘utf-8’即可。
设定过程
第一步在我们的电脑上打开pycharm,点击file->settings,如下图所示:
UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xac in position 7620: illegal multibyte sequence
第二步进去settings界面之后,点击Editor->File Encodings ,如下图所示:
UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xac in position 7620: illegal multibyte sequence
第三步将Global Encoding和project Encoding的编码设置为utf-8,点击下拉框可以进行设置,如下图所示:
UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xac in position 7620: illegal multibyte sequence
第四步可以看到已经设置项目默认编码为utf-8了,点击OK就设置完成了,如下图所示:
UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xac in position 7620: illegal multibyte sequence
第五步我们也可以设置属性文件“Default Encoding for properties files”的编码为utf-8,如下图所示:
UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xac in position 7620: illegal multibyte sequence
设置完成后,再次运行代码就可以完美运行,之前的报错消失了。