python去utf文件的BOM头部
在window的环境下,保存的文本文档会加上三个字符0xEF 0xBB 0xBF的头部,这三个字符可能会影响对文本的读取,形成乱码,在这里记录下如何避免。
(1)首先发现直接保存为ASCII的文本文件是不包含BOM头部的
(2)若保存成UTF-8会有这三个字符,所以像notepad++保存会有一个选项叫做UTF-8无bom,是因为windows下默认的UTF-8会有这三个字符
解决方法:
在window的环境下,保存的文本文档会加上三个字符0xEF 0xBB 0xBF的头部,这三个字符可能会影响对文本的读取,形成乱码,在这里记录下如何避免。
(1)首先发现直接保存为ASCII的文本文件是不包含BOM头部的
(2)若保存成UTF-8会有这三个字符,所以像notepad++保存会有一个选项叫做UTF-8无bom,是因为windows下默认的UTF-8会有这三个字符
解决方法: