如何在Unicode中读取Unicode文件作为Unicode字符串

问题描述:

我有一个以Unicode或UTF-8编码的文件(我不知道是哪一个)。当我在Python 3.4中读取文件时,结果字符串被解释为ASCII字符串。我如何将它转换为一个Unicode字符串,如u"text"如何在Unicode中读取Unicode文件作为Unicode字符串

术语“Unicode”是指标准,而不是特定的编码。 由于计算机中的文件是二进制文件,因此在二进制文件中存在对Unicode数据进行编码的不同方式。其中之一是“UTF-8”。

您可以咨询https://docs.python.org/3/howto/unicode.html

从该文件中抽取的(参见 “阅读与写作Unicode数据”)

with open('unicode.txt', encoding='utf-8') as f: 
    for line in f: 
    print(repr(line)) 

在Python 3,不像python2,Unicode字符串常量不写与“你”。