www.3112.net > python中怎样将uniCoDE转换成原来的中文?

python中怎样将uniCoDE转换成原来的中文?

python默认就是unicode存储.如果是从文件读取的,在open的参数中指定encoding关键字参数就行.如下: #coding=utf-8/import json /def LoadQuestion(): /f = open("test.json",'r') qas = json.load(f) question = qas['documents'] /return question/t

loads取出后是unicode?我怀疑你用的是python3通常python2时所有IO读写都是byte方式.也就是编码后的.java也是这样子.只有python3还有某些特定的模块才会自动将byte重新转换成unicode在python2里的确可以使用s.decode('gbk','ignore')之类的变成unicode.不过在python3里应该是这样子, s.encode('gbk','ignore')这样就变成了byte如果你喜欢 utf-8,可以s.encode('utf-8','ignore')和s.decode('utf-8','ignore')多试试就可以了. console和文件只支持编码过的字符串.

如果: u'\u6ce8\u91ca' 真是unicode对象,你直接print 输出就是汉字了.如果你得到的只是这样的 "u'\u6ce8\u91ca'" 字符串是不行的.>>> s = u'\u6ce8\u91ca'>>> su'\u6ce8\u91ca'>>> print s注释>>> print type(s)>>> print s.encode('gbk')

中文格式就是utf8呗In [1]: s = u"中国"In [2]: sOut[2]: u'\u4e2d\u56fd'In [3]: new = s.encode("utf8")In [4]: print new中国In [5]: newOut[5]: '\xe4\xb8\xad\xe5\x9b\xbd'In [6]:如果解决了您的问题请采纳!如果未解决请继续追问

可以遍历然后用encode和decode方法试试

1、python2与python3稍微有点区别2、python2中默认的字符编码格式都是unicode,在字符串前加'u',表示unicode 编码3、将unicode转换成中文,只需要用deconde解码就可以了!

>>> str = u'\u62c9\u62c9lala'>>> type(str)>>> print str拉拉lala如果: u'\u62c9\u62c9lala' 真是unicode对象,你直接print 输出就是汉字了. 如果你得到的只是这样的 "u'\u62c9\u62c9lala'" 字符串是不行的.

你是在IDLE控制台,还是cmd,还是在sublime里呢 IDLE对中文的支持有问题,默认是ASCII码,所以用编码解码会有问题. 如果是cmd或sublime或文件的形式,只要在文件开始指定好编码,然后就ok啦

python2unicode("文字")python3,直接输入字符串就是unicode

decode的作用是将其他编码的字符串转换成unicode编码,如str1.decode('gb2312'),表示将gb2312编码的字符串转换成unicode编码. encode的作用是将unicode编码转换成其他编码的字符串,如str2.encode('gb2312'),表示将unicode编码的字符串转换成

网站地图

All rights reserved Powered by www.3112.net

copyright ©right 2010-2021。
www.3112.net内容来自网络,如有侵犯请联系客服。zhit325@qq.com