www.3112.net > python怎么把uniCoDE转换成为普通字符串

python怎么把uniCoDE转换成为普通字符串

本身的文档是utf-8的话 直接用encode su = su.encode('utf-8')>>> u'中国'.encode('utf-8')'\xe4\xb8\xad\xe5\x9b\xbd'>>> print u'中国'.encode('utf-8') 中国

普通字符串可以用多种方式编码成Unicode字符串,具体要看你究竟选择了哪种编码:unicodestring = u"Hello world" # 将Unicode转化为普通Python字符串:"encode" utf8string = unicodestring.encode("utf-8") asciistring = unicodestring.

'\u56c3\u67e4' 转 u'\u56c3\u67e4': 方法1: text = eval("u"+"'\u56c3\u67e4'") 方法2: s = '\u56c3\u67e4' text = "".join(unichr(int(c, 16)) for c in s.split('\u')[1:])

python2添加u前缀,比如u"abc".python3默认就是unicode字符串,加不加u前缀都一样.

python默认就是unicode存储.如果是从文件读取的,在open的参数中指定encoding关键字参数就行.如下: #coding=utf-8/import json /def LoadQuestion(): /f = open("test.json",'r') qas = json.load(f) question = qas['documents'] /return question/t

python2unicode("文字")python3,直接输入字符串就是unicode

decode的作用是将其他编码的字符串转换成unicode编码,如str1.decode('gb2312'),表示将gb2312编码的字符串转换成unicode编码.encode的作用是将unicode编码转换成其他编码的字符串,如str2.encode('gb2312'),表示将unicode编码的字符串转换成gb2312编码.

使用urllib.unquote(python2),或者是urllib.request.unquote(python3)可以转换

我有一个比较变态的解决方法----利用json来解析.因为json在编码时会被转化为unicode字符串,将这个字符串拼接到一个json中,再解析,就可以达到目的.import jsons = u'\\uff0c\\u73b0\\u573arose\\u732e\\u6b4c\\u906d\\u4f17\\u4eba\\u56f4\\u89c2'ss = s.encode('utf8')x = json.loads('{"foo":"%s"}' % ss)print x['foo']这时,x['foo']已经是正常的unicode对象了.其实你看到的双斜杠\\只是一个斜杠,因为斜杠是转义字符.

# -*- coding:UTF-8 -*-variable = unicode("中文")

网站地图

All rights reserved Powered by www.3112.net

copyright ©right 2010-2021。
www.3112.net内容来自网络,如有侵犯请联系客服。zhit325@qq.com