web-dev-qa-db-ja.com

python3でバイトオブジェクトをjson.dumpsする方法

Python2では

import json
a = {"text": u"你好".encode("gbk")}
json.dumps(a, ensure_ascii=False)

>>> Out: '{"text": "\xc4\xe3\xba\xc3"}'

Python3で同じ「Out」を取得したい:

import codecs
byte_obj = "你好".encode("gbk")
x = byte_obj.decode("utf8", "backslashreplace") # ops, it become '\\xc4\\xe3\\xba\\xc3'
x = codecs.escape_encode(byte_obj)[0] # ops, it become b'\\xc4\\xe3\\xba\\xc3'

# fail, I have to concatenate them

b'{"text": "' + u"你好".encode("gbk") + b'"}'

>>> Out: b'{"text": "\xc4\xe3\xba\xc3"}'

Python3では、変換する方法がある場合

{"text": "你好"}  # first, encoding with gbk, then json.dumps 

b'{"text": "\xc4\xe3\xba\xc3"}'  # json serialized result
6
郭泽平

実際にGBKエンコーディングが必要な場合Python 3:

import json
a = {"text": u"你好"}
print(json.dumps(a, ensure_ascii=False).encode('gbk'))

b'{"text": "\xc4\xe3\xba\xc3"}'

5
Mark Tolonen