web-dev-qa-db-ja.com

python Convert Encoding:LookupError:unknown encoding:ansi

Cdvファイルのエンコードは「utf-8」であるため、Excelで開くと歪みが発生し、標準エンコード「ANSI」に変換するとエラーが発生します。

コード:

import chardet

def convertEncoding(from_encode,to_encode,old_filepath,target_file):
    f1=file(old_filepath)
    content2=[]
    while True:
        line=f1.readline()
        content2.append(line.decode(from_encode).encode(to_encode))
        if len(line) ==0:
            break

    f1.close()
    f2=file(target_file,'w')
    f2.writelines(content2)
    f2.close()



convertFile = open('4321.csv','r')
data = convertFile.read()
print chardet.detect(data)
if chardet.detect(data)['encoding']=='utf-8':
    convertFile.close()
    convertEncoding(chardet.detect(data)['encoding'], "ansi", "4321.csv", "4321_bak.csv")

エラー:

{'confidence': 0.99, 'encoding': 'utf-8'}
Traceback (most recent call last):
  File "/Users/allenlee/Desktop/convert/convert.py", line 24, in <module>
    convertEncoding(chardet.detect(data)['encoding'], "ansi", "4321.csv", "4321_bak.csv")
  File "/Users/allenlee/Desktop/convert/convert.py", line 8, in convertEncoding
    content2.append(line.decode(from_encode).encode(to_encode))
LookupError: unknown encoding: ansi
[Finished in 0.1s with exit code 1]

ご心配をありがとう。

8
BruceZhong

Python 標準エンコーディング にはansiエンコーディングはありません。

次のリンクから適切なエンコードを選択します。 標準エンコード

3
falsetru

OK、答えが見つかりました。@ falsetruに感謝します。

#coding:utf-8

import chardet

def convertEncoding(from_encode,to_encode,old_filepath,target_file):
    f1=file(old_filepath)
    content2=[]
    while True:
        line=f1.readline()
        content2.append(line.decode(from_encode).encode(to_encode))
        if len(line) ==0:
            break

    f1.close()
    f2=file(target_file,'w')
    f2.writelines(content2)
    f2.close()

convertFile = open('1234.csv','r')
data = convertFile.read()
convertFile.close()

convertEncoding(chardet.detect(data)['encoding'], "utf-8", "1234.csv", "1234_bak.csv")
3
BruceZhong