web-dev-qa-db-ja.com

UnicodeDecodeError: 'ascii'コーデックは位置0のバイト0xe0をデコードできません:順序は範囲外(128)

私のマシンの1つで、Google Apps EngineまたはDjangoを使用しているときにエラーが発生します。

例えば:

  • app.yaml

    application: demas1252c
    version: 1
    runtime: python
    api_version: 1
    
    
    handlers:
       - url: /images
    static_dir: images
       - url: /css
    static_dir: css
       - url: /js
    static_dir: js
       - url: /.*
    script: demas1252c.py
    
  • demas1252c.py

    import cgi
    import wsgiref.handlers
    
    
    from google.appengine.ext.webapp import template
    from google.appengine.ext import webapp
    
    
    class MainPage(webapp.RequestHandler): 
    def get(self):
    values = {'id' : 10}
    
    
    self.response.out.write(template.render('foto.html', values))
    
    
    application = webapp.WSGIApplication([('/', MainPage)], debug = True)
    wsgiref.handlers.CGIHandler().run(application)
    
  • foto.html

    <!DOCTYPE html>
    <html lang="en">
        <head></head>
    <body>some</body>
    </html>
    

エラーメッセージ:

C:\artefacts\dev\project>"c:\Program Files\Google\google_appengine\dev_appserver.py" foto-hosting
Traceback (most recent call last):
  File "c:\Program Files\Google\google_appengine\dev_appserver.py", line 69, in <module>
    run_file(__file__, globals())
  File "c:\Program Files\Google\google_appengine\dev_appserver.py", line 65, in run_file
    execfile(script_path, globals_)
  File "c:\Program Files\Google\google_appengine\google\appengine\tools\dev_appserver_main.py", line 92, in <module>
    from google.appengine.tools import dev_appserver
  File "c:\Program Files\Google\google_appengine\google\appengine\tools\dev_appserver.py", line 140, in <module>
    mimetypes.add_type(mime_type, '.' + ext)
  File "C:\Python27\lib\mimetypes.py", line 344, in add_type
    init()
  File "C:\Python27\lib\mimetypes.py", line 355, in init
    db.read_windows_registry()
  File "C:\Python27\lib\mimetypes.py", line 260, in read_windows_registry
    for ctype in enum_types(mimedb):
  File "C:\Python27\lib\mimetypes.py", line 250, in enum_types
    ctype = ctype.encode(default_encoding) # omit in 3.x!
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe0 in position 0: ordinal not in range(128)

Django(gaeなし))で静的ファイルを操作しているとき、非常によく似たエラーがあります(異なるスタックで)。

エラーの原因を見つけようとし、mimetypes.pyにコードを追加しました。

print '====='
print ctype
ctype = ctype.encode(default_encoding) # omit in 3.x!

次に、コンソールに次のメッセージが表示されます。

=====
video/x-ms-wvx
=====
video/x-msvideo
=====
рєфшю/AMR
Traceback (most recent call last):

レジストリにHKCR/Mime/Database/ContentType /にロシア語(キリル文字)の5つのキーがあります。しかし、どうすればこのエラーを修正できますか?

34
demas

これはmimetypesのバグで、レジストリ内の不正なデータによって引き起こされます。 (рєфшю/AMRは有効なMIMEメディアタイプではありません。)

ctype_winreg.EnumKeyによって返されるレジストリキー名です。mimetypesはUnicode文字列であると想定されていますが、そうではありません。 _winreg.QueryValueExとは異なり、EnumKeyはバイト文字列を返します(ANSIバージョンのWindows APIから直接; _winreg in Python 2は使用しませんUnicode文字列を返すにもかかわらず、Unicodeインターフェイスは、非ANSI文字を正しく読み取ることはありません)。

したがって、.encodeの試行はUnicodeで失敗しますDecode

try:
    ctype = ctype.encode(default_encoding) # omit in 3.x!
except UnicodeEncodeError:
    pass

mimetypesのこれらの行は単に削除する必要があります。

ETA: バグトラッカーに追加

75
bobince

ところで、問題の主な原因は、非ASCII MIMEタイプをWindowsレジストリに追加するQuickTimeです。これを修正する最も簡単な方法は、HKCR/Mime/Database/ContentType/およびаудио/で始まるвидео/のサブセクションを手動で見つけてレジストリから削除することです。

8
newtover

パッチがあります:

http://bugs.python.org/file18143/9291.patch

私には最適です。

UnicodeEncodeErrorをUnicodeErrorに置き換えるだけです

5
Wangsu

Alexandr Zarubkinによるpython issue9291(me21) の代替ソリューション

lib\site-packagesフォルダーにsitecustomize.pyという名前のファイルを追加します。

import sys
sys.setdefaultencoding("cp1251")
4
HaveF

そのa pythonレジストリ内のラテンMIMEヒントのバグはregeditを起動し、非ラテン名について「HKEY_CLASSES_ROOT\MIME\Database\Content Type」を検査します。

1
Codeboy.ru