web-dev-qa-db-ja.com

Pythonのバイナリファイルからのデータの読み取りと解釈

バイトごとにファイルを読み取り、各バイトの最後のビットが設定されているかどうかを確認したい:

#!/usr/bin/python

def main():
    fh = open('/tmp/test.txt', 'rb')
    try:
        byte = fh.read(1)
        while byte != "":
            if (int(byte,16) & 0x01) is 0x01:
                print 1
            else:
                print 0
            byte = fh.read(1)
    finally:
        fh.close

    fh.close()

if __name__ == "__main__":
        main()

私が得るエラーは:

Traceback (most recent call last):
  File "./mini_01.py", line 21, in <module>
    main()
  File "./mini_01.py", line 10, in main
    if (int(byte,16) & 0x01) is 0x01:
ValueError: invalid literal for int() with base 16: '\xaf'

誰でもアイデア? structおよびbinasciiモジュールの使用に成功しませんでした。

23
dubbaluga

ordの代わりにintを使用したい場合:

if (ord(byte) & 0x01) == 0x01:
8
nmichaels

bytearray タイプ(Python 2.6以降)を使用してみてください。バイトデータの処理に適しています。 tryブロックは次のようになります。

ba = bytearray(fh.read())
for byte in ba:
    print byte & 1

または結果のリストを作成するには:

low_bit_list = [byte & 1 for byte in bytearray(fh.read())]

これは、bytearrayにインデックスを付けると整数(0〜255)を返すだけであるのに対して、ファイルからバイトを読み取るだけの場合は単一の文字列を返すため、使用する必要があるため ord 整数に変換します。


ファイルが大きすぎてメモリに快適に保持できない場合(そうではないと思いますが)、 mmap はバッファからbytearrayを作成するために使用されます:

import mmap
m = mmap.mmap(fh.fileno(), 0, access=mmap.ACCESS_READ)
ba = bytearray(m)
40
Scott Griffiths

一方通行:

import array

filebytes= array.array('B')
filebytes.fromfile(open("/tmp/test.txt", "rb"))
if all(i & 1 for i in filebytes):
    # all file bytes are odd

別の方法:

fobj= open("/tmp/test.txt", "rb")

try:
    import functools
except ImportError:
    bytereader= lambda: fobj.read(1)
else:
    bytereader= functools.partial(fobj.read, 1)

if all(ord(byte) & 1 for byte in iter(bytereader, '')):
    # all bytes are odd
fobj.close()
4
tzot