web-dev-qa-db-ja.com

CSVファイル固有の列を抽出して、Python

私がやろうとしているのは、matplotlib、basemap、pythonなどを使用して特定の嵐の緯度と経度の値をプロットすることです。私の問題は、嵐の緯度、経度、および名前を抽出しようとしていることですマップしますが、リストに列を抽出しようとする行41〜44の間でエラーが発生し続けます。誰かがこれを理解するのを助けてくれますか?前もって感謝します。

ファイルは次のようになります。

1957,AUDREY,HU, 21.6N, 93.3W
1957,AUDREY,HU,22.0N,  93.4W
1957,AUDREY,HU,22.6N,  93.5W
1957,AUDREY,HU,23.2N,  93.6W

リストは次のようになります。

latitude = [21.6N,22.0N,23.4N]
longitude = [93.3W, 93.5W,93.8W]
name = ["Audrey","Audrey"]

ここに私が持っているものがあります:

data = np.loadtxt('louisianastormb.csv',dtype=np.str,delimiter=',',skiprows=1)
'''print data'''

data = np.loadtxt('louisianastormb.csv',dtype=np.str,delimiter=',',skiprows=0)

f= open('louisianastormb.csv', 'rb')
reader = csv.reader(f, delimiter=',')
header = reader.next()
zipped = Zip(*reader)

latitude = zipped[3]
longitude = zipped[4]
names = zipped[1]
x, y = m(longitude, latitude)

これが最後に受け取ったエラーメッセージ/トレースバックです。

トレースバック(最後の最後の呼び出し):
ファイル「/home/darealmzd/lstorms.py」の42行目

header = reader.next()
_ csv.Error:引用符で囲まれていないフィールドに改行文字があります-ファイルをユニバーサル改行モードで開く必要がありますか?

28
mikez1

これは、コードの行末の問題のように見えます。これらの他のすべての科学パッケージを使用する場合は、CSV読み取り部分に Pandas を使用することもできます。これは、csvモジュール:

import pandas
colnames = ['year', 'name', 'city', 'latitude', 'longitude']
data = pandas.read_csv('test.csv', names=colnames)

質問のようにリストが必要な場合は、次を実行できます。

names = data.name.tolist()
latitude = data.latitude.tolist()
longitude = data.longitude.tolist()
55
chthonicdaemon

標準ライブラリバージョン(パンダなし)

これは、csvの最初の行がヘッダーであると想定しています

import csv

# open the file in universal line ending mode 
with open('test.csv', 'rU') as infile:
  # read the file as a dictionary for each row ({header : value})
  reader = csv.DictReader(infile)
  data = {}
  for row in reader:
    for header, value in row.items():
      try:
        data[header].append(value)
      except KeyError:
        data[header] = [value]

# extract the variables you want
names = data['name']
latitude = data['latitude']
longitude = data['longitude']
37
Ben Southgate