web-dev-qa-db-ja.com

Excelを読み取り、python 5行目からヘッダーを含むデータフレーム

pythonでデータフレームにExcelデータをインポートする方法。

基本的に、現在のExcelブックは、ピボットテーブルを更新し、その他の処理を実行するvbaを開くときに実行します。

次に、ピボットテーブルリフレッシュの結果をpythonのデータフレームにインポートして、さらに分析します。

import xlrd

wb = xlrd.open_workbook('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm')

#sheetnames
print wb.sheet_names()

#number of sheets
print wb.nsheets

ファイルの更新とオープンは正常に機能します。しかし、ヘッダーを含む最後のレコードnまでの行5の最初のシートからデータを選択するにはどうすればよいですか?.

15
IcemanBerlin

パンダのExcelFile parse メソッドを使用してExcelシートを読み取ることができます。 io docs を参照してください。

xls = pd.ExcelFile('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm')

df = xls.parse('Sheet1', skiprows=4, index_col=None, na_values=['NA'])

skiprowsは最初の4行を無視します(つまり、行インデックス4から開始します)。また、いくつかの その他のオプション

25
Andy Hayden

受け入れられた回答は古い(受け入れられた回答のコメントで説明されているように)。現在、優先オプションは pd.read_Excel() を使用しています

9
rrawat