web-dev-qa-db-ja.com

save a pandas dataframe to pickleとcsvの違いは何ですか?

python pandasを学習しています。pandasデータフレームを保存する2つの方法を示すチュートリアルが表示されます。

  1. pd.to_csv('sub.csv')および開くpd.read_csv('sub.csv')

  2. pd.to_pickle('sub.pkl')および開くpd.read_pickle('sub.pkl')

チュートリアルによると、to_pickleはデータフレームをディスクに保存することです。私はこれについて混乱しています。 to_csvを使用すると、csvファイルがフォルダーに表示されるのがわかりました。これもディスクに保存されていると思いますか?

一般に、csvやtxt、またはその他の形式で保存するのではなく、to_pickleを使用してデータフレームを保存したいのはなぜですか?

11
KevinKim

Pickleは、Pandasデータフレームを保存するシリアル化された方法です。基本的には、データフレームの正確な表現をディスクに書き込みます。これは、列のタイプが同じで、インデックスが同じであることを意味します。ファイルをcsvとして保存するだけの場合は、ファイルをコンマ区切りのリストとして保存するだけです。データセットによっては、ファイルを再度読み込むと一部の情報が失われます。

https://docs.python.org/3/library/pickle.html

14
Gabriel A