Seaborn load_dataset

Question

例に従ってSeabornを使用してグループ化された箱ひげ図を取得しようとしています

上記の例を動作させることができますが、次の行：

tips = sns.load_dataset("tips")

まったく説明されていません。 tips.csvファイルを見つけましたが、load_datasetが具体的に何をするかについての適切なドキュメントを見つけることができないようです。私は自分のcsvを作成してこれをロードしようとしましたが、役に立ちませんでした。また、tipsファイルの名前を変更しましたが、まだ機能していました...

したがって、私の質問は次のとおりです。

load_dataset実際にファイルを探していますか？これを自分の箱ひげ図に実際に使用できますか？

編集：私は自分のDataFrameを使用して自分のボックスプロットを動作させることができましたが、load_datasetは、謎めいたチュートリアルの例以外にも使用されます。

selwyth · Accepted Answer

_load_dataset_は https://github.com/mwaskom/seaborn-data でオンラインのCSVファイルを探します。 docstringは次のとおりです。

オンラインリポジトリからデータセットをロードします（インターネットが必要です）。

パラメーター

name：strデータセットの名前（name。csv on https://github.com/mwaskom/seaborn-data ）。：func：_get_dataset_names_を使用して、利用可能なデータセットのリストを取得できます。

kws：dict、オプションpandas.read_csvに渡されます

そのオンラインデータセットを変更するか、独自のデータを取り込む場合は、おそらく pandas を使用する必要があります。 _load_dataset_は、実際にpandas DataFrameオブジェクトを返します。これは、type(tips)で確認できます。

たとえば、tips2.csvという名前のcsvファイルに独自のデータを作成し、スクリプトと同じ場所に保存した場合は、これを使用して（pandasをインストールした後）ロードします。

_import pandas as pd tips2 = pd.read_csv('tips2.csv') _

Sahil Nagpal · Answer

「セルウィス」の答えに追加するだけです。

import pandas as pd Data=pd.read_csv('Path	o\csv\') Data.head(10)

これらの手順を正常に完了したら。これで、プロットは実際に次のように機能します。

バープロットをプロットするとします。

sns.barplot(x=Data.Year,y=Data.Salary) //year and salary attributes were present in my dataset.

これは、実際にシーボーンのすべてのプロットで機能します。

さらに、Seaborn Gitに独自のデータセットを追加する資格はありません。

raahool007 · Answer

例からここに使用するすべてのcsvファイル（zip形式）をダウンロードします。

Zipファイルをローカルディレクトリに抽出し、同じディレクトリからjupyterノートブックを起動します。 jupyter Notebookで次のコマンドを実行します。

import pandas as pd tips = pd.read_csv('seaborn-data-master/tips.csv')

あなたは今あなたの例を使って作業するのが良いです！