本記事ではpandasを用いてデータフレームをcsvに書き出す方法について解説しています。目次は以下の通りです。
データフレームとは
データフレームはpandasのデータ構造の一つです。
これは二次元のデータ構造であり、データを行と列に整理してテーブルとして表示します。データフレームは、ゼロから作成することもできますし、NumPy配列などの他のデータ構造を利用することも可能です。
構文としては次のようなものです。
pd.DataFrame("リスト名")
上ではリスト名と書いてありますが、辞書名やタプル名でも問題ないです。今回csvに書き出すデータフレームを示します。
import pandas as pd
data= {'Name':['Watanabe', 'Yamamoto', 'Nakamura','Kobayashi','Kato','Yoshida','Yamada','Sasaki','Yamaguchi','Matsumoto'],
'ID':['01','02','03','04','05','06','07','08','09','10'],
'Age':[25, 30, 22, 24, 23, 27, 24, 31, 32, 26],
'Area':['Tokyo', 'Osaka', 'Fukuoka','Tokyo', 'Fukuoka', 'Osaka', 'Fukuoka','Tokyo','Osaka','Tokyo']}
df=pd.DataFrame(data)
print(df)
こちらを実行すると次のようになります。
列には名前、ID、年齢、地区を示しています。ちなみに辞書型にしたの列名を表示させるためです。こちらのデータをもとにcsvファイルを書き出していきます。
csvを書き出す方法
データフレームからcsvを書き出す構文を次に示します。
"データフレーム名".to_csv("ファイル名.csv")
別のディレクトリー(フォルダ)に保存したい場合は
"データフレーム名".to_csv("ファイルパス")
となります。
上の具体例を用いると次のようになります。
import pandas as pd
data= {'Name':['Watanabe', 'Yamamoto', 'Nakamura','Kobayashi','Kato','Yoshida','Yamada','Sasaki','Yamaguchi','Matsumoto'],
'ID':['01','02','03','04','05','06','07','08','09','10'],
'Age':[25, 30, 22, 24, 23, 27, 24, 31, 32, 26],
'Area':['Tokyo', 'Osaka', 'Fukuoka','Tokyo', 'Fukuoka', 'Osaka', 'Fukuoka','Tokyo','Osaka','Tokyo']}
df=pd.DataFrame(data)
df.to_csv("namelist.csv")
そうするとcsvファイルが作成されます。
まとめ
本記事ではポイントを以下にまとめます。
・データフレーム生成は辞書でも可能
・csvを書き出すときは.to_csv()
コメント