本記事ではpandasを用いてデータフレームをexcelに書き出す方法について解説しています。目次は以下の通りです。
データフレームとは
データフレームはpandasのデータ構造の一つです。
これは二次元のデータ構造であり、データを行と列に整理してテーブルとして表示します。データフレームは、ゼロから作成することもできますし、NumPy配列などの他のデータ構造を利用することも可能です。
構文としては次のようなものです。
pd.DataFrame("リスト名")
上ではリスト名と書いてありますが、辞書名やタプル名でも問題ないです。今回csvに書き出すデータフレームを示します。
import pandas as pd
data= {'Name':['Watanabe', 'Yamamoto', 'Nakamura','Kobayashi','Kato','Yoshida','Yamada','Sasaki','Yamaguchi','Matsumoto'],
'ID':['01','02','03','04','05','06','07','08','09','10'],
'Age':[25, 30, 22, 24, 23, 27, 24, 31, 32, 26],
'Area':['Tokyo', 'Osaka', 'Fukuoka','Tokyo', 'Fukuoka', 'Osaka', 'Fukuoka','Tokyo','Osaka','Tokyo']}
df=pd.DataFrame(data)
print(df)
こちらを実行すると次のようになります。
列には名前、ID、年齢、地区を示しています。
ちなみに辞書型にしたの列名を表示させるためです。こちらのデータをもとにexcelファイルを書き出していきます。このエクセルファイルの拡張子はxlsxとする。
excelを書き出す方法
データフレームからexcelを書き出す構文を次に示します。
"データフレーム名".to_excel("ファイル名.xlsx")
別のディレクトリー(フォルダ)に保存したい場合は
"データフレーム名".to_excel("ファイルパス")
となります。
上の具体例を用いると次のようになります。
import pandas as pd
data= {'Name':['Watanabe', 'Yamamoto', 'Nakamura','Kobayashi','Kato','Yoshida','Yamada','Sasaki','Yamaguchi','Matsumoto'],
'ID':['01','02','03','04','05','06','07','08','09','10'],
'Age':[25, 30, 22, 24, 23, 27, 24, 31, 32, 26],
'Area':['Tokyo', 'Osaka', 'Fukuoka','Tokyo', 'Fukuoka', 'Osaka', 'Fukuoka','Tokyo','Osaka','Tokyo']}
df=pd.DataFrame(data)
df.to_csv("namelist.xlsx")
そうするとexcelファイルが作成されます。
sheetnameの変更
csvファイルと違う点はシート名を変更することができる点です。
シート名を変更する構文は次のようになります。
"データフレーム名".to_excel("ファイル名.xlsx",sheet_name='シート名')
まとめ
本記事ではポイントを以下にまとめます。
・データフレーム生成は辞書でも可能
・excelを書き出すときは.to_excel()
・sheet名を変更することができる
コメント