本記事ではpandasのデータフレームとシリーズについて解説しています。目次は以下の通りです。
データフレームとは
データフレームはpandasのデータ構造の一つです。
これは二次元のデータ構造であり、データを行と列に整理してテーブルとして表示します。データフレームは、ゼロから作成することもできますし、NumPy配列などの他のデータ構造を利用することも可能です。構文としては次のようなものです。
pd.DataFrame("リスト名")
上ではリスト名と書いてありますが、辞書名やタプル名でも問題ないです。具体例を示しましょう。
import pandas as pd
data= [['Watanabe', 'Yamamoto', 'Nakamura'],
[25, 30, 22],
['Tokyo', 'Osaka', 'Fukuoka']]
df=pd.DataFrame(data)
print(df)
こちらを実行すると次のようになります。
シリーズとは
シリーズもpandasのデータ構造の一つです。
これはリストのように順序を持った一次元のデータ列であり、1つの観測対象に対して1つの測定値が含まれるデータを指します。
構文としては次のようなものです。
pd.Series("リスト名")
具体例を示しましょう。
import pandas as pd
data= ['Watanabe', 'Yamamoto', 'Nakamura']
name=pd.Series(data)
print(name)
まとめ
本記事ではデータフレームとシリーズについて学びました。
・データフレームは二次元のデータ構造
・シリーズは一次元のデータ構造
コメント