【Python】データフレームとシリーズについて学ぼう

python

本記事ではpandasのデータフレームとシリーズについて解説しています。目次は以下の通りです。

データフレームとは

データフレームはpandasのデータ構造の一つです。
これは二次元のデータ構造であり、データを行と列に整理してテーブルとして表示します。データフレームは、ゼロから作成することもできますし、NumPy配列などの他のデータ構造を利用することも可能です。構文としては次のようなものです。

pd.DataFrame("リスト名")

上ではリスト名と書いてありますが、辞書名やタプル名でも問題ないです。具体例を示しましょう。

import pandas as pd
data= [['Watanabe', 'Yamamoto', 'Nakamura'],
        [25, 30, 22],
       ['Tokyo', 'Osaka', 'Fukuoka']]
df=pd.DataFrame(data)
print(df)

こちらを実行すると次のようになります。

シリーズとは

シリーズもpandasのデータ構造の一つです。
これはリストのように順序を持った一次元のデータ列であり、1つの観測対象に対して1つの測定値が含まれるデータを指します。
構文としては次のようなものです。

pd.Series("リスト名")

具体例を示しましょう。

import pandas as pd
data= ['Watanabe', 'Yamamoto', 'Nakamura']
name=pd.Series(data)
print(name)

まとめ

本記事ではデータフレームとシリーズについて学びました。

・データフレームは二次元のデータ構造
・シリーズは一次元のデータ構造

コメント

タイトルとURLをコピーしました