本記事ではpandasについて解説しています。目次は以下の通りです。
pandasとは
pandasとはデータ分析や機械学習に用いられるモジュールです。
表形式のデータにおいて前処理ができるという特徴があります。pandasのメリットとしては異なる型のデータを一つの表として扱える点にあります。これにより異なる型のデータを含むデータの前処理が効果的に行えます。またpandasが豊富なデータ加工や解析関数を提供していることから、欠損値の処理などができ、データの加工や解析が容易に行えます。
処理として以下のものがあります。
・データ同士の結合
・csvファイルの読み込み、書き出し
・時系列データの処理
などなどたくさんあります。
pandasのインストールの仕方
外部モジュールのためインストールしないといけないです。インストールするときは
pip install pandas
となります。
コードで使用する際インポートしないといけないので、以下のようにインポートします。
import pandas as pd
これはpandasをpdとしてインポートしますよ、っていう意味になります。ここで、
import pandas
でもいいんじゃないって考える人もいるかと思います。実際as pdはつけてもつけなくても実行はできます。ようはNumPyのときと同じですね。
まとめ
本記事ではpandasについて学びました。
・pandasは外部モジュールの一つ
・データ分析や機械学習に用いられる
・インポートの仕方はimport pandas as pd
コメント