本記事ではMAEとMSEとRMSEについて解説しています。
目次は以下の通りです。
MAEとは
MAE(Mean Absolute Error)は、平均絶対値誤差とも呼ばれる統計的な指標で、回帰モデルの評価に使用されます。この指標は、実際の値と予測値の差を絶対値として取り、それらの誤差の平均を計算します。MAEの利点の一つは、外れ値(異常値)の影響を受けにくいことであり、これは統計的なモデルの評価において信頼性の高い指標とされています。
公式は以下のようになります。
$$ MAE=\frac{1}{n}\sum^n\limits_{i=1}|y_{i}-\hat{y}_{i}| $$
ただし、$$ nは要素数、y_{i}は実際の値、\hat{y}_{i} $$は予測値とします。
MSEとは
MSE(Mean Squared Error)は、平均二乗誤差とも呼ばれる統計的な指標で、回帰モデルの評価に利用されます。この指標は、実際の値と予測値の差を取り、それを二乗してから平均を計算したものです。誤差が大きい場合、MSEの値も大きくなります。しかし、MSEの特徴として、誤差の単位が二乗になるため、単純に他の指標(例:MAEなど)と比較することが難しい点があります。
公式は以下のようになります。
$$ MSE=\frac{1}{n}\sum^n\limits_{i=1}(y_{i}-\hat{y}_{i})^2 $$
ただし、$$ nは要素数、y_{i}は実際の値、\hat{y}_{i} $$は予測値とします。
RMSEとは
RMSE(Root Mean Squared Error)は、二乗平均平方根誤差とも呼ばれ、回帰モデルの評価指標の一つです。RMSEはMSE(Mean Squared Error)の平方根を取ったものであり、誤差が大きいほどMSEと同様にRMSEも大きくなります。しかし、RMSEの特徴として外れ値が存在する場合、外れ値の影響を受けやすい点があります。つまり、予測値の中に一つでも大きな値が含まれていると、RMSEが大きくなる傾向があります。
公式は以下のようになります。
$$ RMSE=\sqrt{MSE} $$
決定係数とは
決定係数は、平均と比べて回帰モデルが実際のデータにどれだけ近づいているかを示す指標で、寄与率とも呼ばれます。この値は1に近いほど、回帰式が実際のデータに非常に適合していることを示し、データの変動の大部分がモデルによって説明されていることを示唆します。
公式は以下のようになります。
$$ R^2=1-\frac{MSE}{s^2} $$
ただし、$$ s^2は分散 $$とします。
まとめ
本記事ではMAEとMSEとRMSEについて説明しました。
MAEは、実際の値と予測値の差を絶対値として取り、それらの誤差の平均を計算した指標です。MSEは、実際の値と予測値の差を二乗し、それらの誤差の平均を計算した指標です。RMSEは、MSEの平方根を取った指標です。
コメント