けむブログ

データ分析に関する気付きや学びを記録するブログ

2018-08-01から1ヶ月間の記事一覧

多重共線性について調べたメモ

多重共線性とは モデル内の独立変数が他の独立変数と相関しているときに起こる状態 多重共線性が起きると 多重共線性があると、逆行列の計算の部分で、いわゆる「ゼロ割」(分母に0が来る)問題が発生 jojoshin.hatenablog.com 解決策 まず相関行列で確認す…

【pythonでの前処理】データの正規化、標準化する方法

データの正規化の方法 単体?か、ベクトル単位によって大きく二通りある 単体の場合:二種類ある データの加算平均が0、分散が1になるように調整する(z-score noramalization(標準化)) データの最小値が0、最大値が1となるように調整する(min-max normali…