こここブログ

機械学習, 統計分析, 競技プログラミング, CTF, VR, ……テクノロジーへの憧憬に身を焼かれている人のメモ帳です

2019-10-04から1日間の記事一覧

UnderSamplingで抽出したデータ以外の(使用しなかったindexの)データを取得

2019-10-04 公開 機械学習を行う際、正例(y = 1)と負例(y = 0)との割合が極端に偏っているケースがある。 割合が偏っていると、データの多い方を優先して予測してしまうことが多く、予測結果がすべてy = 0なんてことも。悲惨である。 そういう場合 多すぎる…