こここブログ

VR・AR・MR(XR)、仮想通貨・ブロックチェーン、Pythonなど。VRエンジニアになりたくてUnity触ってます。

kaggle超初心者が第一歩を踏み出すために参考にした7つの記事・動画

(投稿:2018/08/30|更新:

f:id:kokokocococo555:20180830161253j:plain

画像:広島県の大久野島で撮影。うさぎ。

前から興味のあった「kaggle」。

以下の記事を目にして改めて「始めねば」と思い立ち、まずはネットで情報収集をしました。

wired.jp

そこでkaggle第一歩を踏み出すために参考にした記事をまとめました

これらに目を通せばkaggleのやる気が出るし、実際に始められるはずです。

目次

kaggle超初心者が読むと良い記事7種類

kaggleに興味だけはあるけど、何から手をつければいいのかさっぱりだ!

という方はこれらの記事・サイトを読めば

  • kaggleの概要
  • 参加の仕方
  • どうやって戦っていくか
  • モチベーションの高め方
  • 環境構築

について分かり、晴れてkaggler「カグラ―」としてスタートできることでしょう。

※以下はgoogleで「kaggle」と検索して上位表示されたサイトがほとんどです。実際、ためになる記事ばかりでした。それらを読んで印象をまとめたのが本記事です。

1. まずはkaggleについて知る

www.codexa.net

「kaggleって聞いたことあるし、なんとなく興味あるけど、実際なんなの?」って人にぴったりな記事です。

以下のような内容が解説されています。

  • kaggleの特徴や意義、第一歩の踏み出し方の詳細な解説
  • 初心者が何をするべきか
  • まずはkernelsを使ってひたすら実践するのがおすすめ

2. やる気をもらう

www.rco.recruit.co.jp

タイトル通り、著者の松田氏が3ヶ月間でkaggleに記録を残した軌跡です。

kaggleにのめり込む様子が垣間見えてやる気が出ますね!

 「メダルなんてあるんだ!楽しそう!」(小並感)。

3. 自分でも楽しめるかもと感じる

www.topgate.co.jp

kaggleの1つのコンペ内でスコアを上げるための試行錯誤の様子が勉強になります。

「超一流の研究者で最先端の手法をバリバリ駆使する」ような人以外でも十分戦える、楽しめるということを感じさせてもらえる素敵な記事です。

4. kaggleの立ち位置・挑み方を知る

catindog.hatenablog.com

  • kaggleが世でどのような立ち位置なのか
  • やる気的な意味での始め方

について勉強になりました。

エンジニアっぽい文体、良いですね。

5. 実際にデータを分析してみる

qiita.com

データ分析の際のデモデータとしてよく使われる「タイタニック号」データ*1を用いたkaggleのコンテストについて、実際の分析の流れがコードとともに解説されています。
コンテストの人気kernelの日本語での解説、といったところでしょうか。

よく使うライブラリのインポートやデータの読み込みから丁寧な解説。
すぐに分析にかけるのではなく、まずはデータと触れ合う(特徴量を確認したり、生データを見てみたり、基礎統計量を確認したり)ところから始められています。

生データをじっくりと眺めること・データをうまく前処理することはデータ分析でめちゃくちゃ重要、といろんな人が言っています。
しかし、それらの「分析の前のノウハウ」はなかなか学べる機会がありません。
そのため、このQiita記事のように先人の処理を順番になぞってみるのはとても意義があります。

なにより、各コードは他のコンテストでも使い回せます。
分析の枠組みを作っておく、という意味でも自分のJupyterNotebookで実行してみましょう。

6. データ分析用の環境を整える

www.youtube.com

Takami Sato氏(@tkm2261)のkaggleへの具体的な取り組み手順を動画で見ることができます。便利な時代ですね。

データ分析環境に最近流行りのクラウドサービスの1つ、「Google Cloud Platform(GCP)」を使用しており、そのための環境構築も解説されています。

いいですね。IaaSとか触ってみたかったんですよ。

7. Google Cloud Platform(GCP)について知る

「Google Cloud Platform(GCP)」についてもっと知りたい!動画じゃなくて文章で理解したい!という方にはこちらを。

www.topgate.co.jp

さいごに

ひとまずアカウントを作りました。

あとは一歩を踏み出すだけ!まずは有名なタイタニック号データの分析に挑戦です!

>> Titanic: Machine Learning from Disaster | Kaggle

以下Qiitaを見ながら実践してみましょう!

再掲

qiita.com

関連記事

kaggleについて分かっても、どのコンペに取り組めばいいのか分かりませんよね。
ということで、kaggleのコンペの分類についてまとめました。

www.kokokocococo555.com

(おしまい)

他の記事のご紹介

Qiitaにも記事を投稿しています。

qiita.com

www.kokokocococo555.com

実践中の取り組みについてご紹介しています。

www.kokokocococo555.com

他にもプログラミングに関連した記事も書いています。

www.kokokocococo555.com

「こここブログ」について

雑記ブログです。フリーランス、プログラミング、読書、ゲーム等、テーマは興味に任せてとっちらかっています。

読者登録して気にかけていただけるととても嬉しいです。
ぜひぜひ。

 

*1:kaggleでも「Getting Started」と分離されており、入門にぴったりですね。

※コンテストの分類について >> kaggle初心者はどのコンペに参加すべき?コンペの7分類を紹介 - こここブログ