Kaggleでコンペを参加してみようと思っても、コンペが多くて選びづらかったり、Kaggleの形式に慣れるためにまずは簡単なコンペに参加してみたいな~と感じたことはありませんか?
この記事では、そんな方に向けて Kaggle のチュートリアルコンペについて紹介していきます!!
Kaggle の チュートリアルコンペ
Kaggleでは、取り扱うデータや予測対象によってチュートリアルになるコンペが用意されています!
メダルの付与はありませんが、その分期限に指定がないのでいつでも参加でき、過去に世界中の人が解いたコードやDiscussionが残っているのが魅力の一つです!!
テーブルコンペ(表形式データ)
まずは、テーブルコンペから紹介していきます!機械学習をやってみたいけど、どの分野をやりたいかは定まっていない人にはおすすめの分野です。
(理由としては、機械学習の知識がなくても この予測をしたいとすると、この特徴量(要素)が大きく関係するのではないか?といった予想が立てやすいので方針が立てやすいからです!)
タイタニック(2値分類)
タイタニックに乗客していた人の情報からその人がその後生き延びられたか 否かを 予想するコンペ
機械学習全体のチュートリアルと言っても過言はないのではといったテーマですね。タイタニックを例にチュートリアル本を出している物も多い印象です。
機械学習には大きく「分類」・「回帰」問題の2分類がありますがタイタニックは、「分類問題」のチュートリアルコンペです
住宅価格の予測 (回帰)
住宅のさまざまな要素(79要素)が与えられた上で、その価格を予測する「回帰問題」のコンペです。
画像コンペ
MNIST
画像分野ではかなり有名なチュートリアルです!
内容は 0 から 9 までの手書き数字を分類するというコンペです。
Train 画像 : 5万枚
Test 画像 : 1万枚
自然言語処理コンペ
Disaster Tweets
twitterのデータを用い、あるtweetが実際の災害に関するものか、否かを予測するコンペです!
強化学習コンペ
Connect X
Connect 4 や 重力つき4目並べ といった名前でも知られるボードゲームの ゲームAI を作成するというコンペです。
ルールとしては、「下段から順に積み上げるようにコマを置き、縦・横・斜めのいずれかで4コマ以上つながったほうが勝ち」というルールです!
おわりに
この記事では、Kaggleのチュートリアルコンペとして各分野ごとに1つのチュートリアルとなるコンペをまとめていきました!これらに続くコンペというのもあるので、それについても後にまとめていけたらと思います!
また、このブログでは、毎月 Kaggle の新コンペをまとめていますので、チュートリアルコンペが終わって、実際にやっているコンペに取り組みたい!という方は是非こちらも見てもらえたらと思います!!
コメント