Kaggleは、約 100 万人以上の方が利用している世界最大のデータサイエンスコンペティションプラットフォームで、企業や政府等がコンペティション形式で課題を提示し、参加者がその課題に挑戦する形式になっていて、優れた回答を提示したと判断されると報酬が支払われる仕組みになっている。
今回は、Kaggleのアカウント登録を行い、Notebook上でタイタニックコンペの入力ファイルを読み込んでみたので、その手順を共有する。
前提条件
Kaggle登録用のGoogleアカウントがあること。
やってみたこと
Kaggleのユーザー登録
Kaggleのユーザー登録は、無料で行える。Googleアカウントを利用してKaggleに登録する手順は、以下の通り。
1) 以下のサイトにアクセスし、「Register with Google」ボタンを押下する。
https://www.kaggle.com/
5)「Edit」リンクを押下する。なお、メール配信する場合はチェックボックスにチェックを入れる。
6) USERNAMEを入力し、「Next」ボタンを押下する。
7) 規約情報を確認し、「I Agree」ボタンを押下する。
8) 以下のように、Kaggleにユーザー登録しログインできたことが確認できる。
9) 画面左にカーソルを当てると、以下のように、メニューが表示されることが確認できる。
ログアウト・ログイン
Kaggleへのログアウト・ログインを行う手順は、以下の通り。
3) 以下のように、ログアウトされたことが確認できる。ログインするには、「Sign In」ボタンを押下する。
4)「Sign in with Google」ボタンを押下する。
5) 以下のように、Kaggleにログインできたことが確認できる。
Kaggleコンペでコードを実行
ここでは、Kaggleのタイタニックコンペにアクセスし、入力ファイルのデータを確認する。その手順は、以下の通り。
1) Kaggleのメニューから「Competitions」を選択する。
2) Kaggleコンペの一覧から、タイタニックコンペを選択する。
3) 以下のように、Overviewタブが選択され、タイタニックコンペの概要が表示されることが確認できる。
4)「Data」タブを選択すると、タイタニックコンペで利用するデータが確認できる。
5)「Code」タブを選択すると、コードを書くための「+ New Notebook」ボタンが押下できるため、このボタンを押下する。
6) 以下のように、ソースコードを入力できる画面が表示されることが確認できる。
7) Inputの「COMPETITIONS」の「Titanic」を開くと、インプットファイルの表示が確認できる。
8) 既に表示されているプログラムの実行ボタンを押下すると、以下のように、実行結果が表示されることが確認できる。ここで「+ Code」ボタンを押下する。
9) 以下のように、赤枠のソースコード入力欄が追加されることが確認できる。
10) 入力ファイルの中身を表示するには、以下の赤枠のように、Pandasのread_csvメソッドを利用する。
11) 以下のように、入力ファイルの中身を抜粋して表示することができる。ここでNotebookを保存するため、「Save Version」ボタンを押下する。
12) 今回は保存するだけなので、「Quick Save」を指定し「Save」ボタンを押下する。
13) 保存が完了すると、以下のように、左下の赤枠部分に保存が完了した旨が表示される。
保存したNotebookの再表示
先ほど保存したNotebookを再表示する手順は、以下の通り。
1)「Competitions」メニューを選択後、「Your Work」ボタンを押下する。
2)「Overview」タブを表示すると、保存したNotebookが一覧に表示されるため、表示された一覧を選択する。
3) 保存したNotebookが参照モードで表示されることが確認できる。Notebookを編集するには、「Edit」ボタンを押下する。
4) 以下のように、Notebookの編集画面が再表示されることが確認できる。
要点まとめ
- Kaggleは、約 100 万人以上の方が利用している世界最大のデータサイエンスコンペティションプラットフォームで、企業や政府等がコンペティション形式で課題を提示し、参加者がその課題に挑戦する形式になっている。