ゼロからはじめる機械学習講座「Kaggleに挑戦」

zoomを使用してのオンライン講座となります
Numpy,Pandasライブラリを使って機械学習のデータ処理を体験し、線形回帰の問題を解いていきます。
ラストは学んだことを活かして、Kaggleに挑戦してみましょう。

【対象者】

エンジニア歴1年以上の方。
プログラミング初心者は「ゼロからはじめるパイソン入門講座」をオススメします。

【ご用意いただくもの】

・PC
・zoom
・言語はPythonを使います。

【今回学ぶこと】

・numpyライブラリ
・matplotlibライブラリ
・ヒストグラム
・データフレーム
・データ分析
・要約統計量を表示する
・単回帰分析
・散布図の上に計算した回帰係数と切片が示す直線を上書き表示
・モデルの決定係数
・Kaggle にチャレンジ

●テックジムのAIコースでは、以下「続き」がございます。

第2章「特徴量エンジニアリング」
第3章「回帰問題」
第4章「分類問題」
第5章「実践ビジネスデータ分析」
第6章「AIのための統計学入門」
第7章「DeepLearning基礎」
第8章「DeepLearning応用」
第9章「GANによる画像生成とRNN/LSTMによる自然言語処理」
第10章「衛星データと機械学習」
第11章 「アンサンブル学習と精度向上手法」
第12章「機械学習でオリジナル画像判定アプリをつくる」
第13章「AI x IoT(センサーデータ分析と画像分類・物体検出)」
第14章「効果検証に機械学習を導入しよう」
第15章「推薦システムを作ろう」

最新イベントはこちら

機械学習メール講座(無料)

●AIエンジニア養成コースのカリキュラム概要。制作者からのメッセージ

Kaggleはデータサイエンティストへの最速の近道。そして一攫千金も。

Kaggle(カグル)は企業や研究者がデータを投稿し、それに対して、統計家やデータ分析家がその最適モデルを競い合う、予測モデリング・分析手法のプラットフォームで、2010年に設立。そして2017年にはGoogleが数百億円で買収しました。

100万人のカグラーが一攫千金を求めてカグルに登録

カグルの仕組みは、企業や政府などの組織がコンペを開催、それに対して、データサイエンティストや機械学習エンジニアが最適モデルを提案。賞金と引き換えに最も制度の高い分析モデルを買い取るという「クラウドファンディング」の仕組みです。

現在、開催されいるコンペを見てみると、賞金は250万円から1000万円ぐらいまでのコンペがひしめいていますが、3億円の賞金のコンペもあったようです。

https://www.kaggle.com/competitions

コンペの分野はさまざまで、HIV研究、チェス格付け、交通量予測、空港のセキュリティなどなど。
日本企業の例ですと、メルカリが販売者が投稿した情報を基に「適正な販売価格」を予測するチャレンジを開催しました。

Kaggleの中でも特に有名な課題として「タイタニック号:災害からの機械学習)」があります。

なお、コンペ参加費用は無料で、企業から提供されているトレーニング用のデータセットを利用して、モデルの訓練を行います。

チャンスは1日5回。リアルタイムで評価スコアがわかる!!

各データセットには、他のユーザーが構築した予測モデルのコードや説明が公開されています。
それは「Kernels(カーネル)」という機能で閲覧できます。

また、「Discussion(ディスカッション)」はカグラーたちのコミュニティ機能で、そこで質問したり、情報交換をすることができます。

データの投稿は、予測されたデータのファイル(CSV形式)だけのときや、モデルのコードのカーネルの提出が必要な時があります。

予測データの投稿後は、リアルタイムで評価がつきます。
このスコアをあげていき、コンペを勝ちあがりましょうということになります。
なお、予測データの投稿は1日5回までです。


初心者の方でもカーネルで公開されている処理コードを読むことで、最先端のデータサイエンティストに近くことができますので、Kaggleは機械学習の勉強の場としても有意義です。

爆速でデータサイエンティストになるためにはKaggleが近道

Kaggleをやることでデータサイエンティストになるために必要なスキルを身に付けることができます。

データサイエンティストになるには、機械学習の理論や数学・統計に関する学習、データを見極めたり、モデルを作成する作業、そしてコーディングスキルが必要とされています。

しかしながら、Kaggleを始めるだけならそれは不要で、プログラミング言語を始めるのと同じ感覚で、他のカグラーの分析手法を見ていれば、自ずと上記のスキルが身につくようです。

プログラミング経験がない人でも、カグルをやって3ヶ月で「ソロゴールド」という称号を得た人もいます。

機械学習の勉強歴が半年の初心者で、Kaggleで銅メダルを取得した方のブログによると、注目した視点は、入力データを改変する“前処理”と、他者が提案したモデルを良いとこ取りする“モデルの流用”とのことです。

これを読む限りでも、カグラー同士でマッシュアップされていく世界観が彷彿とされており、カグルの最大の魅力といえましょう。

【講義動画】

テキストはメール講座で配布しております。

機械学習メール講座(無料)

AIエンジニア養成コース(機械学習・ディープラーニング)の概要