AIエンジニア養成コース(機械学習・ディープラーニング)の概要

いつでも通える!
どんなレベルからでもOK!
ジム型プログラミング塾「TechGYM」

AIコースのゴールイメージ

AIエンジニア養成コースを習得するとこんな案件ができるようになります。
裏にどんな技術が使われているのか、後半のカリキュラムもご覧ください。

<想定案件イメージ>

・問い合わせ自動応答システム(チャットボット)
・オススメの映画やアニメを推薦してくれるシステム
・多言語の同時翻訳システム
・工場での不良品検知
・会員ビジネスでの入会予測、継続率予測、退会予測
・店舗売上予測(需要予測)
・営業売上予測
・不動産の価格予測
・顧客がある商品を買うか買わないかを予測
・市街地の地形から繁盛店になるかを予測
・石油タンクの減り具合から原油価格を予測
・センサーデータを用いた電力需要予測
・顧客分析(セグメントに分けたマーケティング)
・視聴率分析/選挙分析/アンケート分析
・画像分類/顔認識
・自動運転
・音声検索/音声操作
・写真・絵画を生成
・学習用疑似データの生成

AIエンジニア養成コースの概要

「いまの現場でAIロジックを組み込んでみたい」または「世にあふれた様々なデータを使ってAIで動かして遊んでみたい」あるいは「AIを学びたいんだけど何から手をつけていいかわからない」という方のための機械学習・ディープラーニングのコースです。
世の中のAI関連講座はアカデミック偏重で敷居が高いですが、テックジムはその正反対。AI基礎知識がなくても段階的に学べ、最終的にはお仕事につながるカリキュラムとなっております。(カリキュラム作成者は、現場経験豊富なAIエンジニアたちです。)

第0章「データ分析入門とデータ可視化」

ライブラリの基本的な使い方を学びます。
データのグラフ化:Business Inteligence(ビジネス・インテリジェンス)としてデータを可視化して分析していきます。

<想定案件イメージ>
・回帰分析を学ぶ:接客、品揃え、面積のデータから店舗の売上を予測する需要予測に用いる
・営業訪問回数、値引率などを数値化し、取引額を目的変数に設定すれば、営業活動の予測にも用いることができる

<学ぶこと>
・numpyライブラリ
・scipyライブラリ
・matplotlibライブラリ
・ヒストグラム
・Seriesライブラリ
・Pandas
・DaraFrameライブラリ
・データ分析

第1章「教師なし学習と自然言語処理入門」

教師なし学習のモデル(クラスタリング、主成分分析、アソシエーション分析)を用いたデータ分析を学びます。
また、自然言語処理の基本を身につけ、特に自然言語の形態素解析とベクトル化手法を扱えるようになります。

<想定案件イメージ>
・クラスタリング分析:顧客分析でユーザーをセグメントに分けてマーケティングに活用出来る
・チャットボットの開発:営業の問い合わせ自動応答システムが出来る

<学ぶこと>
・クラスタリング(k-means)
・主成分分析(PCA)
・アソシエーション分析
・形態素解析
・word2vec
・ベクトルの演算
・データの類似度

第2章「特徴量エンジニアリング」

データ分析をするときに得られたデータをそのまま使用する場合もありますが、分析の精度を向上させて有用で意味のある分析をするために、分析者が特徴量を作成することがあります。

これは、データの特徴的な分布や傾向を調べながらデータをつくるので特徴量エンジニアリングと呼ばれます。さらに、前処理と呼ばれる分析前の処理を行い、外れ値や欠損値を扱えるデータに変えたり除いたりすることも必要となります。

この章では、この前処理と特徴量エンジニアリングを扱います。

<想定案件イメージ>

顧客分析:Business Inteligence(ビジネス・インテリジェンス)としてデータを可視化して売上を分析する

精度向上・精緻化:機械学習のモデルを作成したが精度を改善したり、精緻化したりする要望があるとき

<学ぶこと>
・ヒストグラム
・統計量
・欠損値
・標準化(スケーリング)
・正規化(スケーリング)
・カテゴリ変数
・one-hot-encoding
・特徴量エンジニアリング

第3章「回帰問題」

回帰問題を学びます。これにより不動産などの価格予測をすることができます。

<学ぶこと>
・教師あり学習のモデル(回帰、分類)を用いてデータ分析ができるようになる
・線形単回帰
・重回帰分析
・Ridge回帰
・Lasso回帰

第4章「分類問題」

分類問題を学びます。
例えば顧客分析で対象の顧客がある商品を買うか買わないかを予測することができます。

<学ぶこと>
・教師あり学習のモデル(回帰、分類)を用いてデータ分析が出来るようになる
・ロジスティック回帰
・シグモイド関数
・決定木
・ランダムフォレスト
・ブースディング
・サポートベクターマシン
・k 近傍法
・非線形

第5章「実践ビジネスデータ分析」

実践的な顧客分析を学びます。スポーツジムで新規の顧客が入会するかどうかや顧客の継続率や退会するかの予測をしていきます。

<学ぶこと>
・顧客データの整形
・顧客データの集計
・利用履歴を使ったクラスタリング
・利用回数の予測モデル

第6章「AIのための統計学入門」

統計の基本的な扱いを学びます。アンケートを分析したり、視聴率や選挙など大きな母数があるときの分析に活用できます。

<学ぶこと>
・推測統計
・復元抽出
・非復元抽出
・区間推定
・不偏分散
・カイ二乗分布
・信頼区間
・確率分布
・正規分布

第7章「DeepLearning基礎」

DeepLearningは、画像分類や自動運転や工場での不良品検知、顔認識技術などに使用できます。スマートデバイスの音声検索・音声操作や多言語の同時翻訳システムなどにも応用できます。

第8章「DeepLearning応用」

<学ぶこと>
・CNN(畳み込みニューラルネットワーク)
・RNN(再帰型ニューラルネットワーク)
・TensorFlow
・Keras
・活性化関数
・単一のニューロン
・ニューラルネットワーク

第9章「GANによる画像生成」

GANを扱えるようになると写真・絵画を生成したり学習用の疑似データを生成出来るようになります。また自然言語処理ではチャットボットの基礎が学べ、営業の問い合わせ自動応答システムが出来るようになります。

第10章「衛星データと機械学習」

衛星データをビジネスに活用すると、石油タンクの減り具合から原油価格を予測する 、市街地の地形から繁盛店になるかを予測するというようなことができます。

第11章 「アンサンブル学習と精度向上手法」

学習モデルの精度向上や精緻化が出来るようになると、例えばこれまでは予測が80%しか当たらなかったものが95%になるようになります。

<学ぶこと>
・混同行列
・性能評価指標
・ROC曲線とAUC
・SVM(サポートベクターマシン)
・ロジスティック回帰での性能評価
・ハイパーパラメータチューニング
・グリッドサーチ
・バギングとブースティング
・交差検証
・k-NN、ロジスティック回帰、決定木、SVM、ランダムフォレスト、勾配ブースティングのモデルを比較
・KFlod法
・Random Seed Averaging
・LightGBM
・重回帰、リッジ回帰、決定木(回帰)、線形SVM回帰

第12章「AI活用 WEBサービスを作ろう(オリジナル画像判定)」

機械学習AutoMLを利用して様々な画像認識を試し、花を判定するアプリを作成します。
また、ネットから収集した画像でオリジナルの画像判定アプリの作成に挑戦していただきます。
画像分類が簡単に出来るようになると、プログラムを書かなくても画像分類が出来るようになります。

<学ぶこと>
・データベース(SQLite,PostgreSQL)
・WEBフレームワーク(Flask)
・Bootstrap
・Herokuでのデプロイ
・Google AutoML vision
・画像分類モデル作成
・WEBアプリケーションのデプロイ

第13章「AI x IoT(センサーデータ分析と画像分類・物体検出)」

IoTのセンサーデータを扱えるようになると、センサーデータを用いた電力需要予測をするといったことができるようになります。

<学ぶこと>
・センサーデータのデータ分析ができる
・CNNの基礎がわかって、モデルを作成することが出来る
・人工知能とOpenCVを使った物体検出が出来る

第14章「効果検証に機械学習を導入しよう」

効果検証を数値的な指標で行えるようになると、売上を上げるWEBサイトを作るための評価ができマーケティングに活用できます。

<学ぶこと>
1.ビジネスデータの可視化(DAU編、アクセス数編、課金アイテム編)
2.効果検証の仕方を学ぶ
・確率分布と累積分布のグラフ
・尤度で比較したグラフ
・「統計検定量」「p 値」「自由度」「期待度数」
3.A/BテストにUplift Modelingを導入する

第15章「推薦システムを作ろう」

オススメの映画やアニメを推薦してくれるシステムができるようになります。またECサイトや顧客分析に活用できます。

<まとめ>
1.データの処理方法を学ぶ
 MovieLens 1M(映画評価データ)のデータを元にデータの前処理について学習します。
2.協調フィルタリング(k近傍法)の仕組みを利用した推薦システムを作る
 kaggleの76,000ユーザーに基づくアニメの推薦データを利用します。
3.Factorization Machinesを使った推薦システムを作る
 Netflix Prizeで最も成果を上げたMatrix Factorizationを一般化したアルゴリズムを利用します。

ご用意いただくもの

ノートPC(Python3をインストールしてください)
※推奨環境:anacondaをインストール、Jupyter Notebookで実行

GitHubで、サンプルソースを共有いたします。

■無料オンライン講座

テックジムに通えない方向けに「教材の一括購入」をご用意いたしました。