2025年8月22日 / 最終更新日 : 2025年8月22日 fujifuji コラム

尤度とは？機械学習における尤度比較グラフの作り方と読み方

機械学習において**尤度（ゆうど）**は、モデルの良さを評価する重要な指標です。本記事では、尤度の基本概念から尤度比較グラフの作成方法、実践的な活用事例まで、初心者にもわかりやすく解説します。

尤度の基本概念

尤度とは何か

**尤度（Likelihood）**とは、与えられたデータに対して、特定のモデルやパラメータがそのデータを生成する確率を表す指標です。簡単に言えば、「このモデルがこのデータを説明する妥当性」を数値化したものです。

確率と尤度の違い

多くの人が混同しがちな概念ですが、確率と尤度は明確に異なります：

確率：パラメータが固定されている状況で、データが取る値の可能性尤度：データが固定されている状況で、パラメータがそのデータを説明する妥当性

例：コイン投げのケース

確率の視点：「表が出る確率が0.5のコインで、10回投げて7回表が出る確率は？」
尤度の視点：「10回投げて7回表が出たデータに対して、表が出る確率が0.5である仮説の尤度は？」

最尤推定法との関係

**最尤推定法（Maximum Likelihood Estimation, MLE）**は、観測されたデータに対して尤度を最大化するパラメータを求める手法です。機械学習では、この原理を使ってモデルのパラメータを学習します。

尤度比較グラフの基本的な構造

横軸と縦軸の意味

横軸（X軸）：通常はパラメータの値や異なるモデルを表示 縦軸（Y軸）：尤度の値（多くの場合、対数尤度を使用）

対数尤度を使う理由

尤度の値は非常に小さくなることが多いため、実際のグラフでは**対数尤度（Log-Likelihood）**が使われます。

対数尤度の利点：

数値の扱いやすさ（アンダーフロー対策）
加法性（独立な事象の尤度の積が和になる）
最適化の容易さ（微分計算が簡単）
グラフの視認性向上

尤度比較グラフの典型的なパターン

単峰性グラフ：1つの明確な最適値を持つ場合 多峰性グラフ：複数の局所最適値を持つ場合 平坦なグラフ：パラメータの変化に対して尤度があまり変わらない場合

機械学習における尤度比較グラフの活用場面

モデル選択での活用

異なるアルゴリズムの比較 複数の機械学習アルゴリズムを同じデータで学習させ、それぞれの尤度を比較することで最適なモデルを選択できます。

例：回帰問題でのモデル比較

線形回帰：対数尤度 = -1250
多項式回帰（2次）：対数尤度 = -1180
多項式回帰（3次）：対数尤度 = -1175
ランダムフォレスト：対数尤度 = -1165

この場合、ランダムフォレストが最も高い尤度を示しており、データに対する説明力が最も高いと判断できます。

ハイパーパラメータ最適化での活用

パラメータ空間の可視化 ハイパーパラメータの値を変化させながら尤度をプロットすることで、最適な設定を視覚的に確認できます。

例：正則化パラメータの調整 横軸に正則化係数λの値、縦軸に対数尤度をプロットすると、過学習と未学習のバランスが取れた最適なλ値を特定できます。

学習過程の監視

学習曲線としての尤度 エポック数や反復回数に対する尤度の変化をグラフ化することで、学習の進行状況を監視できます。

収束判定の指標 尤度の変化が小さくなった時点で学習を終了する早期停止の判断基準として活用されます。

尤度比較グラフの作成手順

ステップ1：評価対象の設定

比較するモデルの選定

ベースラインモデルの設定
候補となる複数のアルゴリズムの選択
評価したいハイパーパラメータの範囲設定

データセットの準備

訓練データと検証データの分割
適切な前処理の実施
データの品質確認

ステップ2：尤度の計算

各モデルでの学習 選択した各モデルを同じ訓練データで学習させ、検証データに対する尤度を計算します。

対数尤度の算出 数値的安定性のため、対数尤度を計算します。多くの機械学習ライブラリでは、この機能が標準で提供されています。

ステップ3：グラフの作成

軸の設定

X軸：比較対象（モデル名、パラメータ値など）
Y軸：対数尤度
必要に応じて誤差バー（信頼区間）を追加

視覚的な工夫

色分けによる区別
最高値のハイライト
基準線の追加

尤度比較グラフの読み方と解釈

基本的な読み方

高い尤度：そのモデルやパラメータがデータをよく説明している 低い尤度：そのモデルやパラメータではデータの説明力が不十分

注意すべきポイント

過学習の兆候 訓練データでの尤度は高いが、検証データでの尤度が低い場合、過学習が発生している可能性があります。

例：複雑度と尤度の関係

モデルが複雑になるほど訓練データでの尤度は向上
しかし検証データでの尤度は最初は向上するがある点で悪化
この転換点が最適な複雑度を示す

統計的有意性の考慮 尤度の差が統計的に有意かどうかを検定することも重要です。わずかな差は偶然である可能性があります。

実践的な尤度比較グラフの活用事例

分類問題での活用

ロジスティック回帰の最適化 異なる特徴量セットや正則化パラメータでの尤度を比較し、最適な設定を見つけます。

例：顧客離反予測モデル

基本特徴量のみのモデル
行動履歴を追加したモデル
外部データを組み合わせたモデル
特徴量エンジニアリング後のモデル

各モデルの対数尤度を比較することで、どの特徴量セットが最も予測に有効かを判断できます。

回帰問題での活用

非線形回帰モデルの比較 線形モデルから複雑な非線形モデルまで、様々なアプローチの尤度を比較します。

例：売上予測モデル

線形回帰
ポリノミアル回帰（次数別）
ガウシアンプロセス回帰
ニューラルネットワーク

尤度比較グラフにより、予測精度と計算コストのバランスを考慮した最適なモデルを選択できます。

時系列分析での活用

ARIMAモデルのパラメータ選択 異なるp、d、qパラメータの組み合わせでAIC（赤池情報量規準）やBIC（ベイズ情報量規準）を比較します。

例：株価予測モデル 各パラメータ組み合わせでの尤度を3次元グラフで可視化し、最適なARIMAモデルを特定します。

情報量規準との組み合わせ

AIC（赤池情報量規準）

計算式の概念： AIC = -2 × 対数尤度 + 2 × パラメータ数

特徴：

尤度の高さとモデルの複雑さのバランスを評価
値が小さいほど良いモデル
相対的な比較に使用

BIC（ベイズ情報量規準）

計算式の概念： BIC = -2 × 対数尤度 + log(サンプル数) × パラメータ数

特徴：

AICよりもパラメータ数に対するペナルティが大きい
サンプル数が多いほどペナルティが大きくなる
より簡潔なモデルを選好

情報量規準を使った比較グラフ

尤度だけでなく、AICやBICも併せてプロットすることで、より総合的なモデル評価が可能になります。

深層学習における尤度比較

損失関数としての尤度

深層学習では、負の対数尤度が損失関数として使用されることが多く、その学習過程をグラフ化することで学習状況を監視できます。

例：画像分類モデル

訓練損失（負の対数尤度）の推移
検証損失の推移
両者の乖離による過学習の検出

異なるアーキテクチャの比較

同じタスクに対して異なるネットワーク構造を試し、最終的な尤度を比較することで最適なアーキテクチャを選択できます。

例：自然言語処理モデル

LSTM
GRU
Transformer
BERT系モデル

各モデルの対数尤度を比較し、タスクに最適なアーキテクチャを特定します。

尤度比較グラフ作成時の注意点

データの分割方法

交差検証の重要性 単一の訓練・検証分割では偏った結果になる可能性があるため、k分割交差検証を使用して安定した評価を行います。

時系列データの特別な考慮 時系列データでは時間順序を保った分割が必要で、通常のランダム分割は適用できません。

計算上の注意点

数値的安定性 尤度の計算では数値のアンダーフローが発生しやすいため、対数空間での計算が重要です。

計算量の考慮 複雑なモデルでは尤度計算に時間がかかるため、効率的な実装や近似手法の使用を検討する必要があります。

解釈上の注意点

尤度だけでは不十分 尤度が高くても実用性が低いモデルもあるため、計算コスト、解釈しやすさ、実装の複雑さなども総合的に考慮する必要があります。

ドメイン知識の重要性 統計的な指標だけでなく、ビジネス要件やドメインの専門知識も考慮した判断が重要です。

尤度比較グラフの高度な活用法

ベイズモデル平均

複数のモデルを尤度に基づいて重み付け平均することで、単一モデルよりも robust な予測が可能になります。

重みの計算： 各モデルの重み = そのモデルの尤度 / 全モデルの尤度の合計

エビデンス（周辺尤度）の比較

ベイズ統計では、モデル全体の尤度（エビデンス）を比較してモデル選択を行います。これは通常の尤度よりも計算が複雑ですが、より原理的なアプローチです。

尤度比検定

2つのモデルの尤度比を使って、統計的にどちらが優れているかを検定できます。

尤度比統計量： LR = -2 × (制約モデルの対数尤度 – 完全モデルの対数尤度)

まとめ

尤度比較グラフは、機械学習におけるモデル選択やパラメータ最適化において非常に強力なツールです。

重要なポイント：

尤度はモデルがデータを説明する妥当性を表す指標
対数尤度を使用することで数値的安定性と視認性が向上
モデル選択、ハイパーパラメータ最適化、学習監視で幅広く活用
AICやBICと組み合わせることでより総合的な評価が可能
過学習の検出や最適な複雑度の特定に有効
統計的有意性や実用性も考慮した総合判断が重要

尤度比較グラフを正しく作成し解釈することで、データに基づいた客観的なモデル選択が可能になり、機械学習プロジェクトの成功確率を大幅に向上させることができます。理論的な理解と実践的な経験を積み重ねることで、より効果的な機械学習システムの構築が実現できるでしょう。

■テックジム「AIエンジニア養成コース」

AIエンジニア養成コース（機械学習・ディープラーニング）の概要

■プロンプトだけでオリジナルアプリを開発・公開してみた！！

AI駆動開発/生成AIエンジニアコースの開発アプリ紹介

■AI時代の第一歩！「AI駆動開発コース」はじめました！

テックジム東京本校で先行開始。

AI駆動開発/生成AIエンジニアコース（初心者向け）

■テックジム東京本校

「武田塾」のプログラミング版といえば「テックジム」。
講義動画なし、教科書なし。「進捗管理とコーチング」で効率学習。
より早く、より安く、しかも対面型のプログラミングスクールです。

テックジム東京本校

＜短期講習＞5日で5万円の「Pythonミニキャンプ」開催中。

独学もオンラインも無理だから、有給とって「Pythonミニキャンプ」へ【5日間で5万円】

＜オンライン無料＞ゼロから始めるPython爆速講座

【無料・オンライン】ゼロからはじめるPython爆速講座

プログラミング学習に関するお役立ちコンテンツ

カテゴリー: コラム