GeeksforGeeks

線形判別分析または正規判別分析または判別関数分析は、教師あり分類問題に一般的に使用される次元削減技術です。 これは、グループ内の違いをモデル化するために使用されます。 これは、高次元空間のフィーチャを低次元空間に投影するために使用されます。

たとえば、2つのクラスがあり、それらを効率的に分離する必要があります。 クラスは複数の機能を持つことができます。 単一のフィーチャのみを使用してそれらを分類すると、下の図に示すようにいくつかの重複が生じる可能性があります。 そのため、適切な分類のために機能の数を増やし続けます。

例:
分類したい二つの異なるクラスに属する二つのデータポイントのセットがあるとします。 与えられた2Dグラフに示すように、データ点が2D平面上にプロットされている場合、データ点の2つのクラスを完全に分離できる直線はありません。 したがって、この場合、2つのクラス間の分離可能性を最大化するために、2Dグラフを1Dグラフに縮小するLDA(Linear Discriminant Analysis)が使用されます。

ここで、線形判別分析は、軸(XとY)の両方を使用して新しい軸を作成し、二つのカテゴリの分離を最大化する方法で新しい軸にデータを投影し、2Dグラフを1Dグラフに縮小します。新しい軸を作成するためにLDAによって2つの基準が使用されます。

:p>

  1. 二つのクラスの平均間の距離を最大化します。
    1. 二つのクラスの平均間の距離を最大化
    2. 各クラス内の変動を最小化します。

    上のグラフでは、二つのクラスの平均間の距離を最大化し、各クラス内の変動を最小化するように、新しい軸(赤)が生成され、2Dグラフにプロットされていることがわかります。 簡単に言えば、この新しく生成された軸は、2つのクラスのdtlaポイント間の分離を増加させます。 上記の基準を使用してこの新しい軸を生成した後、クラスのすべてのデータポイントがこの新しい軸にプロットされ、以下の図に示されます。

    しかし、分布の平均が共有されると、LDAが両方のクラスを線形分離可能にする新しい軸を見つけるこ このような場合、非線形判別分析を使用します。

    LDAへの拡張:

    1. 二次判別分析(QDA): 各クラスは、独自の分散推定値(または複数の入力変数がある場合の共分散)を使用します。
    2. フレキシブル判別分析(FDA):スプラインなどの入力の非線形組み合わせが使用される場合。
    3. 正則判別分析(RDA):分散の推定値(実際には共分散)に正則化を導入し、LDAに対する異なる変数の影響を緩和します。/li>

    アプリケーション:

    1. 顔認識: コンピュータビジョンの分野では、顔認識は、各顔が非常に多数のピクセル値で表される非常に一般的なアプリケーションです。 線形判別分析(LDA)は、分類のプロセスの前に、より管理しやすい数に特徴の数を減らすためにここで使用されています。 生成される新しい次元のそれぞれは、ピクセル値の線形結合であり、テンプレートを形成します。 フィッシャーの線形判別式を用いて得られる線形結合はフィッシャー面と呼ばれる。
    2. 医療: この分野では、線形判別分析(LDA)は、患者の様々なパラメータと彼が通過している医療に基づいて、患者の病態を軽度、中等度または重度として分類するために これは、医師が治療のペースを強化または短縮するのに役立ちます。
    3. 顧客識別:ショッピングモールで特定の製品を購入する可能性が最も高い顧客のタイプを識別したいとします。 簡単な質問と回答の調査を行うことで、お客様のすべての機能を収集することができます。 ここで、線形判別分析は、ショッピングモールでその特定の製品を購入する可能性が最も高い顧客グループの特性を記述できる特徴を特定して選択す
    記事タグ:

    練習タグ:

コメントを残す

メールアドレスが公開されることはありません。