lineáris diszkrimináns elemzés vagy normál diszkrimináns elemzés vagy diszkrimináns funkció elemzés egy dimenzió csökkentési technika, amelyet általában a felügyelt osztályozási problémák. A csoportok közötti különbségek modellezésére szolgál, azaz két vagy több osztály elválasztására. Arra használják, hogy a magasabb dimenziós tér jellemzőit alacsonyabb dimenziós térbe vetítsék.
például két osztályunk van, és hatékonyan kell elválasztanunk őket. Az osztályok több funkcióval is rendelkezhetnek. Ha csak egyetlen funkciót használ az osztályozásukhoz, az átfedéshez vezethet, amint az az alábbi ábrán látható. Tehát továbbra is növeljük a megfelelő osztályozás jellemzőinek számát.
példa:
tegyük fel, hogy két különböző osztályba tartozó adatpontunk van, amelyeket osztályozni akarunk. Amint az az adott 2D grafikonon látható, amikor az adatpontok a 2D síkon vannak ábrázolva, nincs olyan egyenes, amely teljesen elválasztaná az adatpontok két osztályát. Ezért ebben az esetben LDA (lineáris diszkrimináns elemzés) használatos, amely a 2D gráfot 1D gráfra redukálja annak érdekében, hogy maximalizálja a két osztály elválaszthatóságát.
itt a lineáris diszkrimináns elemzés mindkét tengelyt (X és Y) használja egy új tengely létrehozásához, és az adatokat egy új tengelyre vetíti oly módon, hogy maximalizálja a két kategória elválasztását, és ezáltal a 2D gráfot 1D grafikonná redukálja.
az LDA két kritériumot használ egy új tengely létrehozásához:
- maximalizálja a két osztály átlaga közötti távolságot.
- minimalizálja a variációt az egyes osztályokon belül.
a fenti grafikonon látható, hogy a 2D gráfban egy új tengely (piros színnel) jön létre és ábrázolódik úgy, hogy maximalizálja a két osztály átlaga közötti távolságot, és minimalizálja az egyes osztályokon belüli eltéréseket. Egyszerűen fogalmazva, ez az újonnan létrehozott tengely növeli a két osztály dtla pontjainak elválasztását. Miután ezt az új tengelyt a fent említett kritériumok alapján létrehoztuk, az osztályok összes adatpontját ezen az új tengelyen ábrázoljuk, és az alábbi ábrán mutatjuk be.
de a lineáris diszkrimináns elemzés sikertelen, ha az eloszlások átlagát megosztják, mivel lehetetlenné válik az LDA számára egy új tengely megtalálása, amely mindkét osztályt lineárisan elválaszthatóvá teszi. Ilyen esetekben nemlineáris diszkrimináns elemzést alkalmazunk.
kiterjesztések az LDA-ra:
- kvadratikus diszkrimináns elemzés (QDA): Minden osztály a saját becslését használja variancia (vagy kovariancia, ha több bemeneti változó van).
- rugalmas diszkrimináns elemzés (FDA): ahol a bemenetek nemlineáris kombinációit használják, például spline-eket.
- Regularizált diszkrimináns elemzés (RDA): bevezeti a szabályozást a variancia (valójában kovariancia) becslésébe, mérsékelve a különböző változók LDA-ra gyakorolt hatását.
Alkalmazások:
- arcfelismerés: A számítógépes látás területén az arcfelismerés nagyon népszerű alkalmazás, amelyben minden arcot nagyon sok pixelérték képvisel. A lineáris diszkrimináns elemzést (Lda) itt használják a jellemzők számának kezelhetőbb számra történő csökkentésére az osztályozás folyamata előtt. A generált új dimenziók mindegyike pixelértékek lineáris kombinációja, amelyek sablont alkotnak. A Fisher lineáris diszkriminánsával kapott lineáris kombinációkat Fisher arcoknak nevezzük.
- orvosi: Ezen a területen a lineáris diszkrimináns analízist (Lda) használják a beteg betegségállapotának enyhe, közepes vagy súlyos osztályozására a beteg különböző paraméterei és az általa végzett orvosi kezelés alapján. Ez segít az orvosoknak fokozni vagy csökkenteni a kezelésük ütemét.
- Ügyfélazonosítás: tegyük fel, hogy meg akarjuk határozni, hogy milyen típusú ügyfelek vásárolnak egy adott terméket egy bevásárlóközpontban. Egy egyszerű kérdés-válasz felméréssel összegyűjthetjük az ügyfelek összes funkcióját. Itt a lineáris diszkrimináns elemzés segít azonosítani és kiválasztani azokat a jellemzőket, amelyek leírhatják annak a vevőcsoportnak a jellemzőit, amelyek a legnagyobb valószínűséggel vásárolják meg az adott terméket a bevásárlóközpontban.