analiza discriminantă liniară sau analiza discriminantă normală sau analiza funcției discriminante este o tehnică de reducere a dimensionalității care este utilizată în mod obișnuit pentru problemele de clasificare supravegheate. Este utilizat pentru modelarea diferențelor în grupuri, adică separarea a două sau mai multe clase. Este folosit pentru a proiecta caracteristicile din spațiul de dimensiuni superioare într-un spațiu de dimensiuni inferioare.
de exemplu, avem două clase și trebuie să le separăm eficient. Clasele pot avea mai multe caracteristici. Utilizarea unei singure caracteristici pentru a le clasifica poate duce la unele suprapuneri, așa cum se arată în figura de mai jos. Deci, vom continua să creștem numărul de caracteristici pentru o clasificare corectă.
exemplu:
Să presupunem că avem două seturi de puncte de date aparținând a două clase diferite pe care dorim să le clasificăm. Așa cum se arată în graficul 2D dat, când punctele de date sunt reprezentate grafic pe planul 2D, nu există o linie dreaptă care să poată separa complet cele două clase ale punctelor de date. Prin urmare, în acest caz, se folosește Lda (analiza discriminantă liniară) care reduce graficul 2D într-un grafic 1D pentru a maximiza separabilitatea dintre cele două clase.
aici, analiza discriminantă liniară folosește ambele axe (X și Y) pentru a crea o nouă axă și proiectează date pe o nouă axă într-un mod de a maximiza separarea celor două categorii și, prin urmare, reducând graficul 2D într-un grafic 1D.
două criterii sunt utilizate de LDA pentru a crea o nouă axă:
- maximizați distanța dintre mijloacele celor două clase.
- minimizați variația din fiecare clasă.
în graficul de mai sus, se poate observa că o nouă axă (în roșu) este generată și reprezentată grafic în graficul 2D astfel încât să maximizeze distanța dintre mijloacele celor două clase și să minimizeze variația în cadrul fiecărei clase. În termeni simpli, această axă nou generată mărește separarea dintre punctele dtla ale celor două clase. După generarea acestei noi axe folosind criteriile menționate mai sus, toate punctele de date ale claselor sunt reprezentate grafic pe această nouă axă și sunt prezentate în figura de mai jos.
dar analiza discriminantă liniară eșuează atunci când media distribuțiilor este partajată, deoarece devine imposibil pentru LDA să găsească o nouă axă care să facă ambele clase separabile liniar. În astfel de cazuri, folosim analiza discriminantă neliniară.
Extensii la LDA:
- analiza discriminantă pătratică (QDA): Fiecare clasă folosește propria estimare a varianței (sau covarianță atunci când există mai multe variabile de intrare).
- analiza discriminantă flexibilă( FDA): unde se utilizează combinații neliniare de intrări, cum ar fi spline.
- Regularized Discriminant Analysis (ADR): introduce regularizarea în estimarea varianței (de fapt covarianță), moderarea influenței diferitelor variabile asupra LDA.
aplicații:
- recunoașterea feței: În domeniul viziunii computerizate, recunoașterea feței este o aplicație foarte populară în care fiecare față este reprezentată de un număr foarte mare de valori ale pixelilor. Analiza discriminantă liniară (LDA) este utilizată aici pentru a reduce numărul de caracteristici la un număr mai ușor de gestionat înainte de procesul de clasificare. Fiecare dintre noile dimensiuni generate este o combinație liniară de valori ale pixelilor, care formează un șablon. Combinațiile liniare obținute folosind discriminantul liniar al lui Fisher se numesc fețe Fisher.
- medicale: În acest domeniu, analiza discriminantă liniară (LDA) este utilizată pentru a clasifica starea bolii pacientului ca ușoară, moderată sau severă pe baza diferiților parametri ai pacientului și a tratamentului medical prin care trece. Acest lucru ajută medicii să intensifice sau să reducă ritmul tratamentului.
- identificarea clientului: să presupunem că dorim să identificăm tipul de clienți care sunt cel mai probabil să cumpere un anumit produs într-un mall. Făcând un sondaj simplu de întrebări și răspunsuri, putem aduna toate caracteristicile clienților. Aici, analiza discriminantă liniară ne va ajuta să identificăm și să selectăm caracteristicile care pot descrie caracteristicile grupului de clienți care sunt cel mai probabil să cumpere acel produs în mall.