linjär diskriminantanalys eller Normal diskriminantanalys eller Diskriminantfunktionsanalys är en dimensioneringsreduceringsteknik som vanligtvis används för de övervakade klassificeringsproblemen. Den används för att modellera skillnader i grupper, dvs separera två eller flera klasser. Det används för att projicera funktioner i högre dimension utrymme i en lägre dimension utrymme.
till exempel har vi två klasser och vi måste separera dem effektivt. Klasser kan ha flera funktioner. Att bara använda en enda funktion för att klassificera dem kan resultera i viss överlappning som visas i figuren nedan. Så vi fortsätter att öka antalet funktioner för korrekt klassificering.
exempel:
Antag att vi har två uppsättningar datapunkter som tillhör två olika klasser som vi vill klassificera. Som visas i den givna 2D-grafen, när datapunkterna plottas på 2D-planet, finns det ingen rak linje som kan separera de två klasserna av datapunkterna helt. Därför används i detta fall LDA (linjär diskriminantanalys) som reducerar 2D-grafen till en 1D-graf för att maximera separerbarheten mellan de två klasserna.
här använder linjär diskriminantanalys både axlarna (X och Y) för att skapa en ny axel och projicerar data på en ny axel på ett sätt att maximera separationen av de två kategorierna och därmed reducera 2D-grafen till en 1D-graf.
två kriterier används av LDA för att skapa en ny axel:
- maximera avståndet mellan medel för de två klasserna.
- minimera variationen inom varje klass.
i diagrammet ovan kan man se att en ny axel (i rött) genereras och ritas i 2D-grafen så att den maximerar avståndet mellan de två klassernas medel och minimerar variationen inom varje klass. Enkelt uttryckt ökar denna nyligen genererade axel separationen mellan dtla-punkterna i de två klasserna. Efter att ha genererat denna nya axel med hjälp av ovan nämnda kriterier ritas alla datapunkter för klasserna på denna nya axel och visas i figuren nedan.
men linjär Diskrimineringsanalys misslyckas när medelvärdet av fördelningarna delas, eftersom det blir omöjligt för LDA att hitta en ny axel som gör båda klasserna linjärt separerbara. I sådana fall använder vi icke-linjär diskriminerande analys.
tillägg till LDA:
- kvadratisk diskriminantanalys (QDA): Varje klass använder sin egen uppskattning av varians (eller kovarians när det finns flera ingångsvariabler).
- Flexibel diskriminantanalys (FDA): där icke-linjära kombinationer av ingångar används, såsom splines.
- Regularized Discriminant Analysis (RDA): introducerar regularisering i uppskattningen av variansen (faktiskt kovarians), vilket modererar påverkan av olika variabler på LDA.
applikationer:
- ansiktsigenkänning: Inom datorsyn är ansiktsigenkänning en mycket populär applikation där varje ansikte representeras av ett mycket stort antal pixelvärden. Linjär diskriminantanalys (LDA) används här för att minska antalet funktioner till ett mer hanterbart antal före klassificeringsprocessen. Var och en av de genererade nya dimensionerna är en linjär kombination av pixelvärden, som bildar en mall. De linjära kombinationerna erhållna med användning av Fishers linjära diskriminant kallas Fisher-ansikten.
- Medicinsk: Inom detta område används linjär diskriminantanalys (LDA) för att klassificera patientens sjukdomstillstånd som mild, måttlig eller svår baserat på patientens olika parametrar och den medicinska behandlingen han går igenom. Detta hjälper läkarna att intensifiera eller minska takten i behandlingen.
- kundidentifiering: Antag att vi vill identifiera vilken typ av kunder som mest sannolikt köper en viss produkt i ett köpcentrum. Genom att göra en enkel fråga och svar undersökning, kan vi samla alla funktioner hos kunderna. Här, linjär diskriminerande analys hjälper oss att identifiera och välja de funktioner som kan beskriva egenskaperna hos den grupp av kunder som är mest benägna att köpa just den produkten i köpcentret.