liniowa Analiza dyskryminacyjna lub Normalna Analiza dyskryminacyjna lub analiza funkcji dyskryminacyjnej jest techniką redukcji wymiarowości, która jest powszechnie stosowana w nadzorowanych problemach klasyfikacji. Służy do modelowania różnic w grupach tj. rozdzielania dwóch lub więcej klas. Jest on używany do projektowania funkcji w przestrzeni wyższych wymiarów w przestrzeni niższych wymiarów.
na przykład mamy dwie klasy i musimy je efektywnie rozdzielić. Klasy mogą mieć wiele funkcji. Użycie tylko jednej funkcji do ich klasyfikacji może spowodować pewne nakładanie się, jak pokazano na poniższym rysunku. Będziemy więc stale zwiększać liczbę funkcji dla właściwej klasyfikacji.
przykład:
Załóżmy, że mamy dwa zestawy punktów danych należące do dwóch różnych klas, które chcemy sklasyfikować. Jak pokazano na podanym wykresie 2D, gdy punkty danych są wykreślone na płaszczyźnie 2D, nie ma linii prostej, która mogłaby całkowicie oddzielić dwie klasy punktów danych. Dlatego w tym przypadku stosuje się Lda (Linear Discriminant Analysis), która redukuje Wykres 2D do 1D w celu zmaksymalizowania rozdzielności między dwiema klasami.
tutaj liniowa Analiza dyskryminacyjna wykorzystuje obie osie (X i Y) do utworzenia nowej osi i wyświetla dane na nowej osi w sposób maksymalizujący separację dwóch kategorii, a tym samym redukując Wykres 2D do 1D.
dwa kryteria są używane przez LDA do tworzenia nowej osi:
- minimalizuje różnice w obrębie każdej klasy.
na powyższym wykresie można zauważyć, że nowa oś (w kolorze czerwonym) jest generowana i wykreślana w wykresie 2D, tak że maksymalizuje odległość między środkami dwóch klas i minimalizuje zmienność w każdej klasie. Mówiąc prościej, ta nowo wygenerowana oś zwiększa separację między punktami dtla obu klas. Po wygenerowaniu tej nowej osi przy użyciu wyżej wymienionych kryteriów wszystkie punkty danych klas są wykreślane na tej nowej osi i są pokazane na rysunku podanym poniżej.
ale liniowa Analiza dyskryminacyjna zawodzi, gdy średnia rozkładów jest dzielona, ponieważ Lda nie może znaleźć nowej osi, która sprawia, że obie klasy są liniowo rozdzielane. W takich przypadkach stosujemy nieliniową analizę dyskryminacyjną.
rozszerzenia do LDA:
- : Każda klasa używa własnego oszacowania wariancji (lub kowariancji, gdy istnieje wiele zmiennych wejściowych).
- elastyczna Analiza dyskryminacyjna (FDA): gdzie stosuje się nieliniowe kombinacje wejść, takie jak splajny.
- Regularized Discriminant Analysis( RDA): wprowadza regularyzację do estymacji wariancji (właściwie kowariancji), moderując wpływ różnych zmiennych na LDA.
Aplikacje:
- Rozpoznawanie twarzy: W dziedzinie widzenia komputerowego rozpoznawanie twarzy jest bardzo popularną aplikacją, w której każda twarz jest reprezentowana przez bardzo dużą liczbę wartości pikseli. Liniowa Analiza dyskryminacyjna (ang. Linear discriminant analysis, LDA) jest tu stosowana w celu zmniejszenia liczby cech do liczby łatwiejszej do opanowania przed procesem klasyfikacji. Każdy z nowych wygenerowanych wymiarów jest liniową kombinacją wartości pikseli, które tworzą szablon. Kombinacje liniowe uzyskane za pomocą dyskryminatora liniowego Fishera nazywane są twarzami Fishera.
- Medycyna: W tej dziedzinie liniowa Analiza dyskryminacyjna (Lda) służy do klasyfikacji stanu chorobowego pacjenta jako łagodnego, umiarkowanego lub ciężkiego w oparciu o różne parametry pacjenta i leczenie, przez które przechodzi. Pomaga to lekarzom zintensyfikować lub zmniejszyć tempo leczenia.
- Identyfikacja klienta: Załóżmy, że chcemy zidentyfikować typ klientów, którzy najczęściej kupują dany produkt w centrum handlowym. Wykonując prostą ankietę pytań i odpowiedzi, możemy zebrać wszystkie funkcje klientów. Tutaj liniowa Analiza dyskryminacyjna pomoże nam zidentyfikować i wybrać cechy, które mogą opisywać cechy grupy klientów, którzy najczęściej kupują ten konkretny produkt w centrum handlowym.