Multi-Class neurális hálózatok: Softmax

emlékezzünk arra, hogy a logisztikai regresszió tizedesjegyet eredményez a 0 és az 1.0 között. Például egy 0,8-as logisztikai regressziós kimenet egy e-mail osztályozóból azt sugallja, hogy 80% az esély arra, hogy az anemail spam legyen, és 20% az esélye, hogy nem spam. Nyilvánvaló, hogy az e-mail valószínűségének összege spam vagy nem spam 1,0.

Softmax kiterjeszti ezt az ötletet egy több osztályú világban. Ez azt jelenti, hogy a Softmax decimális valószínűségeket rendel minden osztályhoz egy többosztályú problémában.Ezeknek a tizedes valószínűségeknek össze kell adniuk 1,0-et. Ez a további korlátozássegít a képzésnek gyorsabban konvergálni, mint egyébként.

például visszatérve az 1.ábrán látható képelemzéshez, a Softmaxmight az apartikuláris osztályba tartozó kép következő valószínűségeit állítja elő:

osztály valószínűség
alma 0,001
medve 0,04
candy 0.008
kutya 0,95
tojás 0,001

a Softmax megvalósult egy neurális hálózati rétegen keresztül közvetlenül korábbana kimeneti réteg. A Softmax rétegnek ugyanannyi csomóponttal kell rendelkezniemint a kimeneti réteg.

egy mély neurális háló bemeneti réteggel, két nem leírható rejtett réteggel, majd egy Softmax réteggel, végül egy kimeneti réteggel, amelynek azonos számú csomópontja van, mint a Softmax rétegnek.

2.ábra. Egy Softmax réteg egy neurális hálózaton belül.

kattintson a plusz ikonra a Softmax egyenlet megtekintéséhez.

a Softmax egyenlet a következő:

$$p(y = j /\textbf{x}) = \frac{e^{(\textbf{w}_j^{T}\textbf{x} + b_j)}}{\sum_{k\in K} {e^{(\textbf{w}_k^{T}\textbf{x} + b_k)}}} $$

vegye figyelembe, hogy ez a képlet alapvetően kiterjeszti a logisticregression képletét több osztályra.

Softmax opciók

Tekintsük a következő változatai Softmax:

  • teljes Softmax a Softmax már tárgyalt; vagyis a Softmax kiszámítja a valószínűséget minden lehetséges osztályra.

  • a jelölt mintavétel azt jelenti, hogy a Softmax kiszámítja az összes pozitív címke valószínűségét, de csak a negatív címkék véletlenszerű mintájára. Például, ha érdekel minket annak meghatározása, hogy egy bemeneti kép beagle vagy bloodhound-e, akkor nincs minden nem kutyus példa valószínűségének biztosítása.

a teljes Softmax meglehetősen olcsó, ha az osztályok száma kicsi, de megfizethetetlenül drága lesz, amikor az osztályok száma felmászik.A jelölt mintavétel javíthatja a hatékonyságot a nagy problémákbanosztályok száma.

egy címke vs. sok címke

a Softmax feltételezi, hogy minden példa pontosan egy osztály tagja.Néhány példa azonban egyszerre több osztály tagja lehet.Ilyen példákhoz:

  • nem használhatja a Softmax-ot.
  • több logisztikai regresszióra kell támaszkodnia.

tegyük fel például, hogy a példák olyan képek, amelyek pontosan egy elemet tartalmaznak—gyümölcsenként. A Softmax meghatározhatja annak valószínűségétkörte, narancs, alma stb. Ha a példáid képekmindenféle dolgot tartalmaznak—különféle gyümölcs tálak-akkortöbb logisztikai regressziót kell használnia.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.