Multi-Klasse Nevrale Nettverk: Softmax

Husk at logistisk regresjon gir en decimalbetween 0 og 1.0. For eksempel antyder en logistisk regresjonsutgang på 0,8 fra en e-postklassifiserer en 80% sjanse for at anemail er spam og en 20% sjanse for at den ikke er spam. Klart, summen av sannsynlighetene for en e-post blir enten spam eller ikke spam er 1.0.

Softmax utvider denne ideen til en multi-class verden. Det Vil Si At Softmax tildeler desimal sannsynligheter til hver klasse i et multi-klasse problem.Disse desimal sannsynlighetene må legge opp til 1,0. Denne ekstra begrensningenhjelper trening konvergerer raskere enn det ellers ville.

For eksempel, tilbake til bildeanalysen vi så I Figur 1, Produserer Softmaxmight følgende sannsynligheter for et bilde som tilhører apartikulær klasse:

Klasse Sannsynlighet
eple 0.001
bjørn 0.04
godteri 0.008
0.95
egg 0.001

Softmax er implementert gjennom et nevralt nettverkslag like førutgangslaget. Softmax-laget må ha samme antall nodersom utgangslaget.

et dypt nevralt nett med et inngangslag, to ubestemte skjulte lag, deretter Et Softmax-lag, og til slutt et utgangslag med samme antall noder som Softmax-laget.

figur 2. Et Softmax-lag i et nevralt nettverk.

Klikk på plussikonet for Å se softmax-ligningen.

softmax-ligningen er som følger:

$$p(y = j /\textbf{x}) = \frac{e^{(\textbf{w}_j^{t}\textbf{x} + b_j)}}{\sum_{k\In k} {e^{(\textbf{w}_k^{t}\textbf{x} + b_k)}}} $$

merk at denne formelen I Utgangspunktet Utvider formelen for logisticregresjon i flere klasser.

Softmax Alternativer

Vurder følgende varianter Av Softmax:

  • Full Softmax Er Softmax vi har diskutert; Det Vil si At Softmax beregner en sannsynlighet for hver mulig klasse.

  • Kandidatprøvetaking betyr At Softmax beregner en sannsynlighetfor alle de positive etikettene, men bare for et tilfeldig utvalg av negative etiketter. For eksempel, hvis vi er interessert i å bestemme om et inngangsbilde er en beagle eller en blodhund, har vi ikke å gi sannsynligheter for hvert ikke-doggy-eksempel.

Full Softmax er ganske billig når antall klasser er småmen blir uoverkommelig dyrt når antall klasser klatrer.Kandidatprøvetaking kan forbedre effektiviteten i problemer med å ha en storantall klasser.

En Etikett vs. Mange Etiketter

Softmax antar at hvert eksempel er medlem av nøyaktig en klasse.Noen eksempler kan imidlertid samtidig være medlem av flere klasser.For slike eksempler:

  • Du kan ikke bruke Softmax.
  • Du må stole på flere logistiske regresjoner.

anta for eksempel at eksemplene dine er bilder som inneholder nøyaktig ett element-stykke frukt. Softmax kan bestemme sannsynligheten for at en varevære en pære, en appelsin, et eple og så videre. Hvis eksemplene dine er bilder som inneholder alle slags ting-boller av forskjellige typer frukt-så må du bruke flere logistiske regresjoner i stedet.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.