rețele neuronale Multi-clasă: Softmax

reamintim că regresia logistică produce o zecimalăîntre 0 și 1.0. De exemplu, o ieșire de regresie logistică of0.8 de la un clasificator de e-mail sugerează o șansă de 80% ca anemailul să fie spam și o șansă de 20% ca acesta să nu fie spam. În mod clar,suma probabilităților ca un e-mail să fie spam sau nu spam este 1.0.

Softmax extinde această idee într-o lume cu mai multe clase. Adică, Softmax atribuie probabilități zecimale fiecărei clase într-o problemă cu mai multe clase.Aceste probabilități zecimale trebuie să adauge până la 1,0. Această constrângere suplimentarăajută formarea să conveargă mai repede decât ar fi altfel.

de exemplu, revenind la analiza imaginii pe care am văzut-o în Figura 1, Softmaxmight produce următoarele probabilități ale unei imagini aparținând clasei aparticulare:

clasă probabilitate
Apple 0.001
urs 0.04
bomboane 0.008
câine 0.95
ou 0.001

Softmax este implementat printr-un strat de rețea neuronală chiar înaintestratul de ieșire. Stratul Softmax trebuie să aibă același număr de nodurica strat de ieșire.

o rețea neuronală profundă cu un strat de intrare, două straturi ascunse nedescriptibile, apoi un strat Softmax și, în final, un strat de ieșire cu același număr de noduri ca stratul Softmax.

Figura 2. Un strat Softmax într-o rețea neuronală.

Faceți clic pe pictograma plus pentru a vedea ecuația Softmax.

ecuația Softmax este următoarea:

$$p(y = j /\textbf{x}) = \frac{e^{(\textbf{w}_j^{T}\textbf{x} + b_j)}}{\sum_{k\în K} {E^{(\textbf{w}_k^{T}\textbf{x} + b_k)}}} $$

rețineți că această formulă extinde practic formula pentru logisticăregression în mai multe clase.

Opțiuni Softmax

luați în considerare următoarele variante de Softmax:

  • Softmax complet este Softmax am discutat; adică, Softmax calculează o probabilitate pentru fiecare clasă posibilă.

  • eșantionarea candidaților înseamnă că Softmax calculează o probabilitate pentru toate etichetele pozitive, dar numai pentru un eșantion aleatoriu de etichete negative. De exemplu, dacă suntem interesați să determinăm dacă o imagine de intrare este un beagle sau un bloodhound, nu trebuie să oferim probabilități pentru fiecare exemplu non-doggy.

full Softmax este destul de ieftin atunci când numărul de clase este micdar devine prohibitiv de scump atunci când numărul de clase urcă.Eșantionarea candidaților poate îmbunătăți eficiența în problemele care au o dimensiune marenumărul de clase.

o etichetă vs.multe etichete

Softmax presupune că fiecare exemplu este membru al unei clase.Cu toate acestea, unele exemple pot fi simultan membre ale mai multor clase.Pentru astfel de exemple:

  • nu puteți utiliza Softmax.
  • trebuie să vă bazați pe regresii logistice multiple.

de exemplu, să presupunem că exemplele dvs. sunt imagini care conțin exact un element—bucată de fruct. Softmax poate determina probabilitatea ca acest lucrufiind o pere, o portocală, un măr și așa mai departe. Dacă exemplele dvs. sunt imagini care conțin tot felul de lucruri—boluri de diferite tipuri de fructe—atunci va trebui să utilizați mai multe regresii logistice în schimb.

Lasă un răspuns

Adresa ta de email nu va fi publicată.