A Softmax a logisztikai függvény általánosítása többdimenziós esetre. A függvény egy dimenzióvektort azonos méretű vektorrá alakít át , ahol a kapott vektor minden koordinátáját egy valós szám ábrázolja a [0,1] intervallumban, és a koordináták összege 1.
A koordináták kiszámítása a következőképpen történik:
A Softmax függvényt a gépi tanulásban használják osztályozási problémák esetén, ha a lehetséges osztályok száma kettőnél több (két osztályhoz logisztikai függvényt használnak). Az eredményül kapott vektor koordinátáit a rendszer annak valószínűségeként kezeli, hogy az objektum az osztályba tartozik . Az oszlopvektor kiszámítása a következőképpen történik:
ahol egy dimenziós objektum jellemzőinek oszlopvektora ; a jellemzők súlyegyütthatóinak transzponált mátrixa , amelynek mérete ; egy oszlopvektor küszöbértékekkel (lásd perceptron ), ahol az objektumosztályok száma és az objektum jellemzőinek száma.
A Softmax-ot gyakran a mély neurális hálózatok utolsó rétegéhez használják osztályozási feladatokhoz. Ebben az esetben a keresztentrópiát veszteségfüggvényként használják a neurális hálózat betanításához .
Gépi tanulás és adatbányászat | |
---|---|
Feladatok | |
Tanulás tanárral | |
klaszteranalízis | |
Dimenziócsökkentés | |
Strukturális előrejelzés | |
Anomália észlelése | |
Grafikon valószínűségi modellek | |
Neurális hálózatok | |
Megerősítő tanulás |
|
Elmélet | |
Folyóiratok és konferenciák |
|