Softmax

A Softmax a logisztikai függvény általánosítása többdimenziós esetre. A függvény egy dimenzióvektort azonos méretű vektorrá alakít át , ahol a kapott vektor minden koordinátáját egy valós szám ábrázolja a [0,1] intervallumban, és a koordináták összege 1.

A koordináták kiszámítása a következőképpen történik:

Alkalmazások a gépi tanulásban

A Softmax függvényt a gépi tanulásban használják osztályozási problémák esetén, ha a lehetséges osztályok száma kettőnél több (két osztályhoz logisztikai függvényt használnak). Az eredményül kapott vektor koordinátáit a rendszer annak valószínűségeként kezeli, hogy az objektum az osztályba tartozik . Az oszlopvektor kiszámítása a következőképpen történik:

ahol egy dimenziós objektum jellemzőinek oszlopvektora ; a jellemzők súlyegyütthatóinak transzponált mátrixa , amelynek mérete ; egy oszlopvektor küszöbértékekkel (lásd perceptron ), ahol az objektumosztályok száma és az objektum jellemzőinek száma.

A Softmax-ot gyakran a mély neurális hálózatok utolsó rétegéhez használják osztályozási feladatokhoz. Ebben az esetben a keresztentrópiát veszteségfüggvényként használják a neurális hálózat betanításához .