ID3 (algoritmus)

Az ID3 algoritmus a döntési fa  felépítésének egyik algoritmusa . John R. Quinlan tervezte John R. Quinlan .  Ezt követően Quinlan készített egy továbbfejlesztett verziót - a C4.5 algoritmust .

Algoritmus

  1. Vegye ki az összes nem használt jellemzőt, és számítsa ki az entrópiájukat a tesztmintákhoz viszonyítva
  2. Válasszon olyan jellemzőt, amelynél az entrópia minimális (és az információnyereség maximális)
  3. Készítsen egy fa csomópontot, amely tartalmazza ezt a tulajdonságot

Az algoritmus a következő:

ID3 (példatáblázat, célfunkció, szolgáltatások)

  1. Ha minden példa pozitív, akkor adja vissza a "+" feliratú csomópontot.
  2. Ha minden példa negatív, akkor adja vissza a "-" feliratú csomópontot.
  3. Ha a jellemzőkészlet üres, akkor adja vissza a csomópontot azzal a címkével, amelyik a legtöbbször előfordul a példákban a cél jellemzőértékekben.
  4. Másképp:
    1. Az A az a jellemző, amely a legjobban osztályozza a példákat (maximális információs előnyökkel).
    2. Hozzon létre egy döntési fa gyökerét; a gyökér jele ez lesz .
    3. Minden lehetséges értékhez ( ):
      1. Adjon hozzá egy új faágat a gyökér alá egy értékkel rendelkező csomóponttal
      2. Válassza ki a példák azon részhalmazát , amelyekben .
      3. Ha a példák részhalmaza üres, akkor az új ág alá adjon hozzá egy csomópontot azzal a címkével, amelyik a legtöbbször előfordul a példákban a célelem értékeiben.
      4. Ellenkező esetben az új elágazás alá adjon hozzá egy részfát az ID3( , Target Feature, Features) rekurzív meghívásával.
  5. Gyökér visszaadása.

Irodalom