Automatikus gépi tanulás
Az Automated Machine Learning ( AutoML ) a gépi tanulás valós problémákra való alkalmazásának végpontok közötti folyamatának automatizálási folyamata . Egy tipikus gépi tanulási alkalmazásban a felhasználónak megfelelő adat - előfeldolgozási , jellemzőtervezési, jellemzőkivonási és jellemzőkiválasztási módszereket , amelyek alkalmassá teszik az adatkészletet a gépi tanulásra. E lépések után a dolgozónak el kell végeznie az algoritmus kiválasztását és a hiperparaméterek optimalizálását , hogy maximalizálja a végső modell várható teljesítményét. Mivel ezek közül a lépések közül sokat ember nem hajthat végre szakértő nélkül, az AutoML megközelítést AI-alapú megoldásként javasolták a gépi tanulás egyre növekvő igényére [1] [2] . A gépi tanulás alkalmazásának end-to-end folyamatának automatizálása azzal az előnnyel jár, hogy egyszerűbb megoldásokat kapunk, gyorsabban hozhatók létre olyan megoldások és modellek, amelyek gyakran felülmúlják a manuálisan épített modelleket.
Az automatikus gépi tanulás a folyamat különböző szakaszait célozhatja meg [2] :
- automatikus adat-előkészítés és adatgyűjtés és tárolás (nyers adatokból és különböző formátumokból):
- az oszloptípus automatikus felismerése, például logikai adatok, diszkrét numerikus adatok, folyamatos numerikus értékek vagy szöveg;
- az oszlop jelentésének automatikus meghatározása; például egy cél, egy címke, egy regionalizációs mező , egy numerikus attribútum, egy szövegkategória vagy szabad szöveg;
- automatikus feladatfelderítés, például bináris osztályozás , regresszió , klaszterezés vagy rangsorolás ;
- automatikus funkció konstrukció :
- funkció kiválasztása
- jellemző kivonás
- meta -learning és transzfertanulás
- aszimmetrikus adatok vagy hiányzó értékek észlelése és feldolgozása;
- automatikus modellválasztás ;
- a tanulási és jellemzési algoritmus hiperparamétereinek optimalizálása ;
- a csatornák automatikus kiválasztása idő, memória és nehézségi határok szerint;
- az értékelési mérőszámok és érvényesítési eljárások automatikus kiválasztása;
- automatikus feladatellenőrzés:
- szivárgás észlelés;
- konfigurációs hibák azonosítása;
- a kapott eredmények automatikus elemzése;
- egyéni eredmények és vizualizáció az automatikus gépi tanuláshoz
Jegyzetek
- ↑ Auto-WEKA: Osztályozási algoritmusok kombinált kiválasztása és hiperparaméteres optimalizálása . KDD '13 Proceedings of the 19th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. pp. 847-855.
- ↑ 1 2 Hutter F, Caruana R, Bardenet R, Bilenko M, Guyon I, Kegl B és Larocelle H. AutoML 2014 @ ICML . AutoML 2014 Workshop @ ICML . Letöltve: 2018. március 28. (határozatlan)
Irodalom
- Kotthoff L., Thornton C., Hoos HH, Hutter F., Leyton-Brown K. Auto-WEKA 2.0: Automatic model selection and hyperparameter optimization in WEKA // Journal of Machine Learning Research. — 2017.
- Feurer M., Klein A., Eggensperger K., Springenberg J., Blum M., Hutter F. Efficient and Robust Automated Machine Learning // Advances in Neural Information Processing Systems 28 (NIPS 2015). — 2015.
- Olson RS, Urbanowicz RJ, Andrews PC, Lavender NA, Kidd L., Moore JH Orvosbiológiai adattudomány automatizálása faalapú csővezeték-optimalizálással // Proceedings of EvoStar 2016. - 2016. - doi : 10.1007/978-3-12049 -0_9 . - arXiv : 1601.07925 .
- Olson RS, Bartley N., Urbanowicz RJ, Moore JH Az adattudomány automatizálására szolgáló faalapú csővezeték-optimalizáló eszköz értékelése // Proceedings of EvoBIO 2016. - 2016. - doi : 10.1145/2908812.2908918 . - arXiv : 1603.06212 .
- Alex GC de Sá, Walter José GS Pinto, Luiz Otavio VB Oliveira, Gisele L. Pappa. RECEPT : Nyelvtani alapú keretrendszer automatikusan fejlődő osztályozási folyamatokhoz . - Springer International Publishing, 2017. - (Számítástechnikai előadásjegyzetek). — ISBN 9783319556956 . - doi : 10.1007/978-3-319-55696-3_16 .