catboost | |
---|---|
Típusú | Könyvtár a gépi tanuláshoz |
Fejlesztő | Yandex |
Beírva | C++ , Python , JavaScript |
Első kiadás | 2017. július 18 |
Hardver platform | Linux , macOS , Windows |
legújabb verzió | 1.0.0 (2021. október 1.) |
Állapot | Aktív |
Engedély | Apache 2.0 |
Weboldal | catboost.ai |
A CatBoost egy nyílt forráskódú szoftverkönyvtár , amelyet a Yandex fejlesztett ki, és egyedülálló szabadalmaztatott algoritmust valósít meg a gépi tanulási modellek felépítéséhez , az egyik eredeti gradiensnövelő séma használatával . A könyvtárral való munkavégzés fő API a Python nyelvhez van implementálva , és van egy megvalósítás az R programozási nyelvhez is .
2017. július 18-án a Yandex nyilvánosságra hozta a CatBoost algoritmussal ellátott könyvtárat az Apache 2.0 nyílt licenc alatt [1] [2] [3] , amely a lezárt Yandex projekt - Matrixnet folytatása és továbbfejlesztése .
A Matrixnet zárt gépi tanulási rendszert a Yandex 2009 óta fejlesztette ki, hogy a cég belső projektjeiben a gradiens-növelést alkalmazza, elsősorban a keresési eredmények rangsorolására szolgáló képlet felépítésére [4] .
2017. július 18-án a CatBoost ingyenesen elérhetővé tette a GitHubon a Yandex által ingyenes Apache 2.0 licenc alatt . A CatBoost egy gépi tanulási rendszer , amely az egyik eredeti gradiensnövelő sémát használja. A CatBoost 64 bites Linux , macOS és Windows operációs rendszerekhez érhető el . A macOS az eredeti Core ML keretrendszert használja a munka felgyorsítására - az Apple készítette gépi tanulási módszerekhez .
A CatBoost a Google ( TensorFlow ) és a Microsoft ( LightGBM ) hasonló gépi tanulási rendszereivel összehasonlítva Anna Veronika Dorogush, a Yandex gépi tanulási fejlesztési részlegének vezetője megjegyezte, hogy a Google TensorFlow egy másik osztályú problémákat old meg a homogén adatok, például képek hatékony elemzésével. És "A CatBoost más jellegű adatokkal működik, és használható a TensorFlow-val és más gépi tanulási algoritmusokkal együtt, a konkrét feladatoktól függően . " A Microsoft LightGBM-nél minőségben az orosz fejlesztés nyer, amit a teszttáblázat mutat a gépi tanulásban általánosan elfogadott összehasonlításokkal, de egyelőre veszít a sebességből - amit a Yandex ígér kijavítani [5] .
Először is a CatBoost technológiát használják a Yandex keresőmotor eredményeinek javítására , egy személyes ajánlási hírfolyam rangsorolására - például a Yandex.Zenben , az időjárás-előrejelzések kiszámításához és más Yandex internetes szolgáltatásokban , ahol jobbnak bizonyult, mint a korábbi technológia - Matrixnet . A Yandex Data Factory csapata ezt a technológiát az ipari megoldásaiban is alkalmazza, különösen a nyersanyag -felhasználás optimalizálására és a gyártási hibák előrejelzésére .
A CatBoost az Európai Nukleáris Kutatási Központ ( CERN ) valósította meg a Large Hadron Collider (LHC) kutatása során, hogy az LHCb detektor különböző részeiből származó információkat a részecskékről szóló legpontosabb, összesített ismeretekké egyesítse. A CatBoost segítségével az adatok kombinálására a tudósoknak sikerült javítaniuk a végső megoldás minőségi jellemzőit, ahol a CatBoost eredményei jobbnak bizonyultak, mint a más módszerekkel kapott eredmények [6] [7] .
Yandex | ||||||||
---|---|---|---|---|---|---|---|---|
Emberek |
| |||||||
Keresési szolgáltatások |
| |||||||
Foodtech | ||||||||
Személyes szolgáltatások | ||||||||
Aggregátorok |
| |||||||
Webmesterek és cégek |
| |||||||
Fintech |
| |||||||
Programok |
| |||||||
Technológia |
| |||||||
Eszközök |
| |||||||
Okos Ház |
| |||||||
Gépjármű szállítás | ||||||||
Futárrobotok | ||||||||
Oktatás | ||||||||
Lezárt projektek |
| |||||||
Yandex 360 szolgáltatások |
| |||||||
Egyéb | ||||||||
|
Mélytanulási programok | |
---|---|
ingyenes szoftver |
|
Nem ingyenes szoftver |
|
|