Catboost

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2022. június 6-án felülvizsgált verziótól ; az ellenőrzések 2 szerkesztést igényelnek .
catboost
Típusú Könyvtár a gépi tanuláshoz
Fejlesztő Yandex
Beírva C++ , Python , JavaScript
Első kiadás 2017. július 18
Hardver platform Linux , macOS , Windows
legújabb verzió 1.0.0 (2021. október 1.)
Állapot Aktív
Engedély Apache 2.0
Weboldal catboost.ai

A CatBoost  egy nyílt forráskódú szoftverkönyvtár , amelyet a Yandex fejlesztett ki, és egyedülálló szabadalmaztatott algoritmust valósít meg a gépi tanulási modellek felépítéséhez , az egyik eredeti gradiensnövelő séma használatával . A könyvtárral való munkavégzés fő API a Python nyelvhez van implementálva , és van egy megvalósítás az R programozási nyelvhez is .

2017. július 18-án a Yandex nyilvánosságra hozta a CatBoost algoritmussal ellátott könyvtárat az Apache 2.0 nyílt licenc alatt [1] [2] [3] , amely a lezárt Yandex projekt - Matrixnet folytatása és továbbfejlesztése .

Történelem

Matrixnet

A Matrixnet zárt gépi tanulási rendszert a Yandex 2009 óta fejlesztette ki, hogy a cég belső projektjeiben a gradiens-növelést alkalmazza, elsősorban a keresési eredmények rangsorolására szolgáló képlet felépítésére [4] .

catboost

2017. július 18-án a CatBoost ingyenesen elérhetővé tette a GitHubon a Yandex által ingyenes Apache 2.0 licenc alatt . A CatBoost egy gépi tanulási rendszer , amely az egyik eredeti gradiensnövelő sémát használja. A CatBoost 64 bites Linux , macOS és Windows operációs rendszerekhez érhető el . A macOS az eredeti Core ML keretrendszert használja a munka felgyorsítására  - az Apple készítette gépi tanulási módszerekhez .

A CatBoost a Google ( TensorFlow ) és a Microsoft ( LightGBM ) hasonló gépi tanulási rendszereivel összehasonlítva Anna Veronika Dorogush, a Yandex gépi tanulási fejlesztési részlegének vezetője megjegyezte, hogy a Google TensorFlow egy másik osztályú problémákat old meg a homogén adatok, például képek hatékony elemzésével. És "A CatBoost más jellegű adatokkal működik, és használható a TensorFlow-val és más gépi tanulási algoritmusokkal együtt, a konkrét feladatoktól függően . " A Microsoft LightGBM-nél minőségben az orosz fejlesztés nyer, amit a teszttáblázat mutat a gépi tanulásban általánosan elfogadott összehasonlításokkal, de egyelőre veszít a sebességből - amit a Yandex ígér kijavítani [5] .

Alkalmazás

Először is a CatBoost technológiát használják a Yandex keresőmotor eredményeinek javítására , egy személyes ajánlási hírfolyam rangsorolására - például a Yandex.Zenben , az időjárás-előrejelzések kiszámításához és más Yandex internetes szolgáltatásokban , ahol jobbnak bizonyult, mint a korábbi technológia - Matrixnet . A Yandex Data Factory csapata ezt a technológiát az ipari megoldásaiban is alkalmazza, különösen a nyersanyag -felhasználás optimalizálására és a gyártási hibák előrejelzésére .

A CatBoost az Európai Nukleáris Kutatási Központ ( CERN ) valósította meg a Large Hadron Collider (LHC) kutatása során, hogy az LHCb detektor különböző részeiből származó információkat a részecskékről szóló legpontosabb, összesített ismeretekké egyesítse. A CatBoost segítségével az adatok kombinálására a tudósoknak sikerült javítaniuk a végső megoldás minőségi jellemzőit, ahol a CatBoost eredményei jobbnak bizonyultak, mint a más módszerekkel kapott eredmények [6] [7] .

Jegyzetek

  1. A Yandex új gépi tanulási könyvtárat adott ki a nyilvánosság számára . Yandex . (2017. július 18.). Letöltve: 2018. június 8. Archiválva az eredetiből: 2018. június 12.
  2. A CatBoost egy új gépi tanulási módszer a Yandextől . Yandex . (2017. július 18.). Letöltve: 2018. június 8. Archiválva az eredetiből: 2018. június 12.
  3. A Yandex megnyitja a CatBoost gépi tanulási technológiát . Habr . (2017. július 18.). Letöltve: 2018. június 8. Archiválva az eredetiből: 2018. június 12.
  4. Technológiák: Matrixnet . Yandex . . Letöltve: 2018. június 8. Az eredetiből archiválva : 2018. június 8.
  5. Miért nyitott hozzáférést a Yandex gépi tanulási rendszeréhez ? Forbes . (2017. július 19.). Letöltve: 2018. június 8. Archiválva az eredetiből: 2018. június 7.
  6. A "Yandex" közzétett egy alternatívát a neurális hálózatokhoz, amelyek nyilvánosak . Cnews . (2017. július 18.). Letöltve: 2018. június 8. Archiválva az eredetiből: 2018. június 12.
  7. A "Yandex" új gépi tanulási módszert vezetett be a CatBoost . 3DNews . (2017. július 18.). Letöltve: 2018. június 8. Archiválva az eredetiből: 2018. június 12.

Link