catboost | |
---|---|
Tyyppi | Kirjasto koneoppimiseen _ |
Kehittäjä | Yandex |
Sisään kirjoitettu | C++ , Python , JavaScript |
Ensimmäinen painos | 18. heinäkuuta 2017 |
Laitteistoalusta | Linux , macOS , Windows |
uusin versio | 1.0.0 (1. lokakuuta 2021) |
Osavaltio | Aktiivinen |
Lisenssi | Apache 2.0 |
Verkkosivusto | catboost.ai |
CatBoost on Yandexin kehittämä avoimen lähdekoodin ohjelmistokirjasto , joka toteuttaa ainutlaatuisen patentoidun algoritmin koneoppimismallien rakentamiseen käyttämällä yhtä alkuperäisistä gradientin tehostusmenetelmistä . Pääsovellusliittymä kirjaston kanssa työskentelyyn on toteutettu Python-kielelle , myös R - ohjelmointikielelle on toteutus .
18. heinäkuuta 2017 Yandex julkaisi CatBoost-algoritmin sisältävän kirjaston yleisölle Apache 2.0 avoimella lisenssillä [1] [2] [3] , joka on jatkoa ja kehitystä suljetulle Yandex-projektille - Matrixnet .
Yandex on kehittänyt suljetun koneoppimisjärjestelmän Matrixnetin vuodesta 2009 lähtien gradientin tehostamiseksi yrityksen sisäisissä projekteissa, ensisijaisesti kaavan rakentamiseen hakutulosten luokitteluun [4] .
18. heinäkuuta 2017 Yandex asetti CatBoostin saataville GitHubissa ilmaisella Apache 2.0 -lisenssillä . CatBoost on koneoppimisjärjestelmä , joka käyttää yhtä alkuperäisistä gradientin tehostusjärjestelmistä. CatBoost on saatavilla 64-bittisille Linux- , macOS- ja Windows - käyttöjärjestelmille . macOS käyttää alkuperäistä Core ML -kehystä työn nopeuttamiseen - Applen luoma koneoppimismenetelmiä varten .
Verratessaan CatBoostia Googlen ( TensorFlow ) ja Microsoftin ( LightGBM ) vastaaviin koneoppimisjärjestelmiin, Anna Veronika Dorogush, Yandexin koneoppimisen kehitysjohtaja, totesi, että Google TensorFlow ratkaisee eri luokan ongelmia analysoimalla tehokkaasti homogeenista dataa, kuten kuvia. Ja "CatBoost toimii erilaisten tietojen kanssa, ja sitä voidaan käyttää yhdessä TensorFlow'n ja muiden koneoppimisalgoritmien kanssa tietyistä tehtävistä riippuen . " Microsoft LightGBM:ssä venäläinen kehitys voittaa laadussa, mikä näkyy testitaulukossa koneoppimisessa yleisesti hyväksytyillä vertailuilla, mutta toistaiseksi se menettää nopeudessa - minkä Yandex lupaa korjata [5] .
Ensinnäkin CatBoost-tekniikkaa käytetään parantamaan Yandex - hakukoneen tuloksia, asettamaan henkilökohtaisia suositussyötteitä - esimerkiksi Yandex.Zenissä sääennusteiden laskemiseen ja muissa Yandexin Internet-palveluissa , joissa se osoittautui paremmaksi kuin edellinen tekniikka - Matrixnet . Yandex Data Factoryn tiimi käyttää tätä teknologiaa myös teollisuuden ratkaisuissaan , erityisesti optimoimaan raaka-aineiden kulutusta ja ennakoimaan tuotantovirheitä .
Euroopan ydintutkimuskeskus ( CERN ) otti CatBoostin käyttöön Large Hadron Colliderissa (LHC) tehdyn tutkimuksen aikana yhdistääkseen LHCb -ilmaisimen eri osista saadut tiedot tarkimmaksi, aggregoiduksi tiedoksi hiukkasesta. Käyttämällä CatBoostia tietojen yhdistämiseen tutkijat onnistuivat parantamaan lopullisen ratkaisun laadullisia ominaisuuksia, jolloin CatBoostin tulokset osoittautuivat paremmiksi kuin muilla menetelmillä saadut tulokset [6] [7] .
Syväoppimisohjelmat | |
---|---|
ilmainen ohjelmisto |
|
Ei-ilmainen ohjelmisto |
|
|