Catboost

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 6. kesäkuuta 2022 tarkistetusta versiosta . tarkastukset vaativat 2 muokkausta .
catboost
Tyyppi Kirjasto koneoppimiseen _
Kehittäjä Yandex
Sisään kirjoitettu C++ , Python , JavaScript
Ensimmäinen painos 18. heinäkuuta 2017
Laitteistoalusta Linux , macOS , Windows
uusin versio 1.0.0 (1. lokakuuta 2021)
Osavaltio Aktiivinen
Lisenssi Apache 2.0
Verkkosivusto catboost.ai

CatBoost on Yandexin kehittämä  avoimen lähdekoodin ohjelmistokirjasto , joka toteuttaa ainutlaatuisen patentoidun algoritmin koneoppimismallien rakentamiseen käyttämällä yhtä alkuperäisistä gradientin tehostusmenetelmistä . Pääsovellusliittymä kirjaston kanssa työskentelyyn on toteutettu Python-kielelle , myös R - ohjelmointikielelle on toteutus .

18. heinäkuuta 2017 Yandex julkaisi CatBoost-algoritmin sisältävän kirjaston yleisölle Apache 2.0 avoimella lisenssillä [1] [2] [3] , joka on jatkoa ja kehitystä suljetulle Yandex-projektille - Matrixnet .

Historia

Matrixnet

Yandex on kehittänyt suljetun koneoppimisjärjestelmän Matrixnetin vuodesta 2009 lähtien gradientin tehostamiseksi yrityksen sisäisissä projekteissa, ensisijaisesti kaavan rakentamiseen hakutulosten luokitteluun [4] .

catboost

18. heinäkuuta 2017 Yandex asetti CatBoostin saataville GitHubissa ilmaisella Apache 2.0 -lisenssillä . CatBoost on koneoppimisjärjestelmä , joka käyttää yhtä alkuperäisistä gradientin tehostusjärjestelmistä. CatBoost on saatavilla 64-bittisille Linux- , macOS- ja Windows - käyttöjärjestelmille . macOS käyttää alkuperäistä Core ML -kehystä työn nopeuttamiseen - Applen  luoma koneoppimismenetelmiä varten .

Verratessaan CatBoostia Googlen ( TensorFlow ) ja Microsoftin ( LightGBM ) vastaaviin koneoppimisjärjestelmiin, Anna Veronika Dorogush, Yandexin koneoppimisen kehitysjohtaja, totesi, että Google TensorFlow ratkaisee eri luokan ongelmia analysoimalla tehokkaasti homogeenista dataa, kuten kuvia. Ja "CatBoost toimii erilaisten tietojen kanssa, ja sitä voidaan käyttää yhdessä TensorFlow'n ja muiden koneoppimisalgoritmien kanssa tietyistä tehtävistä riippuen . " Microsoft LightGBM:ssä venäläinen kehitys voittaa laadussa, mikä näkyy testitaulukossa koneoppimisessa yleisesti hyväksytyillä vertailuilla, mutta toistaiseksi se menettää nopeudessa - minkä Yandex lupaa korjata [5] .

Sovellus

Ensinnäkin CatBoost-tekniikkaa käytetään parantamaan Yandex - hakukoneen tuloksia, asettamaan henkilökohtaisia ​​suositussyötteitä - esimerkiksi Yandex.Zenissä sääennusteiden laskemiseen ja muissa Yandexin Internet-palveluissa , joissa se osoittautui paremmaksi kuin edellinen tekniikka - Matrixnet . Yandex Data Factoryn tiimi käyttää tätä teknologiaa myös teollisuuden ratkaisuissaan , erityisesti optimoimaan raaka-aineiden kulutusta ja ennakoimaan tuotantovirheitä .

Euroopan ydintutkimuskeskus ( CERN ) otti CatBoostin käyttöön Large Hadron Colliderissa (LHC) tehdyn tutkimuksen aikana yhdistääkseen LHCb -ilmaisimen eri osista saadut tiedot tarkimmaksi, aggregoiduksi tiedoksi hiukkasesta. Käyttämällä CatBoostia tietojen yhdistämiseen tutkijat onnistuivat parantamaan lopullisen ratkaisun laadullisia ominaisuuksia, jolloin CatBoostin tulokset osoittautuivat paremmiksi kuin muilla menetelmillä saadut tulokset [6] [7] .

Muistiinpanot

  1. Yandex on julkaissut uuden koneoppimiskirjaston yleisölle . Yandex . (18. heinäkuuta 2017). Haettu 8. kesäkuuta 2018. Arkistoitu alkuperäisestä 12. kesäkuuta 2018.
  2. CatBoost on Yandexin uusi koneoppimismenetelmä . Yandex . (18. heinäkuuta 2017). Haettu 8. kesäkuuta 2018. Arkistoitu alkuperäisestä 12. kesäkuuta 2018.
  3. Yandex avaa CatBoost-koneoppimisteknologian . Habr . (18. heinäkuuta 2017). Haettu 8. kesäkuuta 2018. Arkistoitu alkuperäisestä 12. kesäkuuta 2018.
  4. Tekniikat: Matrixnet . Yandex . . Haettu 8. kesäkuuta 2018. Arkistoitu alkuperäisestä 8. kesäkuuta 2018.
  5. Miksi Yandex avasi pääsyn koneoppimisjärjestelmäänsä . Forbes . (19. heinäkuuta 2017). Haettu 8. kesäkuuta 2018. Arkistoitu alkuperäisestä 7. kesäkuuta 2018.
  6. "Yandex" on julkaissut vaihtoehdon julkisille hermoverkoille . Cnews . (18. heinäkuuta 2017). Haettu 8. kesäkuuta 2018. Arkistoitu alkuperäisestä 12. kesäkuuta 2018.
  7. "Yandex" esitteli uuden koneoppimismenetelmän CatBoost . 3DNews . (18. heinäkuuta 2017). Haettu 8. kesäkuuta 2018. Arkistoitu alkuperäisestä 12. kesäkuuta 2018.

Linkki