Kontent qismiga oʻtish

CatBoost

Vikipediya, erkin ensiklopediya

CatBoost — bu Yandex tomonidan ishlab chiqilgan boʻlib, gradient bustingning bitta original tuzilmasini qoʻllaydigan tezkor oʻrgatish modelining patentlangan noyob algoritmi orqali amalga oshiriluvchi ochiq dasturiy kutubxona hisoblanadi. Python tili uchun kutubxona bilan ishlashda asosiy API bilan, shuningdek, R dasturlash tili bilan ham amalga oshiriladi[1][2][3].

2017-yilning 18-iyulida Yandeksning yopiq loyihasi — Matrixnet[⇨] davomchisi va rivojlantiruvchisi hisoblangan Apache 2.0 ochiq ruxsatnomasi ostida CatBoost algoritmiga ega boʻlgan kutubxonani ommaga chiqardi.

Matrixnet, tezkor oʻqitishning yopiq tizimi boʻlib, u 2009-yildan buyon Yandeks tomonidan kompaniyaning ichki loyihalarida, birinchi navbatda, qidiruv natijalarini tartiblash formulasini yaratishda gradientni kuchaytirishda foydalanish uchun ishlab chiqilgan[4].

2017-yilning 18-iyulda CatBoost Yandeks kompaniyasi tomonidan Apache 2.0 erkin ruxsatnomasi ostida GitHubda bepul kirish uchun ochildi.CatBoost gradient bustingining original tuzilishida foydalaniluvchi tezkor oʻqitish tizimi hisoblanadi. CatBoost 64-bitli Linux, macOS va Windows operatsion tizimlari uchun mavjud. MacOS operatsion tizimida ishni tezlashtirish uchun original freymvork Core ML (ingl.)uzb. — Apple tomonidan tezkor oʻrganish usullari uchun yaratilgan freymvorkdan foydalaniladi.

CatBoostni Google (TensorFlow) va Microsoft (LightGBM) kabi kompaniyalarining shunga oʻxshash tezkor oʻrgatish tizimlari bilan solishtirganda, „Yandeks“ tezkor oʻrganish tizimlarini ishlab chiqish boʻlimi boshligʻi Anna Veronika Dorogush taʼkidlaganidek, Google TensorFlow bir hil maʼlumotlarni samarali tahlil qilib, boshqa sinfdagi muammolarni hal qiladi. „CatBoost boshqa xarakterdagi maʼlumotlar bilan ishlaydi va muayyan vazifalarga qarab TensorFlow va boshqa tezkor oʻrganish algoritmlari bilan birgalikda qoʻllanishi mumkin“. Microsoft LightGBM esa oʻzining ruscha ishlanmasi bilan sifat boʻyicha yuqori turadi, bu test jadvalida tezkor oʻrganishda umumiy qabul qilingan taqqoslash natijalarida koʻrsatilgan, ammo hozirda u oʻz tezligini yoʻqotmoqda — Yandeks ushbu holatni tuzatishga vaʼda bermoqda[5].

CatBoost texnologiyasi birinchidan, Yandeks qidiruv tizimining natijalarini yaxshilash, shaxsiy tavsiyalar tasmasini tartiblash uchun qoʻllanadi — masalan, Yandeks.Zenda, ob-havo bashoratlarini hisoblash uchun va boshqa internet tizimlarida Yandeks oldingi texnologiyaga qaraganda — Matriksnet yaxshisi ekanligi isbotlangan. Yandex Data Factory jamoasi ushbu texnologiyadan sanoat uchun yechimlarida ham foydalanadi, xususan, u xom-ashyo sarfini optimallashtirish va ishlab chiqarishdagi nuqsonlarni bashorat qilishda keng qoʻllanadi.

CatBoost Yevropa yadroviy tadqiqotlar markazi (TsERN) tomonidan Katta adron kollayderida (KAK) olib borilgan tadqiqotlar davomida LHCb detektorining turli qismlaridan olingan maʼlumotlarni zarracha haqidagi eng aniq, jamlangan bilimga birlashtirish uchun amalga oshirildi. Maʼlumotlarni birlashtirish uchun CatBoostdan foydalanib, olimlar yakuniy yechimning sifat xususiyatlarini yaxshilashga muvaffaq boʻlishdi, bunda CatBoost natijalari boshqa usullar yordamida olingan yaxshi natijalarni koʻrsatdi[6][7].