Инновация

Орталық Азия тіл үшін жарыса бастады: Жасанды интеллект қазақша сөйлей ме?

Орталық Азия елдері ұлттық жасанды интеллект жүйесін дамытуға кірісті. Жай ғана технология үшін емес, ұлттық тіл мен мәдениетті сақтап қалу үшін жүріп жатқан жаңа кезеңнің күресі. Әр ел өз тілінде сөйлейтін нейрожелілік модель жасауға ұмтылып отыр. Десе де жаһандық деңгейге жеткен ағылшын және орыс тілі айтарлықтай кедергі тудыруда. Қай елдің ана тілі суырылып алға шығады? Ozgeris.info тілшісі жалғастырады. 

ЖИ - тілді сақтау мен дербестікке апарар жол

Еліміз ЖИ дамуына нақты бағдарлама қабылдаған алғашқы елдердің бірі. 2024 жылы Үкімет бекіткен Жасанды интеллектіні дамыту тұжырымдамасы (2024-2029) осы бағыттағы негізгі бағдарды белгілеп берді. Құжатта қазақ тілі мен ұлттық ерекшеліктерді ескеретін ұлттық нейрожелілік тілдік модель жасау міндеті қойылған.

Мемлекеттік деректерге қол жеткізу, есептеу инфрақұрылымы мен суперкомпьютер салу тұжырымдамаcы аясындағы негізгі техникалық қадамдар:

         •        2024 жылы Smart Data Ukimet платформасы арқылы бизнеске мемлекеттік деректер ашылады;

         •        «Ұлттық ақпараттық технологиялар» АҚ өз деректер орталығында ЖИ платформалары үшін есептеу қуатын ұсынады;

         •        2025 жылы қуаттылығы 1938,41 терафлопс болатын жаңа суперкомпьютер іске қосылады.

Ғылым және жоғары білім министрлігінің дерегі бойынша:

         •        24 университет пен ғылыми орталық ЖИ бойынша зерттеу жүргізіп жатыр;

         •        6 жоғары оқу орны қазақ тілі корпусын әзірлеумен айналысады;

         •        Қазақстанда ЖИ саласында жазылған ғылыми мақалалар саны 1000-нан асты.

Десе де, ресурстар біркелкі бөлінбеген дейді мамандар. Атап айтқанда үш жоғары оқу орны есептеу қуаты жетіспейтінін хабарласа, біреуі мүлде тапшылық барын айтқан.

Қазақ тілі корпусы - 120 миллион токен. Әлемдік деңгейдегі GPT-4 моделімен (1 триллион токен) салыстырғанда аз, ал аймақ үшін алдыңғы қатарлы көрсеткіш.

Сауалнама нәтижелері бойынша, Қазақстан халқының 70%-ы ЖИ-дің қазақ тілінде дамуын қолдайды екен.

Өзбекстан: ЖИ-ді ұлттық тілмен үндестіру

2025 жылы президент Шавкат Мирзиеев өзбек тіліне бейімделген ұлттық ЖИ моделін жасау туралы жариялады. Ол денсаулық сақтау, қаржы, ауыл шаруашылығы және энергетика салаларында қолданылмақ.

Негізгі серіктестер:

         •        БАӘ (бірлескен жоба «ЖИ саласындағы 1 миллион көшбасшы»);

         •       Массачусетс технологиялық институты (білім бағдарламаларын жаңарту).

ЮНЕСКО мәліметі:

         •        Өзбекстанда 15 деректер өңдеу орталығы бар;

         •        Телекоммуникация секторы ЖИ үшін қажет үлкен көлемдегі мәліметтерді жинауға қабілетті.

Алайда, өзбек тілінің интернеттегі үлесі 0,1%-дан төмен, бұл тілдік модельдерге мәлімет жинауды қиындатады. Өзбек тілі корпусы - 80 миллион токен. Халық арасында ЖИ-дің өзбек тілінде дамуын қолдайтындар үлесі - 65%.

Қырғызстан: тұжырымдамалық ізденіс кезеңінде

2025 жылы Қырғызстанда ЖИ жөніндегі Ұлттық кеңес құрылып, жақын арада ұлттық стратегия бекітіледі деп күтілуде. Бұл стратегия жергілікті ЖИ өнімдерін дамытуға бағытталған.

Мәселелер:

         - IT-саладағы жұмыс орындарының 51%-ы ер адамдарға тиесілі -гендерлік теңсіздік;

         - ЖИ бойынша жоғары оқу орындарындағы бағдарламалар аз- техникалық студенттердің тек 10%-ын қамтиды;

       - Қырғыз тілінің интернеттегі көрінісі шектеулі - сапалы тілдік модельдер жасауға кедергі.

Қырғыз тілі корпусы - 50 миллион токен. Бұл аймақтағы ең төменгі көрсеткіштердің бірі.

Тәжікстан: жеке бастамалар, бірақ мемлекеттік қолдау әлсіз

2021 жылы Azizjon Azimi Tajrupt.ai атты ЖИ академиясын құрды. Мақсаты Тәжікстанды аймақтық ЖИ орталығына айналдыру. Алайда, мемлекеттік қолдау өте шектеулі.

Цифрлық инфрақұрылым әлсіз:

         •        2024 жылы халықтың тек 12%-ы ғана жоғары жылдамдықты интернетке қол жеткізе алған;

         •        ЖИ пәндері мектептерде енгізілуде, бірақ тек 5% оқушыны қамтиды.

Тәжік тілі корпусы - 30 миллион токен, ал интернеттегі үлесі - 0,05% шамасында.

Аймақтағы ортақ қиындықтар мен тәуелділік

Жаһандық ЖИ модельдерінің басым көпшілігі ағылшын тіліне негізделген (интернеттегі контенттің 54%). Орыс тілі - 6%, ал Орталық Азия тілдері бірге есептегенде - 0,5%-дан төмен.

Салдарынан аймақ тілдерінің даму мүмкіндігі аз. Қазақстан мен Өзбекстандағы қаржы секторындағы ЖИ шешімдерінің 80%-ы ағылшын немесе орыс тілінде жұмыс істейді.

Қазақстан Alem.ai халықаралық ЖИ орталығын 2025 жылы Астанада ашпақ. Өзбекстан БАӘ мен АҚШ-пен серіктестікке сенеді. Қырғызстан мен Тәжікстан аймақтық бастамаларға қосылуға ниетті, бірақ әзірге мүмкіндіктері шектеулі.

Carnegie Endowment дерегі бойынша, Орталық Азияда ішкі аймақтық сауда - тек 15%. Бұл бірлескен ЖИ жобаларын дамытуда да кедергі болуда.

Барлық жаңалық