16:25 / 02.02.2021
16318

Mujmal og‘zaki nutq, Google-tarjimondagi o‘zbek tili va qo‘shalifbo muammosi - lingvist olima bilan suhbat

Tillarning internet va elektron tilga aylanishi – zamonaviy dunyoda ularning rivojlanishi uchun eng muhim omillardan biri. Shu ma'noda o‘zbek tilini ham ravnaq toptirishda kompyuter lingvistikasini rivojlantirish bugun har qachongidan muhim.

Nilufar Abdurahmonova

Kun.uz muxbiri ayni sohada ilmiy izlanishlar olib borayotgan yosh tadqiqotchilardan biri Nilufar Abdurahmonova bilan suhbat tashkil etdi.

Filologiya fanlari bo‘yicha falsafa doktori (PhD) Nilufar Abdurahmonova Toshkent davlat o‘zbek tili va adabiyoti universiteti dotsenti sifatida ishlab kelmoqda.

— Bizda tilshunoslik deganda faqat ona tili qoidalarini o‘rganish va o‘rgatish tushuniladi. Nega unday?

— Lingvistikani ona tili qoidalarini o‘rganish deb tushunmaslik kerak. Chunki ona tili va adabiyot – tilni o‘zlashtirish bilan bog‘liq kompetensiyaviy jarayon.

Omma tasavvuridagi tilshunoslik bilan ilm ahlining tushunchasidagi tilshunoslik o‘rtasida tavofut bor, albatta. Bizda ona tili sifatida o‘qitishda ayrim kamchiliklar kuzatilgan, masalan, grammatikaga asosiy e'tibor qaratilgan.

Avvalgi til o‘qitish dasturi, ya'ni grammatika asosida ona tilini o‘rgangan avlodning tafakkuri keng, lekin og‘zaki nutqi adabiy til me'yorlari darajasida emas. Biror mavzuda fikr bildir deyilsa, nima qilarini bilmay qoladi, mikrofon oldiga kelganda qo‘rqadi, chunki tafakkur voqelanganda nutqi yo‘qligidan qo‘rqadi. Shunga qiyosan, rusiyzabon yoshlar nutqini solishtirsak, ular o‘z ichki nutqini tashqi nutqiga bemalol chiqara oladi.

O‘zbek tilini ona tili sifatida o‘qitish bo‘yicha tasdiqlangan yangi Milliy dasturda esa asosiy maqsad – kommunikatsion tilni rivojlantirish, ya'ni bolani jonli muloqotga tayyorlash.

Shuningdek, tilshunoslikdagi ko‘p sohalarning yangiligi va ularning amaliyotga joriy qilinmagani ham omma uchun shunday tasavvur berishi mumkin. Til bilan bog‘liq yangi sohalar birgalikda amaliyotga tatbiq etilsagina uning tom ma'nodagi ilmiy maqomi ko‘tariladi.

Tilshunoslikda kompyuter lingvistikasidan tashqari neyrolingvistika, kognitiv lingvistika, psixolingvistika, biolingvistika kabi yangi sohalar mavjud.

Siz nega aynan kompyuter lingvistikasini tanlagansiz? Sizni ko‘proq qiynaydigan muammo qaysi – til bo‘yicha ishlarmi yoki masalaning dasturiy tomonimi?

— Meni bu sohaga qiziqtira olgan inson professor Abdumajid Po‘latov bo‘lgan va ulardan umrbod minnatdorman. U insonning olim va odamiylik fazilatlari men kabi ko‘plab yoshlarni ilm yo‘liga kirishlarida turtki bo‘lgan. Ular hamisha tilni har narsadan yuqori qo‘yardilar. Zero, til barcha fanlarni o‘zlashtirishda vositachi hisoblanadi, der edilar.

Ko‘pchilikning fikricha, ingliz tilining formulasi bor va shuning uchun u modellashtirilgan. Xo‘sh, o‘zbek tilining modeli yo‘qmi? Albatta bor. Negaki, so‘z qo‘llash va gapni shakllantirishda boshqa turkiy tillarga qaraganda o‘zbek tili optimal holatga keltirilgan. Ya'ni qoidalar u darajada ko‘p emas. Masalan, qattiq yoki yumshoq unlilar morfotaktikasi (qo‘shimchalar qo‘shilish ketma-ketligi).

Albatta, har qanday tabiiy tilning istisnoli holatlari bo‘ladi, bu – tilning yoki til vakillarining aybi emas. Chunki u jamiyat bilan yashaydi va hamisha shakllanib boradi.

O‘zbek tilida dasturiy ta'minotlar qilinmagani kompyuter lingvistikasiga faqat fan sifatida qaralganida deb bilaman. Uning mazmunida yotgan har bir masala o‘zbek tili texnologiyasiga tegishli bo‘lib, uni davlat siyosati darajasida amalga oshirish lozim edi.

Endilikda o‘zbek tilining yozma muloqoti uchun ikkitalik grafemadan (kirill va lotin) foydalanilayotgani va imlo qoidalariga hali ham bepisandlik bilan qaralayotgani tilni kompyuter tiliga o‘tkazishda, aynan til texnologiyasi uchun ayrim muammolarni keltirib chiqaradi.

Lotin va kirill alifbosining parallel foydalanilayotgani lingvistik resurslarning har xilligini keltirib chiqaradi. Agar lotin yozuviga to‘liq o‘tilsa, o‘zbek tili uchun dasturlar yanada takomillashib boraveradi, grafemalar bilan bog‘liq muammolar ham barham topadi.

Dasturlashda o‘zbek tilining elektron resurslarini (o‘zbek tili korpusi, elektron lug‘atlari, internet sahifalaridagi matnlar) va texnologiyalarini takomillashtirib, ularni tezlik bilan yaratish kerak. Til texnologiyasi uchun tilni yanada murakkablashtirishning hojati yo‘q.

O‘zbek tili boricha, shundayligicha formallashtirilsa, maqsadga muvofiq. Nima uchun o‘zbek tilida korpus lingvistikasini rivojlantirish kerak? Chunki korpus bu – nafaqat yozma matnlar, balki og‘zaki nutqni kompyuter o‘qiy oladigan shaklga keltira oladigan yagona elektron majmua.

O‘tgan yildan boshlab 4ta OTMda kompyuter lingvistikasi magistratura mutaxassisligi ochildi. Buni shu sohaga daxldor muammoli masalalar uchun yechim deb aytsak bo‘ladi. Chunki shu sohada yetishib chiqayotgan kadrlar kelajakda aynan o‘zbek tili texnologiyasi, ya'ni kompyuter lingvistikasini rivojlantirishga hissa qo‘shishiga ishonamiz.

Hozirda qanday loyihalar ustida ishlayapsiz?

— 2020 yilda «O‘zbekiston ayollarining eng yaxshi 100 ta innovatsion loyihasi» tanlovida biz taqdim etgan ishlanma sovrindorlikka munosib deb topildi. Loyiha nomi – «O‘zbek tilining ko‘pfunksional platformasini yaratish». Loyiha Koreyaning xalqaro ixtirochi ayollar assotsiatsiyasining maxsus sertifikatiga sazovor bo‘ldi.

2020 yilda Mahalla va oilani qo‘llab-quvvatlash vazirligi huzuridagi «Mahalla va oila» ilmiy-tadqiqot instituti tomonidan qisqa muddatga mo‘ljallangan loyihamiz tasdiqlandi. Bu loyiha «Oila, mahalla va gender tengligi mavzusidagi badiiy asarlarning elektron korpusini yaratish» deb nomlanadi.

Ma'lumki, badiiy asarlarimiz tarqoq holatda PDF shaklda turadi. Bizning loyihamizda esa milliy adabiyotimizning jadid, sovet va mustaqillik davrida yaratilgan badiiy adabiyotlar xronologik jihatdan tasniflangan elektron korpusi jamlanadi. Ushbu elektron korpus nafaqat filologik tadqiqotlar uchun, balki kompyuter lingvistikasi, psixologiya, pedagogika va boshqa ijtimoiy sohalar uchun ham o‘rganish obekti bo‘lishi mumkin.

Badiiy adabiyot ko‘pincha adabiyotshunoslar tomonidan o‘rganiladi. Uning psixologik, ijtimoiy, pedagogik jihati esa kam o‘rganilgan. Loyihamizdan maqsad – o‘zbek tilining matnlar korpusi ilmiy tadqiqot ishlari uchun muhim manba bo‘lib xizmat qilsin.

Erishilgan yutuqlarimiz va loyihalarimiz ortida ilmiy jamoa ishlaydi, shogirdlarim, dasturchilar va boshqa soha mutaxassislari.

Google-tarjimon dasturining o‘zbek versiyasidagi matnlar nega yaxshi o‘girilmaydi?

— 2014 yil o‘zbek tili boshqa tillar qatori Google-tarjimonga kiritildi. O‘sha paytlarda tarjima sifati yaxshi emas edi, uning asosiy texnologiyasi lug‘at va qoidalarga tayanilgan.

Istalgan tilning lug‘ati nechog‘lik boy bo‘lmasin, mashina tarjimasi uchun bu yetarli bo‘lmadi. Chunki matn tuzish – bu har bir kishining individual xos tabiatidan kelib chiqadigan hodisa va leksikologiya doimiy ravishda o‘zgarib turadi. Shuning uchun bu sohada faqatgina tuzilgan lug‘atlar va qoidalar bilan uzoqqa borib bo‘lmaydi. Endilikda Google statistikaga asoslangan yoki neyro mashina tarjimasi texnologiyasi bilan tarjimalar qilmoqda.

Buning mohiyati shundaki, statistik ma'lumotlar olingan ehtimollik holatidan kelib chiqib, mavjud tarjima adekvatlaridan foydalaniladi. Bu esa o‘zbek tilining parallel korpuslar texnologiyasi ustida ham talaygina tadqiqotlar yaratish zaruriyatini ko‘rsatadi. Ayon bo‘lyaptiki, muammo yana korpus mavzusiga kelyapti, chunki bu – o‘zbek tilini rivojlantirish uchun eng kerakli sohalardan biri.

Mening PhD dissertatsiyam aynan mashina tarjimasi bo‘yicha «Inglizcha matnlarni o‘zbek tiliga tarjima qilish dasturlarining lingvistik ta'minoti» mavzusida bo‘lgan. Tadqiqotimizda inglizcha matnlarni o‘zbek tiliga tarjima qilish uchun ingliz tilidagi 12 mingta fe'lli frazemaning 180 mingta ma'nosi, 10 mingta so‘zning inglizcha-o‘zbekcha tarjimasi, matematik va tilshunoslikka doir terminlar ma'lumotlar bazasiga kiritilgan. Shuningdek, ingliz va o‘zbek tilidagi derivatsion qo‘shimchalar bazasi, gap modellari shakllantirilib, uning lingvistik algoritmlari ishlab chiqilgan.

Men mutaxassis sifatida aynan mashina tarjimasini o‘rganish orqali kompyuter lingvistikasini bilishim mumkinligiga ishonardim. Chunki mashina tarjimasi ko‘rinishidan tarjima faoliyati bo‘lib tuyulsa-da, ishlash texnologiyasi morfologik analizator, sintaktik tahlil (parsing), korpus texnologiyasi, amaliy leksikografiya, spelling (avtomatik tahrirlash) kabi qator sohalarni ham o‘rganishni taqozo etadi va bularsiz avtomatik matn tahlili haqida gapirish o‘rinsiz.

Tarixga qarasak, kompyuter lingvistikasi paydo bo‘lishiga zamin bo‘lgan omillardan biri ham mashina tarjimasining yaratilgani bo‘lgan.

Sifatli mashina tarjimasi moliyaviy qo‘llab-quvvatlash bo‘lishini ham talab qiladi. O‘zbekistonda til texnologiyasini rivojlantirish uchun intellektual potensial yetarli: dasturchi ham, tilshunos ham, tarjimon ham bor.

Xabaringiz bor, 2020 yil oktyabr oyida prezidentimiz Shavkat Mirziyoyevning til siyosatini yanada qo‘llab-quvvatlovchi farmoni e'lon qilingan edi. Hozir qayd etib o‘tgan barcha fikrlarimiz farmonda keltirilgan til texnologiyasiga doir ustuvor vazifalarga aynan mos keladi. Umid qilamizki, bu bo‘yicha ishlar o‘zining yechimini topadi.

Nega o‘zbek tiliga yangi kirib kelgan va chiqib ketgan so‘zlarning monitoringi qilinmaydi yoki yangi so‘zlarning yozilishi elektron lug‘atlar shaklida aholiga tavsiya qilinmaydi?

— ToshDO‘TAUda terminlar tarjimasi bo‘yicha kichik loyihalar tanlovi e'lon qilingandi, unda asosan talabalar qatnashib, 30 dan ortiq turdagi kichik ilmiy atamalar lug‘atlari yaratildi. Bu mavjud terminlarning o‘zbekchasi bilan bog‘liq muammoni hal etdi xolos. Lekin har yili tilimizga kirib kelayotgan so‘z va terminlar monitoring va tahlil qilinmaydi.

Mashina tarjimasi mavzusi bilan shug‘ullanganimda ham men uchun eng katta muammo terminlar bo‘lgan. O‘zbek tilida yaratilgan aniq va tabiiy fanlarning leksikasi tarjimasi bilan qiziqqanimda, bu borada lug‘atlar yetishmasligiga guvoh bo‘lganman. Ya'ni ularning aynan adekvat tarjimasi ayrim terminlar uchun deyarli mavjud emas.

Litvada o‘zim guvoh bo‘lgan bir voqea esimga tushdi. Bir kuni ilmiy rahbarim 1–2 soatlik majlis bo‘lishi, istasam unga kirishim mumkinligini aytdi. Majlis litov tilida bo‘lib, katta monitor qarshisida nimalarnidir muhokama qilishdi. Keyin bilsam munozara loyiha doirasida yaratilayotgan lug‘atga muayyan so‘zlarni kiritish yoki kiritmaslik bo‘yicha ekan. To‘g‘risi, so‘zga bo‘lgan munosabatni ko‘rib, hayratga tushdim. Ilmiy darajasi yoki unvoni emas, mutaxassislarning o‘zaro kelishuvi asosiga qurilgan ilmiy raqobatni ko‘rib havasim keldi.

Fan-texnika qayerda bo‘lsa, termin ham o‘sha tilda paydo bo‘ladi. Nemis tili misolida aytadigan bo‘lsak, har yili bu til tarkibiga o‘zlashgan tillar monitoring qilinadi va rivojlanish tendensiyasi kuzatib turiladi. Bizda ham terminlarning tarjimasi va yangi kirib kelayotgan so‘zlarni monitoring qilib boruvchi ilmiy tadqiqot instituti tuzilsa, maqsadga muvofiq bo‘lar edi.

Sizni o‘ylantirgan muammolar va shogirdlaringizga beradigan ko‘rsatmalar?

— Alloh umr bersa, hali ko‘p rejalar va oldimga qo‘ygan maqsadlarim bor va ularni amalga oshirish yo‘lida o‘rganishdan to‘xtamayman. Eng katta maqsadlarimdan biri – biz qilayotgan ishlar odamlarga naf keltirsin. Ana shunda ilm ham o‘zining maqsadiga erishgan bo‘ladi.

Yigitali Mahmudov suhbatlashdi.

Mavzuga oid
Top