16:25 / 02.02.2021
10052
Мужмал оғзаки нутқ, Google-таржимондаги ўзбек тили ва қўшалифбо муаммоси — лингвист олима билан суҳбат

Тилларнинг интернет ва электрон тилга айланиши – замонавий дунёда уларнинг ривожланиши учун энг муҳим омиллардан бири. Шу маънода ўзбек тилини ҳам равнақ топтиришда компьютер лингвистикасини ривожлантириш бугун ҳар қачонгидан муҳим.

Нилуфар Абдураҳмонова

Kun.uz мухбири айни соҳада илмий изланишлар олиб бораётган ёш тадқиқотчилардан бири Нилуфар Абдураҳмонова билан суҳбат ташкил этди.

Филология фанлари бўйича фалсафа доктори (PhD) Нилуфар Абдураҳмонова Тошкент давлат ўзбек тили ва адабиёти университети доценти сифатида ишлаб келмоқда.

— Бизда тилшунослик деганда фақат она тили қоидаларини ўрганиш ва ўргатиш тушунилади. Нега ундай?

— Лингвистикани она тили қоидаларини ўрганиш деб тушунмаслик керак. Чунки она тили ва адабиёт – тилни ўзлаштириш билан боғлиқ компетенциявий жараён.

Омма тасаввуридаги тилшунослик билан илм аҳлининг тушунчасидаги тилшунослик ўртасида тавофут бор, албатта. Бизда она тили сифатида ўқитишда айрим камчиликлар кузатилган, масалан, грамматикага асосий эътибор қаратилган.

Аввалги тил ўқитиш дастури, яъни грамматика асосида она тилини ўрганган авлоднинг тафаккури кенг, лекин оғзаки нутқи адабий тил меъёрлари даражасида эмас. Бирор мавзуда фикр билдир дейилса, нима қиларини билмай қолади, микрофон олдига келганда қўрқади, чунки тафаккур воқеланганда нутқи йўқлигидан қўрқади. Шунга қиёсан, русийзабон ёшлар нутқини солиштирсак, улар ўз ички нутқини ташқи нутқига бемалол чиқара олади.

Ўзбек тилини она тили сифатида ўқитиш бўйича тасдиқланган янги Миллий дастурда эса асосий мақсад – коммуникацион тилни ривожлантириш, яъни болани жонли мулоқотга тайёрлаш.

Шунингдек, тилшуносликдаги кўп соҳаларнинг янгилиги ва уларнинг амалиётга жорий қилинмагани ҳам омма учун шундай тасаввур бериши мумкин. Тил билан боғлиқ янги соҳалар биргаликда амалиётга татбиқ этилсагина унинг том маънодаги илмий мақоми кўтарилади.

Тилшуносликда компьютер лингвистикасидан ташқари нейролингвистика, когнитив лингвистика, психолингвистика, биолингвистика каби янги соҳалар мавжуд.

Сиз нега айнан компьютер лингвистикасини танлагансиз? Сизни кўпроқ қийнайдиган муаммо қайси – тил бўйича ишларми ёки масаланинг дастурий томоними?

— Мени бу соҳага қизиқтира олган инсон профессор Абдумажид Пўлатов бўлган ва улардан умрбод миннатдорман. У инсоннинг олим ва одамийлик фазилатлари мен каби кўплаб ёшларни илм йўлига киришларида туртки бўлган. Улар ҳамиша тилни ҳар нарсадан юқори қўярдилар. Зеро, тил барча фанларни ўзлаштиришда воситачи ҳисобланади, дер эдилар.

Кўпчиликнинг фикрича, инглиз тилининг формуласи бор ва шунинг учун у моделлаштирилган. Хўш, ўзбек тилининг модели йўқми? Албатта бор. Негаки, сўз қўллаш ва гапни шакллантиришда бошқа туркий тилларга қараганда ўзбек тили оптимал ҳолатга келтирилган. Яъни қоидалар у даражада кўп эмас. Масалан, қаттиқ ёки юмшоқ унлилар морфотактикаси (қўшимчалар қўшилиш кетма-кетлиги).

Албатта, ҳар қандай табиий тилнинг истисноли ҳолатлари бўлади, бу – тилнинг ёки тил вакилларининг айби эмас. Чунки у жамият билан яшайди ва ҳамиша шаклланиб боради.

Ўзбек тилида дастурий таъминотлар қилинмагани компьютер лингвистикасига фақат фан сифатида қаралганида деб биламан. Унинг мазмунида ётган ҳар бир масала ўзбек тили технологиясига тегишли бўлиб, уни давлат сиёсати даражасида амалга ошириш лозим эди.

Эндиликда ўзбек тилининг ёзма мулоқоти учун иккиталик графемадан (кирилл ва лотин) фойдаланилаётгани ва имло қоидаларига ҳали ҳам беписандлик билан қаралаётгани тилни компьютер тилига ўтказишда, айнан тил технологияси учун айрим муаммоларни келтириб чиқаради.

Лотин ва кирилл алифбосининг параллел фойдаланилаётгани лингвистик ресурсларнинг ҳар хиллигини келтириб чиқаради. Агар лотин ёзувига тўлиқ ўтилса, ўзбек тили учун дастурлар янада такомиллашиб бораверади, графемалар билан боғлиқ муаммолар ҳам барҳам топади.

Дастурлашда ўзбек тилининг электрон ресурсларини (ўзбек тили корпуси, электрон луғатлари, интернет саҳифаларидаги матнлар) ва технологияларини такомиллаштириб, уларни тезлик билан яратиш керак. Тил технологияси учун тилни янада мураккаблаштиришнинг ҳожати йўқ.

Ўзбек тили борича, шундайлигича формаллаштирилса, мақсадга мувофиқ. Нима учун ўзбек тилида корпус лингвистикасини ривожлантириш керак? Чунки корпус бу – нафақат ёзма матнлар, балки оғзаки нутқни компьютер ўқий оладиган шаклга келтира оладиган ягона электрон мажмуа.

Ўтган йилдан бошлаб 4та ОТМда компьютер лингвистикаси магистратура мутахассислиги очилди. Буни шу соҳага дахлдор муаммоли масалалар учун ечим деб айтсак бўлади. Чунки шу соҳада етишиб чиқаётган кадрлар келажакда айнан ўзбек тили технологияси, яъни компьютер лингвистикасини ривожлантиришга ҳисса қўшишига ишонамиз.

Ҳозирда қандай лойиҳалар устида ишлаяпсиз?

— 2020 йилда «Ўзбекистон аёлларининг энг яхши 100 та инновацион лойиҳаси» танловида биз тақдим этган ишланма совриндорликка муносиб деб топилди. Лойиҳа номи – «Ўзбек тилининг кўпфункционал платформасини яратиш». Лойиҳа Кореянинг халқаро ихтирочи аёллар ассоциациясининг махсус сертификатига сазовор бўлди.

2020 йилда Маҳалла ва оилани қўллаб-қувватлаш вазирлиги ҳузуридаги «Маҳалла ва оила» илмий-тадқиқот институти томонидан қисқа муддатга мўлжалланган лойиҳамиз тасдиқланди. Бу лойиҳа «Оила, маҳалла ва гендер тенглиги мавзусидаги бадиий асарларнинг электрон корпусини яратиш» деб номланади.

Маълумки, бадиий асарларимиз тарқоқ ҳолатда PDF шаклда туради. Бизнинг лойиҳамизда эса миллий адабиётимизнинг жадид, совет ва мустақиллик даврида яратилган бадиий адабиётлар хронологик жиҳатдан таснифланган электрон корпуси жамланади. Ушбу электрон корпус нафақат филологик тадқиқотлар учун, балки компьютер лингвистикаси, психология, педагогика ва бошқа ижтимоий соҳалар учун ҳам ўрганиш объекти бўлиши мумкин.

Бадиий адабиёт кўпинча адабиётшунослар томонидан ўрганилади. Унинг психологик, ижтимоий, педагогик жиҳати эса кам ўрганилган. Лойиҳамиздан мақсад – ўзбек тилининг матнлар корпуси илмий тадқиқот ишлари учун муҳим манба бўлиб хизмат қилсин.

Эришилган ютуқларимиз ва лойиҳаларимиз ортида илмий жамоа ишлайди, шогирдларим, дастурчилар ва бошқа соҳа мутахассислари.

Google-таржимон дастурининг ўзбек версиясидаги матнлар нега яхши ўгирилмайди?

— 2014 йил ўзбек тили бошқа тиллар қатори Google-таржимонга киритилди. Ўша пайтларда таржима сифати яхши эмас эди, унинг асосий технологияси луғат ва қоидаларга таянилган.

Исталган тилнинг луғати нечоғлик бой бўлмасин, машина таржимаси учун бу етарли бўлмади. Чунки матн тузиш – бу ҳар бир кишининг индивидуал хос табиатидан келиб чиқадиган ҳодиса ва лексикология доимий равишда ўзгариб туради. Шунинг учун бу соҳада фақатгина тузилган луғатлар ва қоидалар билан узоққа бориб бўлмайди. Эндиликда Google статистикага асосланган ёки нейро машина таржимаси технологияси билан таржималар қилмоқда.

Бунинг моҳияти шундаки, статистик маълумотлар олинган эҳтимоллик ҳолатидан келиб чиқиб, мавжуд таржима адекватларидан фойдаланилади. Бу эса ўзбек тилининг параллел корпуслар технологияси устида ҳам талайгина тадқиқотлар яратиш заруриятини кўрсатади. Аён бўляптики, муаммо яна корпус мавзусига келяпти, чунки бу – ўзбек тилини ривожлантириш учун энг керакли соҳалардан бири.

Менинг PhD диссертациям айнан машина таржимаси бўйича «Инглизча матнларни ўзбек тилига таржима қилиш дастурларининг лингвистик таъминоти» мавзусида бўлган. Тадқиқотимизда инглизча матнларни ўзбек тилига таржима қилиш учун инглиз тилидаги 12 мингта феълли фраземанинг 180 мингта маъноси, 10 мингта сўзнинг инглизча-ўзбекча таржимаси, математик ва тилшуносликка доир терминлар маълумотлар базасига киритилган. Шунингдек, инглиз ва ўзбек тилидаги деривацион қўшимчалар базаси, гап моделлари шакллантирилиб, унинг лингвистик алгоритмлари ишлаб чиқилган.

Мен мутахассис сифатида айнан машина таржимасини ўрганиш орқали компьютер лингвистикасини билишим мумкинлигига ишонардим. Чунки машина таржимаси кўринишидан таржима фаолияти бўлиб туюлса-да, ишлаш технологияси морфологик анализатор, синтактик таҳлил (парсинг), корпус технологияси, амалий лексикография, спеллинг (автоматик таҳрирлаш) каби қатор соҳаларни ҳам ўрганишни тақозо этади ва буларсиз автоматик матн таҳлили ҳақида гапириш ўринсиз.

Тарихга қарасак, компьютер лингвистикаси пайдо бўлишига замин бўлган омиллардан бири ҳам машина таржимасининг яратилгани бўлган.

Сифатли машина таржимаси молиявий қўллаб-қувватлаш бўлишини ҳам талаб қилади. Ўзбекистонда тил технологиясини ривожлантириш учун интеллектуал потенциал етарли: дастурчи ҳам, тилшунос ҳам, таржимон ҳам бор.

Хабарингиз бор, 2020 йил октябр ойида президентимиз Шавкат Мирзиёевнинг тил сиёсатини янада қўллаб-қувватловчи фармони эълон қилинган эди. Ҳозир қайд этиб ўтган барча фикрларимиз фармонда келтирилган тил технологиясига доир устувор вазифаларга айнан мос келади. Умид қиламизки, бу бўйича ишлар ўзининг ечимини топади.

Нега ўзбек тилига янги кириб келган ва чиқиб кетган сўзларнинг мониторинги қилинмайди ёки янги сўзларнинг ёзилиши электрон луғатлар шаклида аҳолига тавсия қилинмайди?

— ТошДЎТАУда терминлар таржимаси бўйича кичик лойиҳалар танлови эълон қилинганди, унда асосан талабалар қатнашиб, 30 дан ортиқ турдаги кичик илмий атамалар луғатлари яратилди. Бу мавжуд терминларнинг ўзбекчаси билан боғлиқ муаммони ҳал этди холос. Лекин ҳар йили тилимизга кириб келаётган сўз ва терминлар мониторинг ва таҳлил қилинмайди.

Машина таржимаси мавзуси билан шуғулланганимда ҳам мен учун энг катта муаммо терминлар бўлган. Ўзбек тилида яратилган аниқ ва табиий фанларнинг лексикаси таржимаси билан қизиққанимда, бу борада луғатлар етишмаслигига гувоҳ бўлганман. Яъни уларнинг айнан адекват таржимаси айрим терминлар учун деярли мавжуд эмас.

Литвада ўзим гувоҳ бўлган бир воқеа эсимга тушди. Бир куни илмий раҳбарим 1–2 соатлик мажлис бўлиши, истасам унга киришим мумкинлигини айтди. Мажлис литов тилида бўлиб, катта монитор қаршисида нималарнидир муҳокама қилишди. Кейин билсам мунозара лойиҳа доирасида яратилаётган луғатга муайян сўзларни киритиш ёки киритмаслик бўйича экан. Тўғриси, сўзга бўлган муносабатни кўриб, ҳайратга тушдим. Илмий даражаси ёки унвони эмас, мутахассисларнинг ўзаро келишуви асосига қурилган илмий рақобатни кўриб ҳавасим келди.

Фан-техника қаерда бўлса, термин ҳам ўша тилда пайдо бўлади. Немис тили мисолида айтадиган бўлсак, ҳар йили бу тил таркибига ўзлашган тиллар мониторинг қилинади ва ривожланиш тенденцияси кузатиб турилади. Бизда ҳам терминларнинг таржимаси ва янги кириб келаётган сўзларни мониторинг қилиб борувчи илмий тадқиқот институти тузилса, мақсадга мувофиқ бўлар эди.

Сизни ўйлантирган муаммолар ва шогирдларингизга берадиган кўрсатмалар?

— Аллоҳ умр берса, ҳали кўп режалар ва олдимга қўйган мақсадларим бор ва уларни амалга ошириш йўлида ўрганишдан тўхтамайман. Энг катта мақсадларимдан бири – биз қилаётган ишлар одамларга наф келтирсин. Ана шунда илм ҳам ўзининг мақсадига эришган бўлади.

Йигитали Маҳмудов суҳбатлашди.

Top