Oliy matematika sun’iy intellektning zaif tomoni bo‘lib qolmoqda - tadqiqot
AQSh va Buyuk Britaniya tadqiqotchilari sun’iy intellekt tizimlarining murakkab matematik masalalarini qanday yechishini tekshirish uchun FrontierMath nomli yangi test ishlab chiqdi.

Foto: The AI Whisperer
So‘nggi yillarda ChatGPT kabi sun’iy intellekt modellari matnlarni qayta ishlash va generatsiya qilishda sezilarli darajada oldinga siljidi. Modellarning javoblari shu qadar hayratlanarliki, ular hatto yuqori darajadagi «intellekt»dan darak bermoqda. Biroq mutaxassislarning ta’kidlashicha, murakkab matematik masalalarni yechish zamonaviy modellarning zaif nuqtasi bo‘lib qolmoqda. Ajobiy muvaffaiqyat va boshlang‘ich hamda o‘rta darajadagi matematik masalalarni yechish qobiliyatiga qaramay, gap oliy matematika haqida ketganida sun’iy intellekt (SI) imkoniyatlari cheklanib qolyapti.
SI modellarini baholashda olimlar turli etalon testlar yoki benchmarklardan foydalanadi. Bugungi kunda MATH va GSM8K eng mashhur testlardan hisoblanadi. Ushbu testlarda ko‘plab til modellari 90 foizga yaqin to‘g‘ri javobni topmoqda. Biroq yangi test mualliflariga ko‘ra, bunday testlar cheklangan murakkablikka ega va SIning imkoniyatini to‘liq baholashga xizmat qilmaydi. Matematikani yuqori darajada tushunishini aniqlash uchun murakkab benchmark talab etiladi. FrontierMath shu sababli paydo bo‘ldi.
Yangi testni tayyorlash jarayonida ekspertlar mashhur matematiklarga murojaat qilib, ularning oldinlari hech qayerda e’lon qilinmagan eng murakkab masalalarini olgan. Qo‘lga kiritilgan yuzlab masalalarning ayrimlari shu qadar murakkabligidan oddiy inson uni yechishga bir necha kunini sarflaydi.
FrontierMath’ning o‘ziga xosligi shundaki, u sonlar nazariyasidan algebraik geometriyagacha bo‘lgan mavzularni qamrab oladi. Bunday yondashuv SIning oddiy algoritmlardan foydalanish imkoniyatini cheklab, chuqur bilim talab etadi. Shu boisdan mazkur testda yuqori natijaga erishmoqchi bo‘lgan modellar nafaqat ko‘p miqdorda ma’lumotga, balki masalani yechishda tahlil qilish va ijodkorlik qobiliyatiga ham ega bo‘lishi kerak.
Dastlabki sinovlar FrontierMath zamonaviy sun’iy intellektlar uchun qanchalik murakkab ekanini ko‘rsatib berdi. Oldingi testlarda yuqori natijalarni qayd etgan modellar yangi testda 2 foiz ham to‘g‘ri javob topa olmadi. Ushbu natija SIning hozirgi darajasi matematik fikrlashni talab etadigan murakkab masalalarni yechish imkoniyatidan hali ancha uzoqda ekanini namoyish etdi.
Tavsiya etamiz
Trampni siylagan arablar, muzlatilgan savdo urushi va amalga oshmagan “duel” - Geosiyosiy hafta tahlili
Jahon | 16:04 / 17.05.2025
Tahdid va tarix haqida va’z: Istanbul muzokaralarida nimalar deyishdi?
Jahon | 13:33 / 17.05.2025
Haydovchilar uchun qator yengilliklar e’lon qilindi
O‘zbekiston | 18:04 / 16.05.2025
Shaharlarda yo‘l ta’mirlash ishlari faqat tunda amalga oshiriladi
O‘zbekiston | 17:20 / 16.05.2025
So‘nggi yangiliklar
-
Xitoyda sun’iy yomg‘ir yog‘dirish bo‘yicha tajriba o‘tkazildi
Fan-texnika | 02:08
-
Trampning Putinga nisbatan sabri tugashni boshladi - Finlandiya prezidenti
Jahon | 01:36
-
Fransiya Janubiy Amerika junglilarida qattiq tartibli qamoqxona quradi
Jahon | 23:27 / 18.05.2025
-
Isroil armiyasi G‘azo sektorida keng ko‘lamli quruqlikdagi harbiy harakatlarni boshladi
Jahon | 23:13 / 18.05.2025
Mavzuga oid

21:41 / 08.05.2025
Sun’iy intellekt 2 ming yillik tarixiy o‘ramni virtual tarzda ochdi va o‘qidi

18:00 / 08.05.2025
AQSh yirik kompaniyalari maktab o‘quvchilarini sun’iy intellekt davriga tayyorlashga chaqirdi

13:53 / 07.05.2025
BAA dunyoda birinchi bo‘lib qonunlarni yozishda sun’iy intellektdan foydalanmoqchi

18:59 / 06.05.2025