এআইকে ঠেকাতে ১ হাজার বিজ্ঞানীর গোপন বৈঠক
একটা ক্লাসরুমে অদ্ভুত এক ছাত্র আছে। পরীক্ষায় তাকে যে প্রশ্নই করা হোক না কেন, সে ১০০ তে ১০০ পায়! ডাক্তারি পরীক্ষায় পাস করে যায় অনায়াসে। আইনের জটিল সব ধারার পরীক্ষায় প্রথম হয়, আবার কঠিন গাণিতিক সমীকরণও চোখের পলকে মিলিয়ে দেয়। এই অতিমানবীয় ছাত্রটিই হলো বুদ্ধিমত্তা বা এআই।
গত কয়েক বছরে এআই এতটাই বুদ্ধিমান হয়ে উঠেছে যে, মানুষের তৈরি করা কঠিন সব পরীক্ষা সে অবলীলায় পাস করে যাচ্ছে। এআইয়ের এমন চোখধাঁধানো রেজাল্ট দেখে বিজ্ঞানীরা তো রীতিমতো চিন্তায় পড়ে গেলেন! এতদিন এআইয়ের বুদ্ধি মাপার জন্য যেসব বিখ্যাত পরীক্ষা বা বেঞ্চমার্ক ছিল, সেগুলো এখন এআইয়ের কাছে ডালভাত হয়ে গেছে। বিজ্ঞানীরা বুঝলেন, এআইয়ের আসল দৌড় ঠিক কতটুকু, তা মাপতে হলে এবার এমন এক প্রশ্নপত্র বানাতে হবে, যা দেখে খোদ এআইয়েরও ঘাম ছুটে যাবে!
এক হাজার বিজ্ঞানীর গোপন মিশন
ঠিক এই চিন্তা থেকেই জন্ম নিল এক মহাযজ্ঞের। বিশ্বের প্রায় এক হাজার বিশেষজ্ঞ গবেষক মিলে তৈরি করলেন এআইয়ের জন্য সর্বকালের সবচেয়ে কঠিন এক পরীক্ষা। এই পরীক্ষার নাম দেওয়া হয়েছে ‘হিউম্যানিটিজ লাস্ট এক্সাম’ বা মানবজাতির শেষ পরীক্ষা!
নামটা শুনে হলিউডের কোনো সায়েন্স ফিকশন মুভির নাম মনে হলেও, এটি আসলে বিজ্ঞানীদের তৈরি আড়াই হাজার প্রশ্নের এক বিশাল ডাটাবেস। সম্প্রতি বিখ্যাত বিজ্ঞান জার্নাল নেচার-এ এই প্রজেক্টের কথা বিস্তারিত ছাপা হয়েছে।
বিশ্বের প্রায় এক হাজার বিশেষজ্ঞ গবেষক মিলে তৈরি করলেন এআইয়ের জন্য সবচেয়ে কঠিন এক পরীক্ষা। এই পরীক্ষার নাম দেওয়া হয়েছে হিউম্যানিটিজ লাস্ট এক্সাম বা মানবজাতির শেষ পরীক্ষা!
প্রশ্নপত্রে কী এমন আছে
এখন আপনার মনে প্রশ্ন জাগতে পারে, এই পরীক্ষায় কী এমন আছে যা এআই পারে না? এখানে এমন সব প্রশ্ন রাখা হয়েছে, যা ইন্টারনেটে খুঁজলে চট করে পাওয়া যাবে না। ধরুন, প্রাচীন পালমিরিন ভাষার কোনো শিলালিপি অনুবাদ করতে দেওয়া হলো! কিংবা পাখির শরীরের অতি ক্ষুদ্র কোনো কাঠামোর বিশ্লেষণ করতে বলা হলো। অথবা বাইবেলের প্রাচীন হিব্রু ভাষার শব্দের প্যাটার্ন বের করতে দেওয়া হলো।
এই পরীক্ষার সবচেয়ে মজার নিয়মটা কী জানেন? প্রশ্নপত্র বানানোর সময় প্রতিটি প্রশ্ন প্রথমে বাজারের সেরা এআইগুলোকে দেওয়া হতো। যদি কোনো এআই সেই প্রশ্নের সঠিক উত্তর দিয়ে ফেলত, তবে সেই প্রশ্নটা সাথে সাথে বাতিল করে দেওয়া হতো! অর্থাৎ, যে প্রশ্ন এআই কোনোভাবেই পারেনি, শুধু সেগুলো নিয়েই তৈরি হয়েছে এই চূড়ান্ত পরীক্ষা।
প্রশ্নপত্র বানানোর সময় প্রতিটি প্রশ্ন প্রথমে বাজারের সেরা এআইগুলোকে দেওয়া হতো। যদি কোনো এআই সেই প্রশ্নের সঠিক উত্তর দিয়ে ফেলত, তবে সেই প্রশ্নটা সাথে সাথে বাতিল করে দেওয়া হতো!
এআইয়ের করুণ দশা!
ফলাফল কী দাঁড়াল? শুরুর দিকের পরীক্ষায় এআইয়ের অবস্থা ছিল বেশ করুণ! ওপেনএআইয়ের জিপিটি-ফোর পেয়েছে মাত্র ২.৭ শতাংশ নম্বর। ক্লডের সনেট পেয়েছে ৪.১ শতাংশ এবং ওপেনএআইয়ের ও১ মডেল পেয়েছে ৮ শতাংশ নম্বর।
অবশ্য সম্প্রতি জেমিনি ৩.১ প্রো এবং ক্লড ওপাস ৪.৬-এর মতো আরও আধুনিক সিস্টেমগুলো কিছুটা উন্নতি করে ৪০ থেকে ৫০ শতাংশের মতো নম্বর তুলতে পেরেছে। তারপরও, একে পুরোপুরি পাস করা বা মাস্টারি বলা চলে না!
এই মহাযজ্ঞের পেছনে ছিলেন টেক্সাস এঅ্যান্ডএম ইউনিভার্সিটির কম্পিউটার সায়েন্সের অধ্যাপক টুং গুয়েন। তিনি একাই এই পরীক্ষার ৭৩টি জটিল প্রশ্ন বানিয়েছেন, যার বেশির ভাগই গণিত ও কম্পিউটার সায়েন্সের।
ড. গুয়েনের মতে, ‘এআই যখন মানুষের বানানো সব পরীক্ষায় ভালো করতে শুরু করে, তখন আমাদের মনে হতে পারে যে তারা হয়তো মানুষের বুদ্ধির কাছাকাছি পৌঁছে গেছে। কিন্তু এই ‘হিউম্যানিটিজ লাস্ট এক্সাম’ আমাদের দেখিয়েছে, বুদ্ধিমত্তা মানে শুধু প্যাটার্ন মেলানো নয়; এর জন্য গভীরতা, প্রেক্ষাপট ও বিশেষায়িত জ্ঞানের দরকার হয়।’
তিনি আরও বলেন, ‘সঠিক পরীক্ষা না থাকলে নীতিনির্ধারক থেকে শুরু করে সাধারণ ব্যবহারকারী, সবাই এআইয়ের ক্ষমতা নিয়ে ভুল ধারণা পেতে পারেন। এই বেঞ্চমার্কগুলো আমাদের বুঝতে সাহায্য করে যে, এআইয়ের আসল ক্ষমতা ও ঝুঁকি কতটুকু।’
ড. গুয়েনের মতে, ‘হিউম্যানিটিজ লাস্ট এক্সাম আমাদের দেখিয়েছে, বুদ্ধিমত্তা মানে শুধু প্যাটার্ন মেলানো নয়; এর জন্য গভীরতা, প্রেক্ষাপট ও বিশেষায়িত জ্ঞানের দরকার হয়।’
মানুষের দিন কি শেষ
পরীক্ষার এমন ভয়ংকর নাম দেওয়া হলেও, এর মানে এই নয় যে মানুষের দিন শেষ হয়ে আসছে! বরং এটি প্রমাণ করে যে, মানুষের বিশেষায়িত জ্ঞান এখনো কতটা অমূল্য। এই পরীক্ষা কোনো প্রতিযোগিতা নয়, বরং এআইয়ের দুর্বলতাগুলো খুঁজে বের করার একটা পদ্ধতি। এআই যেন প্রশ্নের উত্তর মুখস্থ করতে না পারে, তাই এই আড়াই হাজার প্রশ্নের বেশির ভাগই লুকিয়ে রাখা হয়েছে।
ইতিহাসবিদ, পদার্থবিদ, ভাষাবিদ ও চিকিৎসকদের নিয়ে এক বিশাল দল গড়ে বিজ্ঞানীরা প্রমাণ করেছেন, মানুষ যখন এক হয়ে কাজ করে, তখন কৃত্রিম বুদ্ধিমত্তাও তাদের কাছে হার মানতে বাধ্য। এআই আর মানুষের বুদ্ধিমত্তার মধ্যে যে এখনো বিশাল একটা ব্যবধান রয়ে গেছে, এই পরীক্ষাই তার সবচেয়ে বড় প্রমাণ।