চ্যাটবট কেন বানিয়ে বানিয়ে মিথ্যে তথ্য দেয়
চ্যাটজিপিটি বা অন্যান্য কৃত্রিম বুদ্ধিমত্তা প্রায়শই এমন সব উত্তর দেয়, যা পুরোপুরি বানানো বা মিথ্যা। এআইয়ের জগতে এই সমস্যাকে বলা হয় ‘হ্যালুসিনেশন’। কিন্তু কেন চ্যাটবটের হ্যালুসিনেশন হয়? যে তথ্য চ্যাটবট জানে না, তা কেন স্বীকার করে নেয় না?
সম্প্রতি ওপেনএআইয়ের একটি গবেষণাপত্র এই সমস্যার মূল কারণ খুঁজে বের করেছে। কিন্তু একই সঙ্গে এটি এমন এক ভয়ংকর সত্য প্রকাশ করেছে, যা থেকে স্পষ্ট যে অন্তত সাধারণ ব্যবহারকারীদের জন্য এই সমস্যার সমাধান হয়তো কখনোই সম্ভব নয়।
গবেষণাপত্রটি অত্যন্ত জোরালো গাণিতিক যুক্তির মাধ্যমে দেখিয়েছে, এআই মডেলগুলোর আত্মবিশ্বাসের সঙ্গে ভুল তথ্য দেওয়ার কোনো সম্পর্ক নেই। মানে এটা কোনো দুর্ঘটনা নয়, বরং তাদের গঠনতন্ত্রের একটি অনিবার্য অংশ। এতদিন মনে করা হতো, হয়তো প্রশিক্ষণের সময় ব্যবহৃত তথ্যের ভুলের কারণে এমনটা হয়। কিন্তু গবেষকরা প্রমাণ করেছেন, নিখুঁত তথ্য দিয়ে প্রশিক্ষণ দিলেও এই সমস্যা থেকেই যাবে।
এর মূল কারণ ল্যাঙ্গুয়েজ মডেলগুলোর কাজের পদ্ধতি। চ্যাটবট সাধারণত কোনো প্রশ্নের উত্তরে পরের শব্দটি কী হবে, তা শুধু সম্ভাবনার ওপর ভিত্তি করে অনুমান করে। যেমন, ‘আমি ভাত খাই’ বাক্যটা লেখার সময় চ্যাটবট প্রথমে ‘আমি’ শব্দটা ভাবে, তারপর ‘ভাত’ শব্দটা যোগ করার পর আবার চিন্তা করে, এর সঙ্গে আর কোন শব্দ জোড়া লাগানো যায়। তারপর ‘খাই’ শব্দটা জুড়ে একটা বাক্য পূরণ করে। পুরোটাই কিন্তু অনুমানের ওপর ভিত্তি করে করা হচ্ছে। তাই এই অনুমানেই ভুল হয়ে যায়।
একটি এআই যখন বলে ‘আমি জানি না’, তখন সে পায় শূন্য। আবার পুরোপুরি ভুল উত্তর দিলেও শূন্যই পায়। ফলে এআইয়ের জন্য সেরা কৌশল হলো, সবসময়ই অনুমান করা। ধরুন, আপনাকে তিনটি প্রশ্ন করা হবে।
গবেষকরা দেখিয়েছেন, একটি পূর্ণ বাক্য তৈরি করতে গিয়ে এআই যে পরিমাণ ভুল করে, তা একটি সাধারণ ‘হ্যাঁ’ বা ‘না’ প্রশ্নের উত্তরের চেয়ে অন্তত দ্বিগুণ। কারণ, প্রতিটি শব্দ অনুমানের সঙ্গে সঙ্গে ভুলের পরিমাণ বাড়তে থাকে। সোজা কথায়, হ্যালুসিনেশনের হার নির্ভর করে এআই কতটা ভালোভাবে ভুল ও সঠিকের মধ্যে পার্থক্য করতে পারে, তার ওপর। তবে অনেক ক্ষেত্রেই এই পার্থক্য করা এতই কঠিন যে, হ্যালুসিনেশন একরকম অবশ্যম্ভাবী হয়ে ওঠে।
গবেষণায় আরও দেখা গেছে, প্রশিক্ষণের সময় একটি এআই কোনো তথ্য যত কম দেখে, সেই বিষয়ে প্রশ্ন করা হলে তার হ্যালুসিনেশন বা ভুল বলার সম্ভাবনা তত বেড়ে যায়। যেমন, বিখ্যাত ব্যক্তিদের জন্মদিন নিয়ে পরীক্ষা করে দেখা গেছে, যদি ২০ শতাংশ ব্যক্তির জন্মদিন প্রশিক্ষণের তথ্যে মাত্র একবার উল্লেখ থাকে, তবে সেই মডেল অন্তত ২০ শতাংশ ক্ষেত্রে জন্মদিনের ভুল উত্তর দেবে। গবেষকেরা যখন এই গবেষণাপত্রের লেখক অ্যাডাম কালাইয়ের জন্মদিন সম্পর্কে অত্যাধুনিক মডেলগুলোকে জিজ্ঞাসা করেন, তখন একটি মডেল তিনবারে তিনটি ভিন্ন ভুল তারিখ দেখিয়েছে!
কেন এআই ‘আমি জানি না’ বলতে পারে না
প্রশিক্ষণের পরেও কেন এই সমস্যা থেকেই যায়, সেটাই এখন চিন্তার বিষয়। সাধারণত একটি এআই সবার জন্য উন্মুক্ত করার আগে মানুষের মতামতের ভিত্তিতে সেটাকে আরও উন্নত করা হয়। কিন্তু গবেষণাপত্রটি বলছে, এখানেই লুকিয়ে আছে মূল সমস্যা। গুগল, ওপেনএআইসহ দশটি বড় এআই বেঞ্চমার্ক বা মূল্যায়ন পদ্ধতি বিশ্লেষণ করে দেখা গেছে, এর মধ্যে নয়টিই এমনভাবে ডিজাইন করা হয়েছে, যেখানে এআই যদি অনিশ্চয়তা প্রকাশ করে বা বলে ‘আমি জানি না’, তবে তাকে শূন্য পয়েন্ট দেওয়া হয়। এই শূন্য পয়েন্ট দেওয়ার সংস্কৃতিই যত সমস্যার মূল। আরেকটু বিষদে বলা যাক।
গাণিতিকভাবে এটি দেখানো হয়েছে যে, এই পদ্ধতিতে এআই অনুমান করার বদলে স্বাভাবিকভাবেই অনিশ্চয়তা প্রকাশ করবে এবং হ্যালুসিনেশন কমে আসবে।
একটি এআই যখন বলে ‘আমি জানি না’, তখন সে পায় শূন্য। আবার পুরোপুরি ভুল উত্তর দিলেও শূন্যই পায়। ফলে এআইয়ের জন্য সেরা কৌশল হলো, সবসময়ই অনুমান করা। ধরুন, আপনাকে তিনটি প্রশ্ন করা হবে। ভুল উত্তর দিলে শূন্য পাবেন, আবার জানি না বললেও শূন্য পাবেন। তাহলে আপনি কি কখনো ‘জানি না’ শব্দটা বলবেন? সম্ভবত না। কারণ আন্দাজে একটা উত্তর করে ভুল হলেও আপনি শূন্যই পাবেন। কিন্তু যদি সেই আন্দাজে বলা উত্তরটা ঠিক হয়ে যায়, তাহলে তো নম্বর পাবেন। এই আশায় আপনি সবসময় আন্দাজে একটা উত্তর বলবেন। এআই ঠিক একই কাজ করে। ‘জানি না’ শব্দটা না বলে আন্দাজে একটা উত্তর দিয়ে দেয়।
গবেষকেরা গাণিতিকভাবে প্রমাণ করেছেন, এই ধরনের মূল্যায়ন পদ্ধতিতে উত্তর সঠিক হওয়ার সম্ভাবনা যাই হোক না কেন, অনুমান করার প্রত্যাশিত স্কোর সবসময়ই উত্তর না দেওয়ার স্কোরের চেয়ে বেশি হয়।
যে সমস্যার সমাধান হলে সবকিছু ভেঙে পড়বে
ওপেনএআইয়ের প্রস্তাবিত সমাধান হলো, এআই উত্তর দেওয়ার আগে নিজের আত্মবিশ্বাস বিবেচনা করবে এবং মূল্যায়ন পদ্ধতিতেও সেই অনুযায়ী নম্বর দেওয়া হবে। যেমন, এআইকে যদি নির্দেশ দেওয়া হয়, ‘তুমি যদি ৭৫ শতাংশ বা তার বেশি নিশ্চিত হও, তবেই উত্তর দেবে। কারণ ভুল উত্তরের জন্য ৩ পয়েন্ট কাটা হবে, আর সঠিক উত্তরের জন্য পাবে ১ পয়েন্ট।’
গাণিতিকভাবে এটি দেখানো হয়েছে যে, এই পদ্ধতিতে এআই অনুমান করার বদলে স্বাভাবিকভাবেই অনিশ্চয়তা প্রকাশ করবে এবং হ্যালুসিনেশন কমে আসবে। কিন্তু সমস্যা হলো, ব্যবহারকারীর অভিজ্ঞতার ওপর এর প্রভাব পড়বে মারাত্মক।
একবার ভাবুন তো, আপনি চ্যাটজিপিটিকে দশটা প্রশ্ন করলেন, আর সে তিনটার উত্তরেই বলল, ‘আমি জানি না’। আপনি কি তখনো এটা ব্যবহার করবেন? যারা যেকোনো প্রশ্নের আত্মবিশ্বাসী উত্তর পেতে অভ্যস্ত, তারা খুব দ্রুতই এই ধরনের সিস্টেম ব্যবহার করা ছেড়ে দেবে। তখন আপনার কাছে মনে হবে, চ্যাটবটকে জিজ্ঞেস করার চেয়ে গুগলে সার্চ দিয়ে দেখি!
আসল বাধা অর্থনীতিতে
ব্যবহারকারীদের এ সমস্যা হয়তো কোনোভাবে সমাধান করা যাবে। মানে ‘জানি না’ বললেও হয়তো অনেকে চ্যাটবট ব্যবহার করবে। কিন্তু এর চেয়ে বড় সমস্যা হবে অর্থনীতিতে। মানুষের অর্থনীতি নয়, কম্পিউটিংয়ের অর্থনীতি। একটি ‘সৎ’ এবং সচেতন এআই তৈরি করতে যে পরিমাণ কম্পিউটিং শক্তি এবং সময় লাগবে, তা বর্তমান পদ্ধতির চেয়ে অনেক অনেক গুণ বেশি। সেই সিস্টেমে প্রতিদিন লাখ লাখ প্রশ্নের উত্তর দিতে হলে বিলিয়ন বিলিয়ন ডলার লাগবে।
সে যেটা জানে না, সেটার উত্তরে বলবে ‘আমি জানি না’। শেষ পর্যন্ত আপনি যদি সমাধানই না পান, আর চ্যাটবট যদি বারবার বলে আমি জানি না, তাহলে এত টাকা খরচ করে কী লাভ হলো!
এ ধরনের অত্যাধুনিক পদ্ধতি বিশেষায়িত ক্ষেত্রে, যেমন চিপ ডিজাইন বা মেডিকেল ডায়াগনোসিসে কাজে লাগতে পারে। কারণ, সেখানে একটি ভুল উত্তরের আর্থিক ক্ষতি লাখ লাখ ডলার হতে পারে। তাই অতিরিক্ত খরচটা সেখানে যুক্তিযুক্ত। কিন্তু সাধারণ ব্যবহারকারীদের জন্য এবং যারা বিনামূল্যে বা খুব কম খরচে তাৎক্ষণিক উত্তর চান, তাঁদের জন্য এই অর্থনীতি একেবারেই অচল।
তাই চাইলেও সাধারণ মানুষের জন্য এমন এআই ব্যবস্থা তৈরি করা সম্ভব নয়। কারণ এখন যে এআই আমরা ব্যবহার করি, তার মাসিক চার্জ প্রায় ২ হাজার ৫০০ থেকে ২৫ হাজার পর্যন্ত। এর চেয়ে ভালো চ্যাটবট ব্যবস্থা চাইলে হয়তো প্রতিমাসে খরচ হবে ৭০-৮০ হাজার টাকা (গবেষণাপত্রে টাকার পরিমাণ উল্লেখ ছিল না)। সাধারণ মানুষ প্রতিমাসে একটা চ্যাটবটের জন্য এই টাকা খরচ করবে?
আর এত টাকার বিনিময়ে কী পাবেন? চ্যাটবট বানিয়ে উত্তর দেবে না। সে যেটা জানে না, সেটার উত্তরে বলবে ‘আমি জানি না’। শেষ পর্যন্ত আপনি যদি সমাধানই না পান, আর চ্যাটবট যদি বারবার বলে আমি জানি না, তাহলে এত টাকা খরচ করে কী লাভ হলো! এই চিন্তা করে আপনি হয়তো এআই ব্যবহার ছেড়ে দেবেন বা আগের ভার্সন ব্যবহার করবেন। তাতে চ্যাটবট ব্যবসায়ীদের ব্যবসা লাটে উঠবে। এ কারণেই চ্যাটবটের বানিয়ে বলা বন্ধ করা প্রায় অসম্ভব।