এআইয়ের খাদে বিজ্ঞানের পতন, গবেষণার নতুন সংকট
নরওয়ের এক কনকনে শীতের বিকেলে অসলো বিশ্ববিদ্যালয়ের মনোবিজ্ঞানের অধ্যাপক ড্যান কুইন্টানা একটি অদ্ভুত অভিজ্ঞতার মুখোমুখি হন। তিনি ঘরে বসে একটি একঘেয়ে কাজ শেষ করার সিদ্ধান্ত নেন। একটি সুপরিচিত জার্নালের সম্পাদক তাঁকে একটি গবেষণাপত্র রিভিউ করতে অনুরোধ করেছেন। এমনিতে দেখলে মনে হয় একেবারেই সোজাসাপ্টা একটি বৈজ্ঞানিক কাজ। সন্দেহের কোনো কারণ নেই। কিন্তু কুইন্টানা যখন রেফারেন্সের তালিকায় নিজের নাম দেখতে পেলেন, তখন চমকে উঠলেন। শিরোনামটাও মনে হলো বেশ যুক্তিসংগত। সহলেখকদের তালিকায় এমন কিছু নামও ছিল, যাদের সঙ্গে তিনি অতীতে কাজ করেছেন। কিন্তু সমস্যা হলো, যে গবেষণাপত্রটি উল্লেখ করা হয়েছে, বাস্তবে তার কোনো অস্তিত্বই নেই!
প্রতিদিন ব্লুস্কাই ও লিংকডইনে তিনি দেখতেন, অন্য একাডেমিকরাও এমন অভিজ্ঞতার কথা শেয়ার করছেন। বৈজ্ঞানিক প্রবন্ধে তাঁরা তথাকথিত ভূতুড়ে উদ্ধৃতি খুঁজে পাচ্ছেন। তিনি ভাবতেন, এই সমস্যা বোধহয় কেবল নিম্নমানের প্রকাশনাতেই সীমাবদ্ধ। কিন্তু তিনি যখন নিজে রিভিউ করতে গিয়ে এমন জালিয়াতি দেখলেন, তখন বুঝলেন সমস্যাটি কতটা ব্যাপক।
এক শতাব্দীরও বেশি সময় ধরে বৈজ্ঞানিক জার্নালগুলো একটি টানেলের মতো কাজ করেছে। এর ভেতর দিয়ে প্রাকৃতিক জগৎ সম্পর্কে জ্ঞান আমাদের সংস্কৃতিতে প্রবাহিত হয়েছে। এখন সেই টানেল আটকে যাচ্ছে এআই সৃষ্ট আবর্জনায়। বৈজ্ঞানিক প্রকাশনার নিজস্ব কিছু সমস্যা অবশ্য নতুন নয়। চ্যাটজিপিটি আসার অনেক আগেই জার্নালের সম্পাদকেরা জমা পড়া প্রবন্ধের পরিমাণ ও মান নিয়ন্ত্রণ করতে হিমশিম খেতেন।
প্রতিদিন ব্লুস্কাই ও লিংকডইনে কুইন্টানা দেখতেন, অন্য একাডেমিকরাও এমন অভিজ্ঞতার কথা শেয়ার করছেন। বৈজ্ঞানিক প্রবন্ধে তাঁরা তথাকথিত ভূতুড়ে উদ্ধৃতি খুঁজে পাচ্ছেন।
হার্ভার্ড বিশ্ববিদ্যালয়ের বিজ্ঞান-ইতিহাসবিদ অ্যালেক্স সিজার জানান, উনিশ শতকের শুরুর দিকের সম্পাদকদের চিঠিতেও তিনি এমন অভিযোগ পেয়েছেন। অসংখ্য পাণ্ডুলিপি সামলানো তাদের পক্ষে অসম্ভব হয়ে উঠছিল। এই চাপই ছিল পিয়ার রিভিউ ব্যবস্থার জন্মের অন্যতম কারণ। সম্পাদকেরা নিজেদের কাজ হালকা করতে লেখাগুলো বাইরের বিশেষজ্ঞদের কাছে পাঠাতে শুরু করেন। আজ তা প্রায় সর্বজনীন।
এখন বৈজ্ঞানিক সাহিত্য রক্ষার দায়িত্বে থাকা সম্পাদক ও স্বেচ্ছাসেবী পর্যালোচকেরা নতুন ধরনের আক্রমণের মুখে পড়েছেন। বড় ভাষা মডেল মূলধারায় আসার সঙ্গে সঙ্গেই জার্নালের ইনবক্সে নজিরবিহীন হারে প্রবন্ধ জমা পড়তে শুরু করেছে। কেমব্রিজ ইউনিভার্সিটি প্রেস অ্যান্ড অ্যাসেসমেন্টের একাডেমিক প্রকাশনার ব্যবস্থাপনা পরিচালক ম্যান্ডি হিলের মতে, চ্যাটজিপিটি ও অনুরূপ টুলগুলো নিম্নমানের কাজকে বিশ্বাসযোগ্যতার একটি নতুন পালিশ দিতেও ব্যবহৃত হচ্ছে। ফলে ভালো কাজ ও খারাপ কাজ আলাদা করা কঠিন হয়ে উঠেছে।
যুক্তরাজ্যে ক্লিয়ার স্কাইজ নামে একটি কোম্পানি চালান অ্যাডাম ডে। বৈজ্ঞানিক প্রকাশকদের প্রতারকদের থেকে এক ধাপ এগিয়ে থাকতে তিনি এআই ব্যবহার করে সহায়তা দেন। তিনি পেপার মিলগুলোর দিকে নজর দেন, যারা শিল্পায়িত প্রতারণার মাধ্যমে বিপুল সংখ্যায় গবেষণাপত্র তৈরি করে বিজ্ঞানীদের কাছে বিক্রি করে। এই পেপার মিলগুলো বড় পরিসরে কাজ করে। ফলে তারা নিজেদের উপকরণ বারবার ব্যবহার করে। অ্যাডাম ডে বৈজ্ঞানিক প্রকাশকদের চিহ্নিত করা প্রতারণামূলক প্রবন্ধ বিশ্লেষণ করে টেমপ্লেট খুঁজে বের করেন।
ম্যান্ডি হিলের মতে, চ্যাটজিপিটি ও অনুরূপ টুলগুলো নিম্নমানের কাজকে বিশ্বাসযোগ্যতার একটি নতুন পালিশ দিতেও ব্যবহৃত হচ্ছে। ফলে ভালো কাজ ও খারাপ কাজ আলাদা করা কঠিন হয়ে উঠেছে।
কিছু বৈজ্ঞানিক শাখা এখন এআই সৃষ্ট আবর্জনার আঁতুড়ঘরে পরিণত হয়েছে। দুর্ভাগ্যজনকভাবে এর মধ্যে ক্যানসার গবেষণার মতো গুরুত্বপূর্ণ ক্ষেত্রও আছে। অ্যাডাম ডে জানান, পেপার মিলগুলো ক্যানসারবিষয়ক প্রবন্ধের জন্য একটি অত্যন্ত কার্যকর টেমপ্লেট বের করে ফেলেছেন। কেউ দাবি করতে পারে যে তারা হাজার হাজার প্রোটিনের মধ্যে মাত্র একটি প্রোটিনের সঙ্গে টিউমার কোষের পারস্পরিক ক্রিয়া পরীক্ষা করেছে। যতক্ষণ না তারা খুব নাটকীয় কোনো ফল দেখাচ্ছে, ততক্ষণ কেউই তাদের ফলাফল পুনরায় যাচাই করার তাগিদ অনুভব করবে না।
এআই এখন ভুয়া প্রবন্ধের ছবিও তৈরি করতে পারে। ২০২৪ সালে একটি জার্নালে প্রকাশিত রিভিউ প্রবন্ধে একটা এআইর তৈরি ইঁদুরের ছবি ছিল। ইঁদুরটির ছিল অস্বাভাবিকভাবে বড় অণ্ডকোষ। এটি পিয়ার রিভিউ পেরিয়ে প্রকাশিত হয়। জেনারেটিভ এআইয়ের মাধ্যমে জৈব-চিকিৎসা গবেষণায় প্রমাণ হিসেবে ব্যবহৃত পাতলা টিস্যু স্লাইস বা মাইক্রোস্কোপিক ক্ষেত্রের মতো বিশ্বাসযোগ্য ছবি বানানো এখন খুবই সহজ হয়ে গেছে।
সাম্প্রতিক সময়ে প্রযুক্তিনির্ভর ক্ষেত্রগুলোতেও প্রতারণার ঢেউ আছড়ে পড়েছে। ব্লকচেইন গবেষণার পাশাপাশি সমস্যাটা এআই গবেষণাতেও প্রভাব ফেলছে। মেশিন লার্নিং বা রোবোটিকসে মৌলিক গবেষণা প্রকাশের বিশ্বাসযোগ্য দাবি যাদের আছে, তাদের চাকরির বাজার খুব শক্তিশালী। এআই গবেষকদের জন্যও একটি প্রতারণার টেমপ্লেট আছে। কেবল দাবি করতে হবে যে কোনো ডেটার ওপর মেশিন লার্নিং অ্যালগরিদম চালানো হয়েছে এবং সেটা কোনো আকর্ষণীয় ফল দিয়েছে। ফলাফল আকর্ষণীয় না হলে কেউ তা যাচাই করতে যায় না।
২০২৪ সালে একটি জার্নালে প্রকাশিত রিভিউ প্রবন্ধে একটা এআইর তৈরি ইঁদুরের ছবি ছিল। ইঁদুরটির ছিল অস্বাভাবিকভাবে বড় অণ্ডকোষ। এটি পিয়ার রিভিউ পেরিয়ে প্রকাশিত হয়।
এআই ও অন্যান্য কম্পিউটার বিজ্ঞানে গবেষণাপত্র প্রকাশের প্রধান মাধ্যম হলো কনফারেন্স প্রসিডিংস। সাম্প্রতিক বছরগুলোতে এখানে প্রচুর প্রবন্ধ জমা পড়েছে। শীর্ষস্থানীয় এআই কনফারেন্সগুলোতে জমা পড়া প্রবন্ধের সংখ্যা দ্বিগুণ হয়েছে এবং সেখানে উল্লেখযোগ্য পরিমাণে ‘আবর্জনা’ রয়েছে। ব্রাজিলে অনুষ্ঠিতব্য একটি সম্মেলনের জন্য জমা পড়া প্রবন্ধ বিশ্লেষণ করে দেখা গেছে, ৫০টিরও বেশি প্রবন্ধে কাল্পনিক উদ্ধৃতি রয়েছে। এর একটি কারণ হতে পারে, অনেক পিয়ার রিভিউ এআই দিয়ে করা হয়েছে। একাডেমিক বিজ্ঞানের নানা ক্ষেত্রে লেখকরাও এখন ক্ষুদ্র সাদা ফন্ট ব্যবহার করে এলএলএম রিভিউয়ারদের জন্য গোপন বার্তা ঢুকিয়ে দিচ্ছেন। তারা এআইকে অনুরোধ করছেন প্রবন্ধটির ভূয়সী প্রশংসা করতে।
এআই সৃষ্ট বৈজ্ঞানিক আবর্জনা এখন শুধু জার্নালের মধ্যেই সীমাবদ্ধ নেই। গবেষণা ছড়ানোর অন্যান্য মাধ্যমও এতে প্লাবিত হচ্ছে।
১৯৯১ সালে পল গিন্সপার্গ একটি সার্ভার তৈরি করেন। সেখানে বিজ্ঞানীরা তাঁদের প্রবন্ধ আপলোড করতে পারতেন। এটি পরে ‘আরজিভ’ (arXiv) নামে পরিচিত হয়। চ্যাটজিপিটি প্রকাশের পর প্রিপ্রিন্ট সার্ভারগুলোতেও জার্নালের মতোই জমা পড়া হঠাৎ বেড়ে যায়। কর্নেল বিশ্ববিদ্যালয়ের অধ্যাপক গিন্সপার্গ জানান, তিনি আশা করেছিলেন এটি সাময়িক প্রবণতা হবে। কিন্তু জমা পড়ার হার ক্রমেই বাড়ছে। এখন আর্কাইভে প্রতিটি প্রিপ্রিন্ট পোস্ট করার আগে অন্তত একজন বিজ্ঞানী তা চোখ বুলিয়ে দেখেন। কিন্তু মডেলগুলো এই বাধা পার হতে দিন দিন দক্ষ হয়ে উঠছে।
১৯৯১ সালে পল গিন্সপার্গ একটি সার্ভার তৈরি করেন। সেখানে বিজ্ঞানীরা তাঁদের প্রবন্ধ আপলোড করতে পারতেন। এটি পরে আরজিভ নামে পরিচিত হয়।
২০২৫ সালে দেখা গেছে, যেসব বিজ্ঞানী এলএলএম ব্যবহার করছেন বলে মনে হয়, তারা অন্যদের তুলনায় প্রায় ৩৩ শতাংশ বেশি প্রবন্ধ প্রকাশ করছেন। জীববিজ্ঞান ও চিকিৎসাবিজ্ঞানের প্রিপ্রিন্ট সার্ভারেও একই অবস্থা। এক বছরে ৫০টি প্রবন্ধ পাঠিয়েছেন এমন উদাহরণও দেখা গেছে। প্রিপ্রিন্ট সার্ভারে কিছু আবর্জনা বাছাই করা সবসময়ই গবেষণা সমাজের দায়িত্ব ছিল। কিন্তু যদি ১০০টির মধ্যে ৯৯টি প্রবন্ধই ভুয়া হয়, তবে সেটা অস্তিত্বের সংকটে পরিণত হতে পারে।
প্রিপ্রিন্ট সার্ভারে প্রকাশ করা এত সহজ হওয়ায় সম্ভবত এখানেই এআইসৃষ্ট আবর্জনা বৈজ্ঞানিক আলোচনাকে সবচেয়ে বেশি ক্ষতিগ্রস্ত করছে। শীর্ষস্থানীয় জার্নালে কুইন্টানার মতো রিভিউয়াররা এখনো প্রবন্ধ খুঁটিয়ে দেখেন। কিন্তু চ্যাটবটের তৈরি প্রবন্ধের স্রোত আসার আগেই এই কাজটি বিজ্ঞানীদের জন্য ভারী বোঝা ছিল। তা ছাড়া এআই নিজেও উন্নত হচ্ছে। কুইন্টানার পাওয়া ভুয়া উদ্ধৃতির মতো সহজে ধরা পড়া ভুল হয়তো একদিন পুরোপুরি হারিয়ে যাবে। যুক্তরাষ্ট্রের মারে স্টেট ইউনিভার্সিটির অধ্যাপক এ. জে. বোস্টন এ বিষয়ে ‘ডেড ইন্টারনেট’ ষড়যন্ত্র তত্ত্বের কথা উল্লেখ করেন। এর অনুসারীরা মনে করেন, অনলাইন জগতে হাতে গোনা কয়েকজন মানুষই আসলে পোস্ট বা মন্তব্য করে, বাকিটা বট নেটওয়ার্কের তৈরি।
অধ্যাপক বোস্টনের মতে, সবচেয়ে খারাপ পরিস্থিতিতে বৈজ্ঞানিক সাহিত্যও তেমন হয়ে উঠতে পারে। বেশিরভাগ প্রবন্ধ লিখবে এআই, সেগুলোর রিভিউও করবে এআই। এই ফাঁপা আদান-প্রদান দিয়েই নতুন এআই মডেল প্রশিক্ষিত হবে। ভুয়া ছবি ও ভূতুড়ে উদ্ধৃতি আমাদের জ্ঞানব্যবস্থার আরও গভীরে প্রোথিত হবে। এগুলো এক ধরনের স্থায়ী জ্ঞানতাত্ত্বিক দূষণে পরিণত হবে, যা আর কখনো পুরোপুরি ছেঁকে ফেলা যাবে না।