বাংলায় কৃত্রিম বুদ্ধিমত্তা

চ্যাটজিপিটি বা মিডজার্নির নাম যেমন শুনেছেন, তেমনি নাম না জানা অনেক গবেষণাও হচ্ছে বিদেশে। কিন্তু বাংলাদেশেও কৃত্রিম বুদ্ধিমত্তা নিয়ে গবেষণা থেমে নেই। এগিয়ে যাচ্ছে আগ্রহী গবেষক ও স্বেচ্ছাসেবীদের প্রাণান্ত চেষ্টায়। কম্পিউটারকে বাংলা শেখানোর সেই কাহিনি...

অলংকরণ: রৌদ্র বড়ূয়া

কৃত্রিম বুদ্ধিমত্তার নাম আমরা সবাই শুনেছি। যাঁরা বিষয়টার ভেতরে ঢোকেননি, পত্রিকায় পড়ে, চলচ্চিত্র বা টিভি দেখে তাঁদের অনেকের একটা বড় ভুল ধারণা হয়েছে। তাঁরা মনে করেন, কৃত্রিম বুদ্ধিমত্তা মানেই টার্মিনেটর-এর মতো কিছু। পত্রিকায় যেহেতু ‘আলফাগো’ বা ‘চ্যাটজিপিটি’র মতো দুর্দান্ত সব কৃত্রিম বুদ্ধিমত্তাকে নিয়ে আলোচনা হয়, ইউটিউবে যেহেতু এ ধরনের বিষয়গুলো নিয়ে ভিডিও বানালে অনেকে দেখেন, তাই অনেকের মনে একটা ধারণা গড়ে ওঠে, কৃত্রিম বুদ্ধিমত্তা এই বুঝি পুরো পৃথিবী দখল করে নিল! বাস্তবে বিষয়টি কি তা-ই?

কয়েক দশক ধরে বাংলাদেশের বিশ্ববিদ্যালয়গুলোতে, বিশেষ করে প্রাইভেট বিশ্ববিদ্যালয়গুলোতে যে বিষয়গুলোতে সবচেয়ে বেশি শিক্ষার্থী ভর্তি হন, এর অন্যতম কম্পিউটারবিজ্ঞান ও প্রকৌশল। সংক্ষেপে যাকে বলে সিএসই। চার বছর পড়াশোনার পর সবাইকেই একটি প্রজেক্ট বা থিসিস করতে হয় (অনার্সে এটাকে সাধারণত এক নামে প্রজেক্ট-ই বলে)। এটি নিয়ে নামতে হয় ‘ডিফেন্স’ নামের মহাপরীক্ষায়। বিশ্ববিদ্যালয়ের শেষ পরীক্ষা। উত্তীর্ণ হলে মেলে ডিগ্রি, না হয় কাজে নামতে হয় আবারও।

সিএসইর অনেক শিক্ষার্থীই ডিফেন্সের জন্য বেছে নেন মেশিন লার্নিং বা এআই। মেশিন লার্নিং মানে, যন্ত্রকে শেখানো। এই শেখানোর নানা উপায় আছে, নানা ধাপ আছে। যেমন ডিপ লার্নিং, নিউরাল নেটওয়ার্ক ইত্যাদি। যন্ত্রকে শিখিয়ে বানানো যায় কৃত্রিম বুদ্ধিমত্তা। মোটাদাগে এর দুটি ধাপ রয়েছে। একটি ধাপ হলো, যন্ত্রকে শেখানোর জন্য প্রচুর ডেটা বা তথ্য সরবরাহ করা। দ্বিতীয় ধাপের কাজ, যন্ত্রটি এসব তথ্য কীভাবে বিশ্লেষণ করবে, তা বলে দেওয়া।

তথ্য সরবরাহের জন্য প্রথমে তথ্য সংগ্রহ করতে হয়। এত তথ্য বিশ্ববিদ্যালয়ের শিক্ষার্থীরা কোথায় পাবেন? বিদেশি বিভিন্ন বিষয় নিয়ে গবেষণার জন্য অনলাইনে এ রকম তথ্যের সংগ্রহশালা পাওয়া যায়। কম্পিউটারবিজ্ঞানের ভাষায় একে বলা হয় ডেটাসেট। কিন্তু বাংলাদেশের নিজস্ব বিষয়গুলো নিয়ে এ ধরনের ডেটাসেট অপ্রতুল। আর বাংলা ভাষা নিয়ে কাজ করার জন্য প্রয়োজনীয় ডেটাসেট তো পাওয়াই যায় না! আসলে বলতে হবে, পাওয়া যেত না। কারণ, এখন এ সমস্যা সমাধানের উদ্যোগ নিয়েছেন একদল গবেষক। এ লেখা তাঁদের নিয়ে।

দ্বিতীয় ধাপের কথা বলি এবার। তথ্য সরবরাহের পর যন্ত্রকে বলে দিতে হয়, এসব তথ্য কীভাবে বিশ্লেষণ করবে, কীভাবে সিদ্ধান্তে পৌঁছাবে। বলে দেওয়ার কাজটি করার জন্য মনে রাখতে হয়, যন্ত্র বোকা। তাকে শেখাতে হয় ধাপে ধাপে, বলে দিতে হয় ঠিক কী কী করতে হবে। ধাপে ধাপে দেওয়া এ রকম নির্দেশনাকে বলে অ্যালগরিদম। বেশির ভাগ বিশ্ববিদ্যালয়ের শিক্ষার্থী ও গবেষকেরা অবশ্য এদিকেই মনোনিবেশ করেন। চেষ্টা করেন দারুণ কোনো অ্যালগরিদম খুঁজে বের করতে। কোন ধাপটি বেশি প্রয়োজনীয়, সেটিও এ লেখার একটি আলোচ্য বিষয়।

গত কয়েক মাসে আমরা সামাজিক যোগাযোগমাধ্যম, ইন্টারনেট, টিভি বা পত্রিকা খুললেই দেখছি, চ্যাটজিপিটির জয়জয়কার। পাল্লা দিয়ে গুগল এনেছে নতুন কৃত্রিম বুদ্ধিমত্তা—বার্ড। বাংলায় এমন কিছু নেই বটে, তবে আমরা ঠিক কোন জায়গায় আছি? আসলে যা হয়, দীর্ঘদিন গবেষকেরা যখন দিনের পর দিন কাজ করে যান, টের পান না বেশির ভাগ মানুষ। ইউরেকা মুহূর্তের পর যখন ফলাও করে সংবাদমাধ্যমে আসে, সবাই সচেতন হয়ে ওঠেন। অনেকে হঠাৎ আবিষ্কার করেন, রাতারাতি নতুন একটা কিছু হয়ে গেছে। তবে কিছুই আসলে হুট করে হয় না, এর পেছনে গবেষকেরা কাজ করেন দীর্ঘদিন।

এই লেখায় আমরা সে রকম কিছু গবেষকের প্রচেষ্টার কথা শুনব। জানব, বাংলায় কৃত্রিম বুদ্ধিমত্তা নিয়ে কত দূর কাজ হয়েছে। ভবিষ্যতে কী অপেক্ষা করে আছে আমাদের জন্য।

বেঙ্গলি এআইয়ের লোগো

দুই

নাম, বেঙ্গলি এআই। পেশায় স্বেচ্ছাসেবী একটি সংগঠন। পথচলার শুরু ২০১৭ সালের শেষ দিকে। কয়জন একসঙ্গে হয়ে সিদ্ধান্ত নিলেন, বাংলায় কৃত্রিম বুদ্ধিমত্তাসংক্রান্ত সবচেয়ে বড় সমস্যাটি তাঁরা সমাধানের উদ্যোগ নেবেন। সমস্যাটি কী? ডেটাসেট-তথ্যের সংগ্রহ।

যেকোনো গবেষণায় সবচেয়ে প্রয়োজনীয় জিনিস হলো তথ্য। আপনার কাছে তথ্য থাকলে, সেই তথ্য নির্দিষ্ট ছাঁচে ফেলে হোক বা এমনিতে বিশ্লেষণ করেই হোক, আপনি সিদ্ধান্ত নিতে পারবেন, ঠিক কী করবেন বা কোন পথে গবেষণাটি নিয়ে এগোবেন। বিশেষ করে কম্পিউটারকে শেখানোর জন্য তথ্যের কোনো বিকল্প নেই। জরিপ চালাতে চান, লাগবে তথ্য। বর্তমান পৃথিবীতে সবচেয়ে মূল্যবান সম্পদটি আসলে কী? তেল? উঁহু, এর উত্তরও তথ্য।

বাংলাদেশে এ ধরনের গবেষণার তথ্যের বড় অভাব। বড় প্রতিষ্ঠানগুলো হয়তো নিজস্ব গবেষণার জন্য এ ধরনের তথ্য সংগ্রহ করতে পারে। কিন্তু সাধারণ শিক্ষার্থী বা গবেষকেরা এ ধরনের তথ্য কোথায় পাবেন? সমস্যা হলো, এ ধরনের তথ্য ছাড়া কম্পিউটারকে শেখানো সম্ভব নয়।

একটি ভালো গবেষণার জন্য কী পরিমাণ তথ্যের প্রয়োজন, সেটা নিয়ে হয়তো আপনার মনে প্রশ্ন জাগছে। উত্তরটা বেঙ্গলি এআইয়ের সমন্বয়ক সুস্মিত আসিফের মুখেই শোনা যাক। তিনি বুয়েটের ছাত্র ছিলেন। বর্তমানে পিএইচডি করছেন যুক্তরাষ্ট্রের নিউইয়র্কে অবস্থিত রেনসেলার পলিটেকনিক ইনস্টিটিউটে। তিনি বলেন, বেঙ্গলি এআইয়ের বর্তমান উদ্যোগ ‘স্পিচ রিকগনিশন’ নিয়ে। বাংলা কথা শুনে যেন কম্পিউটার বুঝতে পারে, সে জন্য বেঙ্গলি এআই বর্তমানে কাজ করছে। সুস্মিত আসিফ জানান, এ জন্য প্রয়োজন গড়পড়তা হিসাবে প্রায় ১০ হাজার ঘণ্টার অডিও ডেটা। এত দিন, এই গেল বছর পর্যন্তও গবেষকদের হাতে ছিল মাত্র ২০০ ঘণ্টার তথ্য। বেঙ্গলি এআইয়ের উদ্যোগে বর্তমানে সেটি ১০ গুণ বেড়ে ২ হাজার ঘণ্টায় এসে ঠেকেছে। এখনো যেতে হবে আরও বহুদূর পথ।

আমি নিজে কম্পিউটারবিজ্ঞান ও প্রকৌশল বিষয়ে পড়াশোনা করেছি। আমি দেখেছি, বাংলাদেশের শিক্ষার্থীরা গবেষণার জন্য দেড় শ-দুই শ নমুনা তথ্য সংগ্রহ করেন। সেটি বেড়ে বড়জোর হাজারে গিয়ে ঠেকে। নমুনার সংখ্যা লাখে পৌঁছাতে পেরেছেন, ব্যক্তিগত প্রচেষ্টায় এ রকম গবেষণার কথা আমার জানা নেই। গুগলের মতো প্রতিষ্ঠান কোটি কোটি মানুষের তথ্য ও সহায়তা নিয়েও এখনো গুগল ট্রান্সলেটে বাংলার যে অবস্থা, দেড়-দুই শ তো বটেই, হাজার হাজার নমুনা তথ্য থাকা আর শূন্য তথ্য থাকাও যে সেখানে একই কথা, তা বোধ হয় বুঝতে পারছেন।

বেঙ্গলি এআই তাই কম্পিউটারকে শেখানোর জন্য সবচেয়ে গুরুত্বপূর্ণ উদ্যোগটি নিয়েছে। এর নাম তথ্য সংগ্রহ এবং সেটি কম্পিউটারকে শেখানোর উপযোগী করে তথ্যভান্ডার বানিয়ে রাখা। অর্থাৎ ডেটাসেট বানানো। এই ডেটাসেট বলতে সহজে বোঝার জন্য ভাবতে পারেন, টেবিল বা তালিকা আকারে সজ্জিত তথ্য। তালিকার প্রতিটি কলামের ওপরে নাম লেখা থাকবে, এটি কী ধরনের তথ্য। বেঙ্গলি এআই শুধু এ ধরনের ডেটাসেট বানাচ্ছেই না, সেটি উন্মুক্তও করে রাখছে সবার জন্য।

২০১৭ সালের শেষ থেকে ২০২৩ পর্যন্ত; প্রায় সাড়ে চার বছর সময়। এর মধ্যে এ উদ্যোগের সঙ্গে যুক্ত হয়েছেন প্রায় সাত হাজার গবেষক। এর মধ্যে বিশ্ববিদ্যালয়ের শিক্ষার্থীরা যেমন আছেন, আছেন পিএইচডি–গবেষক, শিক্ষক, প্রোগ্রামাররাও। সবাই স্বেচ্ছাসেবী। একজনেরও এটি মূল কাজ নয়, অর্থের বিনিময় কেউই করছেন না এ কাজ। সবাই মিলে চেষ্টা করছেন নানা ধরনের ডেটাসেট গড়ে তুলতে। সবাই ভূমিকা রাখছেন নানাভাবে।

মূলত চারটি বিষয় সামনে রেখে এসব তথ্য সংগ্রহ করছেন তাঁরা। এক, ওসিআর বা অপটিক্যাল ক্যারেকটার রিকগনিশন। ইংরেজিতে কোনো লেখার সামনে ক্যামেরা ধরলে কম্পিউটার যেমন লেখাটি শনাক্ত করতে পারে, বাংলাতেও যেন সেটি পারে। সে জন্য প্রয়োজন হাতের লেখার তথ্য। দুই, গ্রামাটিক্যাল এরর কারেকশন—ব্যাকরণগত ভুল থাকলে তা শনাক্ত করা ও ঠিক করে দেওয়া। ইংরেজিতে এ জন্য রয়েছে ‘গ্রামারলি’। বাংলায় এমন কিছু গড়ে তুলতে চান তাঁরা। তিন, স্পিচ রিকগনিশন—বাংলা শুনে যেন কম্পিউটার বুঝতে পারে। এ জন্য আগে যেমন বলেছি, ১০ হাজার ঘণ্টার অডিও ডেটা সংগ্রহের চেষ্টা করছে বেঙ্গলি এআই। এখানে বেঙ্গলি এআই প্রশংসনীয় আরেকটি উদ্যোগের কথা বলতে হয়। বাংলার পাশাপাশি সিলেটি ভাষা, চাঁটগাঁইয়া ভাষা ইত্যাদি কম্পিউটারকে চেনানোর উদ্যোগও নিয়েছে তারা। চতুর্থটি হলো, সাইন ল্যাঙ্গুয়েজ বা অঙ্গভঙ্গির মাধ্যমে প্রকাশিত বাংলা ভাষা কম্পিউটারকে শেখানো।

অনেকেই নিশ্চয়ই ভাবছেন, এ জন্য তো কোডিং করতে হয় বা অ্যালগরিদম লিখতে হয়। এখানে ডেটাসেটের বিষয়টা কী? ওসিআরের কথা ভাবুন। এ ক্ষেত্রে ডেটাসেটের বিষয়টি সহজ করে ভাবতে পারেন, বাচ্চাদের হাতেখড়ির বইয়ের মতো। বোকা কম্পিউটারকে এই বই দিতে হবে। কম্পিউটার সেটা পড়বে, পড়তে পড়তে শিখবে। শেখার পর অধ্যায়ের শেষে অনুশীলনী সমাধান করতে দেওয়া হবে তাকে। সে কতগুলো সমস্যা ঠিকঠাক করে সমাধান করতে পারল, তা দেখতে হবে। যেগুলো ভুল করেছে, সেগুলো যে ভুল, তা তাকে ধরিয়ে দিতে হবে। তারপর আবার বই পড়তে দিতে হবে।

যত বেশি তথ্য বা ডেটা কম্পিউটারকে দেওয়া হবে, সেটি শিখবে তত ভালোভাবে। না হয় অনেক চমৎকার অ্যালগরিদম বা নির্দেশনা ব্যবহার করেও লাভ নেই। বিষয়টি এমন, আপনি একটা ছোট বাচ্চাকে বলে দিয়েছেন বই পড়ে কীভাবে শিখতে হয়, কিন্তু বইয়ে যথেষ্ট উদাহরণ নেই, সে শিখবে কীভাবে? যেন শিখতে পারে, এ জন্য যথেষ্ট উদাহরণ তো লাগবেই।

আলাপচারী—যেকোনো কিছু জিজ্ঞাসা করুন বাংলায়। আলাপচারীর ইন্টারফেস

যথেষ্ট পরিমাণ ডেটা বা তথ্য সরবরাহের পর আসবে কম্পিউটারকে শেখানোর প্রক্রিয়াটি। কম্পিউটার এই তথ্য দেখে কীভাবে শিখবে? ওপরে একটা উদাহরণ দিয়েছি। কম্পিউটারবিজ্ঞান ও প্রকৌশলের ভাষায় এর গৎবাঁধা নাম হলো, সুপারভাইজড লার্নিং বা কারও তত্ত্বাবধানে শেখা। মানে, কম্পিউটারকে ডেটা দেওয়া ও পরীক্ষা নেওয়া। পরীক্ষায় ভুল করলে তাকে ধরে দেওয়া ঠিক কোন জায়গাটায় সে ভুল করছে। তারপর আবার ডেটা দিয়ে শিখতে বসিয়ে দেওয়া। আরেকটি উপায় রয়েছে কম্পিউটারকে শেখানোর। এর নাম আনসুপারভাইজড লার্নিং বা তত্ত্বাবধানহীন শেখা। এ ক্ষেত্রে ডেটা সাজানো–গুছানো থাকে না। এলোমেলো তথ্য দেওয়া থাকে। কম্পিউটার সেটি পড়ে পড়ে নিজে নিজে শেখার চেষ্টা করে। এরপর নিজে নিজে অনুশীলনগুলো করে দেখে, সব উত্তর পারছে কি না। না পারলে এটি আবারও ডেটা দেখে শিখতে চেষ্টা করে। দুটির মূল বিষয়টি হলো, আনসুপারভাইজড লার্নিংয়ের ক্ষেত্রে কেউ কম্পিউটারকে ধরে ধরে বলে দেয় না, কোনগুলো সে ভুল শিখছে।

বেঙ্গলি এআই এই যে ডেটাসেট বানাচ্ছে, এগুলো দিয়ে তারা কম্পিউটারকে শেখাচ্ছে ঠিক কীভাবে? এত তথ্যই–বা তারা সংগ্রহ করছে কীভাবে? এ ক্ষেত্রে বেশ সহজ একটি উপায় বেছে নিয়েছে তারা। একদল গবেষকের দারুণ বুদ্ধির পরিচয়ও পাওয়া যায় এ থেকে।

তথ্য সংগ্রহের জন্য বেঙ্গলি এআই বিভিন্ন ক্যাম্পেইন আয়োজন করে। যেমন বর্তমানে স্পিচ রিকগনিশন ডেটাসেট গড়ে তোলার জন্য ক্যাম্পেইন চালাচ্ছে তারা। প্রায় ২৩ হাজার মানুষের কণ্ঠে ২ হাজার ঘণ্টার ডেটা সংগ্রহ করেছে তারা এরই মধ্যে। আবার এসব ডেটা থেকে ভালো অ্যালগরিম খুঁজে বের করার জন্য তারা আয়োজন করে বিভিন্ন প্রতিযোগিতার। যেমন বর্তমানে বাংলা বাক্যে ব্যাকরণগত ভুল ধরার জন্য তারা যে প্রতিযোগিতাটি চালাচ্ছে, এর নাম ‘ভাষাভ্রম’। এই প্রতিযোগিতার বর্ণনায় লেখা আছে—

‘“ভাষাভ্রম” নামে এ প্রতিযোগিতায় সারা দেশের শিক্ষার্থী, গবেষক ও শিক্ষক যে কেউ অংশগ্রহণ করতে পারবেন। কাজ: এমন অ্যালগরিদম বানানো, যা নানা ধরনের বাংলা বাক্যের ভুল ধরতে পারে। ২ লাখ+ টাকা প্রাইজমানি থাকছে প্রতিযোগিতায়!’

এ রকম প্রতিযোগিতার লাভটা কী? সুস্মিত আসিফ বলেন, ‘আগে আমরা শুধু সুপারভাইজড লার্নিং প্রক্রিয়ায় কম্পিউটারকে শেখাতাম। পরে দেখলাম, প্রতিযোগিতা আয়োজন করার সুবিধা হলো, এর মাধ্যমে সম্ভাব্য অনেক পথ খুঁজে পাওয়া যায়। ১০০টি দল হয়তো ১০০ ভাবে সমস্যা সমাধানের চেষ্টা করে। আমরা যাচাই-বাছাই করে দেখি, কোনটার সীমাবদ্ধতা কী। সবই কিন্তু উন্মুক্ত। প্রাথমিক ধাপগুলো কাজে লাগিয়ে যে কেউ আরও উন্নত পর্যায়ের অ্যালগরিদম তৈরি করতে পারে।’

ডেটাসেট ও দারুণ সব অ্যালগরিদম সবার জন্য উন্মুক্ত করে দেওয়ার লক্ষ্যে কাজ করে যাচ্ছে বেঙ্গলি এআই। এর অংশ হিসেবে এ বছরে তাদের পরিকল্পনা হলো, ১০ হাজার ঘণ্টার অডিও ডেটা সংগ্রহের পাশাপাশি বেশ কিছু আন্তর্জাতিক প্রতিযোগিতা আয়োজন করা। এ ছাড়া বাংলাদেশের গবেষণাগুলো আন্তর্জাতিক কনফারেন্সে উপস্থাপনও করবে বেঙ্গলি এআই।

ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিংয়ের (এনএলপি) আন্তর্জাতিক সংগঠন অ্যাসোসিয়েশন ফর কম্পিউটেশনাল লিঙ্গুইস্টিকসের (এসিএল) অন্যতম মর্যাদাপূর্ণ একটি আন্তর্জাতিক কনফারেন্স ‘ইম্পেরিক্যাল মেথডস ইন ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং (ইএমএনএলপি)’। কনফারেন্সটিতে ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিংয়ের বিশেষায়িত বিষয়, নতুন অ্যালগরিদম, নতুন গবেষণা ও বিভিন্ন বিষয়ভিত্তিক কর্মশালা হয়। ইএমএনএলপি কর্তৃপক্ষ কর্মশালা আয়োজনের জন্য আয়োজকদের কাছ থেকে প্রতিযোগিতামূলকভাবে প্রস্তাব গ্রহণের ঘোষণা দেয়। শতাধিক প্রস্তাব থেকে সেরা ৩০টির মতো প্রস্তাব গ্রহণ করা হয়। এর মধ্যে বাংলা ভাষাও জায়গা করে নেয়। ২০২৩ সালের ডিসেম্বরে কনফারেন্সটি সিঙ্গাপুরে অনুষ্ঠিত হবে। এতে অংশ নেবেন বেঙ্গলি এআইয়ের গবেষকেরা।

ভবিষ্যতে কী করবে বেঙ্গলি এআই? তাদের লক্ষ্য হলো, হাতে পর্যাপ্ত ডেটা চলে আসার পর (সবার জন্য উন্মুক্ত তো থাকছেই), ভালো ভালো সফটওয়্যার ও কৃত্রিম বুদ্ধিমত্তা তৈরির কাজে হাত দেওয়া। পাশাপাশি তরুণ গবেষকেরা যেন সরাসরি অভিজ্ঞ গবেষকদের সঙ্গে কাজ করতে পারেন, সে বিষয়ে উদ্যোগ নেবে তারা। তখন হয়তো বাংলাতেও তৈরি হবে চ্যাটজিপিটির মতো কৃত্রিম বুদ্ধিমত্তা।

বেঙ্গলি এআইয়ের স্বেচ্ছাসেবীদের একাংশ

তিন

চ্যাটজিপিটির কথা যেহেতু এলই, বাংলায় এমন একটি উদ্যোগ বোধ হয় অনেকেরই নজর কেড়েছে। উদ্যোগটির নাম ‘আলাপচারী’। বাংলা ভাষায় প্রশ্ন দেখে জবাব দিতে পারে, এমন একটি চ্যাটবট। যদিও এটি আসলে বেশির ভাগ প্রশ্নেরই উত্তর দিতে পারে না, দিলেও ভুল থেকে যায় অনেক এখনো। এটি বানিয়েছেন ইউনাইটেড ইন্টারন্যাশনাল ইউনিভার্সিটির প্রথম বর্ষের শিক্ষার্থী ফাহমিদুল হাসান। একাই এক শ! কথা হলো তাঁর সঙ্গে, বোঝা গেল, আলাপচারী কেন এখনো অতটা পরিণত নয়।

ফাহমিদুল জানান, এটি তিনি আলাদা করে বানাননি; কারণ, সে পরিমাণ তথ্যই ছিল না তাঁর কাছে। চ্যাটজিপিটির আগের ইঞ্জিন-জিপিটি ৩–এর সঙ্গে ট্রান্সলেটর জুড়ে দিয়ে বানিয়েছিলেন আলাপচারী, পরীক্ষামূলকভাবে। এটি নিয়ে ভবিষ্যতে সিরিয়াসলি কাজ করার ইচ্ছা রয়েছে তাঁর। তবে এখনো এটি শুধুই পরীক্ষামূলক একটি উদ্যোগ।

ফাহমিদুল হাসান জানান, যথেষ্ট পরিমাণ ডেটা থাকলে ভবিষ্যতে এ রকম কিছু নিজেরা বানানো যেতে পারে। তার আগপর্যন্ত চ্যাটজিপিটির নতুন ইঞ্জিন-জিপিটি ৪ ব্যবহার করে আরও যতটা উন্নত করা সম্ভব, সেটা তিনি করবেন।

চার

বাংলাদেশে এখন ধীরে ধীরে অনেকেই ডেটা সায়েন্স, মেশিন লার্নিংয়ের মতো বিষয়গুলোর ভারিক্কি শব্দের জাল ভেদ করে গভীরে ঢুকতে শুরু করেছেন। কাজ করতে শুরু করেছেন নিজেরাই। একসময় শুধু ফেসবুক বা গুগলের বিজ্ঞাপনের জন্য ডেটা সায়েন্সের ব্যবহার হতো। এখন নিজেরা ডেটা সংগ্রহের পাশাপাশি অ্যালগরিদম বানানো বা উন্নতি করা, যে অ্যালগরিদমগুলো আছে, সেগুলো যথাযথ কাজে ব্যবহার করছেন বিভিন্ন বিশ্ববিদ্যালয়ের শিক্ষক-শিক্ষার্থী ও গবেষকেরা।

ধীরে ধীরে আমরা বুঝতে শিখছি, কৃত্রিম বুদ্ধিমত্তা মানেই টার্মিনেটর বা রোবট নয়। কম্পিউটারের বুদ্ধিমান প্রোগ্রাম, মানুষের সহকারী। আর বোকা কম্পিউটারকে বুদ্ধিমান করার জন্য প্রয়োজন ডেটা। বেঙ্গলি এআইসহ আরও অনেকেই এ রকম উদ্যোগ নিচ্ছে, তবে তাদের সহযোগিতার জন্য এগিয়ে আসছেন বাংলাদেশের বিভিন্ন অঞ্চলের শিক্ষার্থী, শিক্ষক, গবেষক—সবাই। সবার এ সম্মিলিত উদ্যোগে একসময় বাংলাতেও তৈরি হবে দারুণ বুদ্ধিমান সব কম্পিউটার প্রোগ্রাম, কৃত্রিম বুদ্ধিমত্তা—এটুকু আশা বোধ হয় করাই যায়।

লেখক: সহসম্পাদক, বিজ্ঞানচিন্তা