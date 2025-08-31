প্রযুক্তি

যেভাবে কাজ করে কৃত্রিম বুদ্ধিমত্তা

বর্তমান প্রযুক্তির দুনিয়ার জনপ্রিয় ধারার কিছু শব্দ রোবটিকস, কৃত্রিম বুদ্ধিমত্তা, মেশিন লার্নিং ও ডিপ লার্নিং। সঙ্গে যদি ডেটা সায়েন্স আর বিগ ডেটা যোগ করে দেওয়া যায়, তাহলে আধুনিক প্রযুক্তির ধাই ধাই করে এগিয়ে চলার বেশির ভাগটাই চলে আসে। প্রশ্ন হলো, প্রথম বাক্যে আমরা যে চারটা শব্দ বলেছি, এগুলো কি এক? যদি এ নিয়ে তেমন ভেবে না থাকেন, তাহলে একটুখানি থেমে চিন্তা করে নিতে পারেন প্রথম দুটি শব্দ নিয়ে। রোবটিকস আর কৃত্রিম বুদ্ধিমত্তা কি এক জিনিস, নাকি আলাদা কিছু?

সাসপেন্স তৈরি করার কিছু নেই। রোবটিকস আর কৃত্রিম বুদ্ধিমত্তা দুটি আলাদা বিষয়। কিন্তু অনেক ক্ষেত্রেই এ দুটো মিলেমিশে যায়। বাইরে থেকে দেখে তাই দুটিকে একই মনে হওয়া স্বাভাবিক।

রোবট মানে এমন কোনো যন্ত্র, যেটা প্রায় স্বয়ংক্রিয়ভাবে নির্দিষ্ট কোনো কাজ করতে পারে। সে জন্য তাকে প্রোগ্রাম করে দিতে হয়। রোবটের দেহ থাকে। দেহ মানে যান্ত্রিক অবকাঠামো। খুব যত্ন করে এর নকশা করা হয়। বৈদ্যুতিক শক্তি ব্যবহারের মাধ্যমে এই অবকাঠামোর কাজ করে। কাজ মানে, যা বলা থাকে, ঠিক ঠিক তা-ই করা। প্রকৌশলবিদ্যার যে শাখা এই রোবট বানানো নিয়ে কাজ করে, তাকে বলে রোবটিকস।

উদাহরণ দিই। ধরুন, আপনার বাসায় এমন একটা যন্ত্র আছে, যেটা চালু করে দিলে ঘরের মেঝেটা মুছে ফেলে। ঘরের একদিক থেকে সরলরেখায় মুছতে শুরু করে আর সামনে বাধা পেলে ১৮০ ডিগ্রি ঘুরে যায় ধীরে ধীরে। রোবটটাকে এমনভাবে প্রোগ্রাম করে দেওয়া হয়েছে যে ডান দিক থেকে ঘর মোছা শুরু করলে, বাঁয়ে দেয়াল না পাওয়া পর্যন্ত কাজ চালিয়ে যাবে। আবার বাঁ থেকে ঘর মোছা শুরু করলে, ডান দিকে দেয়াল না পাওয়া পর্যন্ত কাজ চালিয়ে যাবে। এই প্রোগ্রাম করা খুব সহজ। কম্পিউটার প্রোগ্রামিংয়ে ‘যদি…না হলে’ বলে একটা কথা আছে। প্রোগ্রাম যেহেতু ইংরেজিতে লেখা হয়, তাই কথাটাকে বলে ‘if…else’। ইফ মানে যদি, এলস মানে না হলে। যেমন ধরুন, আমাদের ঘর মোছার এই রোবটকে আমরা বলে দিয়েছি—

এখন সে আপনাকে ল্যাপটপ ছাড়া আর কী কী জিনিসের বিজ্ঞাপন দেখাতে পারে? এই যে সিদ্ধান্ত নিতে হবে, ফেসবুকের কৃত্রিম বুদ্ধিমত্তা তার বহুল পরীক্ষিত অ্যালগরিদম ব্যবহার করে সেই সিদ্ধান্তে পৌঁছাবে।

যদি তুমি ডান দিক থেকে কাজ শুরু করো, তাহলে (বাঁয়ে দেয়াল আছে কি না, দেখবে)

যদি থাকে—থেমে যাবে;

না হলে—১৮০ ডিগ্রি ঘুরে আবার সরলরেখায় মুছতে থাকবে।

সহজ ভাষায়, এই হলো আমাদের রোবট। (এখানে আমি কোনো প্রোগ্রামিং ভাষা ব্যবহার করিনি সরাসরি, তবে ইংরেজিতে বিষয়টা মোটামুটি এভাবেই লেখা হয়। আমি যেটা লিখেছি, সেটাকে স্যুডোকোড বা অতিসরলীকরণ করে অ্যালগরিদম বলা যায়।)

আরেকটি বিষয় হলো, আমরা যে বলেছি, রোবট প্রায় স্বয়ংক্রিয়, এই ‘প্রায়’ বলার কারণ, স্বয়ংক্রিয় নয়, এমন রোবটও আছে। যেমন টেলিরোবট। দূর থেকে এগুলোকে রিমোট কন্ট্রোলের মাধ্যমে নিয়ন্ত্রণ করা হয়। (রিমোট কন্ট্রোল মানেই কিন্তু দূরনিয়ন্ত্রণব্যবস্থা!)

দুই

এবার কৃত্রিম বুদ্ধিমত্তার কথায় আসা যাক। রোবটের সঙ্গে কৃত্রিম বুদ্ধিমত্তার সবচেয়ে বড় পার্থক্য, কৃত্রিম বুদ্ধিমত্তা বলতে বোঝানো হয় প্রোগ্রামকে। প্রোগ্রাম মানে কিছু কম্পিউটার কোড, কিছু অ্যালগরিদমের সমষ্টি। অ্যালগরিদম মানে, একটা কাজ ধাপে ধাপে কীভাবে করতে হবে, সেটা বলে দেওয়া। ওপরে আমরা এর একটা সহজ উদাহরণ দেখেছি। যা–ই হোক, আসল কথা হলো, কৃত্রিম বুদ্ধিমত্তার দৃশ্যমান কোনো দেহ বা অবকাঠামো থাকা বাধ্যতামূলক নয়।

আসলে কৃত্রিম বুদ্ধিমত্তা কম্পিউটারবিজ্ঞানের একটি শাখা। শিখে শিখে বা চিন্তাভাবনা করে সিদ্ধান্ত নেওয়া লাগে, এ রকম কাজের জন্য কম্পিউটার প্রোগ্রাম গড়ে তোলাই এই শাখার কাজ। ফেসবুক বা সামাজিক যোগাযোগমাধ্যমে কিংবা গুগলে আমরা যখন কিছু লিখে সার্চ দিই, তখন সংশ্লিষ্ট বিভিন্ন বিজ্ঞাপন গুগল ও ফেসবুক আমাদের দেখায়। এ জন্য ব্যবহৃত হয় কৃত্রিম বুদ্ধিমত্তা বা আর্টিফিশিয়াল ইন্টেলিজেন্স (এআই)। যেমন ধরুন, আপনি ল্যাপটপ লিখে ফেসবুকে সার্চ করলেন। এখন সে আপনাকে ল্যাপটপ ছাড়া আর কী কী জিনিসের বিজ্ঞাপন দেখাতে পারে? এই যে সিদ্ধান্ত নিতে হবে, ফেসবুকের কৃত্রিম বুদ্ধিমত্তা তার বহুল পরীক্ষিত অ্যালগরিদম ব্যবহার করে সেই সিদ্ধান্তে পৌঁছাবে। সে মেমোরিতে খুঁজে দেখবে, আগে যারা ল্যাপটপ কিনেছে, পরবর্তী সময়ে তারা কি–বোর্ড, এসএসডি কিংবা ওয়েবক্যাম বা ল্যাপটপের চার্জার ইত্যাদি জিনিস কিনেছে। তার মানে, আপনিও এই জিনিসগুলো কিনতে চাইতে পারেন। এই সম্ভাবনাকে সে কাজে লাগানোর চেষ্টা করে। এই জিনিসগুলোর বিজ্ঞাপন দেখিয়ে সে আপনাকে ফুসলাতে শুরু করবে। ফেসবুকে ঢুকলেই আপনি দেখতে পাবেন ওয়েবক্যাম বা কি-বোর্ডের বিজ্ঞাপন। কি-বোর্ড বিভিন্ন ধরনের হয়। মেমব্রেন কি-বোর্ড, মেকানিক্যাল কি-বোর্ড, অপটিক্যাল কি-বোর্ড ইত্যাদি। কৃত্রিম বুদ্ধিমত্তা আপনাকে কোন ধরনের কি-বোর্ডের বিজ্ঞাপন দেখাবে? ধরুন, দুই মাস আগে আপনি মেকানিক্যাল কি-বোর্ড সার্চ করেছেন। এই তথ্য ব্যবহার করে সে আপনাকে বেশির ভাগ বিজ্ঞাপন দেখাবে মেকানিক্যাল কি-বোর্ডের। অল্প কিছু অন্য ধরনের কি-বোর্ডের বিজ্ঞাপনও দেখাবে। (এই যে বিভিন্ন তথ্য প্রসেস করে, প্রয়োজনীয় তথ্য খুঁজে বের করে তা কাজে লাগাচ্ছে যন্ত্র, এর নাম ডেটা সায়েন্স বা তথ্য-উপাত্তবিজ্ঞান।)

কৃত্রিম বুদ্ধিমত্তা যেন এভাবে নিজে নিজে শিখতে পারে এবং সঠিক সিদ্ধান্ত নিতে পারে, সে জন্য তাকে বলে দিতে হয়, কাজটা সে কীভাবে করবে। এই বলে দেওয়ার পদ্ধতিটার নামই অ্যালগরিদম। এটা আমরা ওপরে দেখেছি। এই অ্যালগরিদমকে প্রধানত দুই ভাগে ভাগ করা যেতে পারে।

প্রচলিত অ্যালগরিদমের ক্ষেত্রে, আমরা কম্পিউটার বা যন্ত্রকে বলে দিই, কাজটা কীভাবে করতে হবে। তারপর তাকে ইনপুট দিয়ে দিই। যন্ত্র তখন অ্যালগরিদমের ধাপগুলো মেনে, ধাপে ধাপে পুরো কাজটা শেষ করে আমাদের আউটপুট বা ফলাফলটা দেয়। কিন্তু কৃত্রিম বুদ্ধিমত্তাকে এভাবে কাজ করতে বললে সমস্যা। কারণ, ছোটখাটো অনেক অনেক বিষয় তখন তাকে বলে দিতে হবে। আর সে নিজে থেকে ঠিক সিদ্ধান্তে আসতে পারবে না। কারণ, কী হলে কী করতে হবে, এটা তাকে একদম ধাপে ধাপে বলে দেওয়া আছে। এ জন্য কৃত্রিম বুদ্ধিমত্তাকে শেখানোর জন্য বিশেষ ধরনের পদ্ধতি ব্যবহার করা হয়। এই পদ্ধতির নাম মেশিন লার্নিং।

অনেকেই মেশিন লার্নিং ও কৃত্রিম বুদ্ধিমত্তাকে এক করে ফেলেন। দুটি পুরোপুরি এক নয়। কৃত্রিম বুদ্ধিমত্তার একটি অংশ এই মেশিন লার্নিং। আবার মেশিন লার্নিং ডেটা সায়েন্সেরও একটি অংশ। (ডেটা সায়েন্স অবশ্য অনেক বিশাল একটি ক্ষেত্র। এ নিয়ে আমরা এখানে আলোচনা করব না। কারণ, ওদিকে গেলে কৃত্রিম বুদ্ধিমত্তা নিয়ে আর কথা বলে শেষ করা যাবে না।)

এটাই মেশিন লার্নিং অ্যালগরিদম। ইনপুট আর আউটপুটের সম্পর্ক হিসাব করে, মানে ছবির সঙ্গে বয়স মিলিয়ে মিলিয়ে কোন বয়সী ব্যক্তিদের চামড়ায় কতটা ভাঁজ পড়ে, কুঁচকে যায় ইত্যাদি বের করে নেওয়াটা হলো তার অভিজ্ঞতা।

মেশিন লার্নিং নামটা শুনেই বোঝা যায়, এটা যন্ত্রকে শেখানোর পদ্ধতি। অথবা যন্ত্রের শেখার পদ্ধতি। এ ক্ষেত্রে প্রোগ্রামার কোন পরিস্থিতিতে ঠিক কী করতে হবে, সেটা না বলে, কীভাবে করতে হবে, সেটা বলে দেয়। পাশাপাশি বেশ কিছু ইনপুট ও সেগুলোর আউটপুট বলে দেয়। যন্ত্র এই ইনপুট ও আউটপুটকে ব্যবহার করে অভিজ্ঞতা হিসেবে।

একটা সহজ উদাহরণ ভাবা যাক। আপনি যখন কারও চেহারার দিকে তাকান, তখন আন্দাজ করতে পারেন, তার বয়স কত। এই আন্দাজ আপনি কীভাবে করেন? করেন অভিজ্ঞতা থেকে। ২০ বছর বয়সী একজনের চেহারা দেখতে কেমন হবে, তা আপনি জানেন, আগে দেখেছেন। একইভাবে ৩০ বছর বয়সী, ৪০ বছর বয়সী বা আরও বয়স্ক মানুষের চেহারা আপনি দেখেছেন। এভাবে দেখতে দেখতে আপনার অভিজ্ঞতা হয়েছে। এখন অচেনা কারও চেহারার দিকে তাকালে সেই অভিজ্ঞতা থেকে আপনি আন্দাজ করতে পারেন, তার বয়স কত।

যন্ত্র এটা কীভাবে করবে? সাধারণ বা প্রচলিত পদ্ধতির প্রোগ্রামিং হলে যন্ত্রকে আপনার বলে দিতে হবে, পুরুষ হলে, মুখে দাড়ি থাকলে তাঁর বয়স হবে ১৮–এর বেশি। দেখতে হবে তাঁর চেহারায়, চামড়ায় কী পরিমাণ ভাঁজ আছে ইত্যাদি। কিন্তু এ রকম করে বলতে গেলে চামড়ায় কতটুকু ভাঁজের জন্য বয়স কত ধরে নিচ্ছেন, এই বিষয়টা বলে দিতে হবে যন্ত্রকে। এটা আমরা স্বাভাবিকভাবে দেখে অনেক নিখুঁতভাবে বুঝতে পারি না। এই সমস্যা সমাধানের জন্য তাই মেশিন লার্নিং কাজে লাগাতে পারি।

ধরুন, একটা যন্ত্রকে আমরা ১০ হাজার মানুষের চেহারার ছবি দিয়েছি। পাশাপাশি তাদের বয়স কত, সেটাও বলে দিয়েছি। এখানে ইনপুট হলো ছবি, আউটপুট হলো তাদের বয়স। তারপর বলে দিয়েছি, চামড়ার ভাঁজ, কুঁচকে যাওয়া, চোখের কোণে কালশিটে পড়ে যাওয়া ইত্যাদি বিষয় কোন বয়সীদের জন্য কী রকম, সেটা বের করো। যন্ত্র তখন ছবিগুলোকে প্রসেস করবে। খুঁটিয়ে দেখবে সবকিছু। কীভাবে করবে, মানে কী কী দেখবে, সেটা তাকে বলে দিয়েছি আমরা। এটাই মেশিন লার্নিং অ্যালগরিদম। ইনপুট আর আউটপুটের সম্পর্ক হিসাব করে, মানে ছবির সঙ্গে বয়স মিলিয়ে মিলিয়ে কোন বয়সী ব্যক্তিদের চামড়ায় কতটা ভাঁজ পড়ে, কুঁচকে যায় ইত্যাদি বের করে নেওয়াটা হলো তার অভিজ্ঞতা। এখন নতুন কারও ছবি যদি ইনপুট দিয়ে বয়স জিজ্ঞাসা করি, সে আগের অভিজ্ঞতা ব্যবহার করে আউটপুট দেবে, মানে বয়সটা বলে দেবে। কতটা নিখুঁতভাবে এই কৃত্রিম বুদ্ধিমত্তা বয়স বলতে পারছে, সেটা দেখা হয়। এটা হলো তার এফিশিয়েন্সি বা কার্যদক্ষতা। আর কতটা ভুল করছে, তা হলো এরর। ১০০টা এ রকম নতুন ছবি দিলে যদি দেখা যায়, ৯০ জনের ছবি থেকে সে বয়সটা নিখুঁতভাবে বের করতে পারছে, তাহলে এর এফিশিয়েন্সি ৯০ শতাংশ, এরর ১০ শতাংশ। অভিজ্ঞতা অর্জনের জন্য বা শেখার জন্য এই কৃত্রিম বুদ্ধিমত্তাকে যত বেশি ছবি দেব, তার শেখা তত ভালো হবে। মানে এফিশিয়েন্সি তত বাড়বে। ১০ হাজারের জায়গায় ১ লাখ দিলে তার অভিজ্ঞতা অনেকটা বাড়বে। আর শেখার জন্য যদি মাত্র ১ হাজার ছবি দিই, তার অভিজ্ঞতা হবে অনেক কম।

গুগলের কৃত্রিম বুদ্ধিমত্তার কাছে সারা পৃথিবীর প্রায় সব মানুষের চেহারার তথ্য আছে। আমরা গুগল ড্রাইভে বা ফটোসে যেসব ছবি রাখি, এগুলো থেকে সে শেখে। এ জন্য যেকোনো ছবি দেখলেই সে বলতে পারে, এটা কার ছবি। ফেসবুকেও এটা দেখা যায়। অচেনা কেউ আপনার ছবি আপলোড করলেও ফেসবুক নোটিফিকেশন দেয়, আপনার একটা ছবি হয়তো অমুক আপলোড করেছে। দেখুন তো এটা আপনার ছবি কি না?

কৃত্রিম বুদ্ধিমত্তার ব্যবহার এখন সব জায়গায় হচ্ছে। ফেসবুক বা গুগলের সার্চ অ্যালগরিদম বা বিজ্ঞাপন দেখানো থেকে শুরু করে ব্যবসা-বাণিজ্য, চিকিৎসাবিজ্ঞান কিংবা দাবা খেলার মতো জটিল সব বিষয়েও এর ব্যবহার হচ্ছে নিয়মিত। আবহাওয়া নির্ণয়ের জন্যও এখন ব্যবহৃত হচ্ছে কৃত্রিম বুদ্ধিমত্তা। আকাশের অবস্থা, মেঘের অবস্থা, ঘূর্ণিবায়ু আছে কি না, কতটা আছে, আর্দ্রতা কত, তাপমাত্রা ইত্যাদি দেখে অ্যালগরিদম ও অভিজ্ঞতা থেকে কৃত্রিম বুদ্ধিমত্তা বের করে ফেলতে পারছে, কোথাও ঝড়-বৃষ্টি হবে কি না।

মেশিন লার্নিংয়ের আবার বিভিন্ন ভাগ আছে। আমরা অতটা গভীরে যাব না। তবে এখানে আমরা ডিপ লার্নিংটা কী, সেটা একটু বুঝতে চেষ্টা করব। মেশিন লার্নিংয়ের একটা অংশ এই ডিপ লার্নিং। এ ক্ষেত্রে যে বিশেষ ধরনের অ্যালগরিদম ব্যবহার করা হয় তথ্য প্রসেস করার জন্য, সেটাই পার্থক্য গড়ে দেয়। এই অ্যালগরিদম একধরনের নেটওয়ার্ক গড়ে তোলে। এই নেটওয়ার্কের জন্য ডিপ লার্নিং অনেক জটিল কাজ করতে পারে, কোথাও ভুল হলে বুঝতে পারে নিজে নিজেই। ব্যবহৃত নেটওয়ার্কটি বিজ্ঞান কল্পগল্পের কল্যাণে আমাদের বহুল পরিচিত—নিউরাল নেটওয়ার্ক।

মুহম্মদ জাফর ইকবালের একটি বিজ্ঞান কল্পকাহিনি আছে। প্রডিজি। এই বইয়ে দেখানো হয়েছে, সত্যি সত্যি মানবমস্তিষ্ক ব্যবহার করা হচ্ছে নিউরাল নেটওয়ার্ক হিসেবে। পড়ে আমি মোটামুটি বিশ্বাস করে ফেলেছিলাম, নিউরাল নেটওয়ার্ক মানেই বুঝি মানুষের মস্তিষ্ককে ব্যবহার করে গড়ে তোলা নেটওয়ার্ক। আসলে তা নয়।

মানুষের মস্তিষ্কে এক হাজার কোটি স্নায়ুকোষ বা নিউরন একে অন্যের সঙ্গে জটিল এক সম্পর্কের জালে যুক্ত থাকে। একে বলে জৈবিক নিউরাল নেটওয়ার্ক। আমরা এখানে কথা বলছি কৃত্রিম নিউরাল নেটওয়ার্ক নিয়ে। এর মানে, অনেক অনেক নোড এখানে একে অন্যের সঙ্গে যুক্ত আছে। নোড মানে নেটওয়ার্কের একেকটি জয়েন্ট বা একেকটি বিন্দু। (নিচের ছবিটি দেখুন) এটা মানুষের মস্তিষ্ক যেভাবে সিদ্ধান্তে পৌঁছায়, সেভাবেই তথ্য প্রসেস করে সিদ্ধান্তে পৌঁছাতে চেষ্টা করে। বলে রাখা প্রয়োজন, যে কৃত্রিম নিউরাল নেটওয়ার্ক ডিপ লার্নিং অ্যালগরিদমের মাধ্যমে গড়ে ওঠে, তা আসলে সত্যিকারের কোনো নেটওয়ার্ক না। ভার্চ্যুয়াল নেটওয়ার্ক। এর কোনো দৃশ্যমান গঠন নেই। শুধু অ্যালগরিদমটা নেটওয়ার্কের মতো কাজ করে। একই মুহূর্তে বিভিন্ন নোডে বিভিন্ন ধরনের কাজ হচ্ছে, ভুল হচ্ছে কি না, সেটা বের করার চেষ্টা চলছে, আবার কাজ এগিয়েও যাচ্ছে। এভাবে ধীরে ধীরে এটি একটি সিদ্ধান্তে পৌঁছায়। ভুল হলে মেশিন লার্নিং অ্যালগরিদমে সাধারণত কোনো মানুষকে ঠিক করে দিতে হয় বা নতুন তথ্য দিতে হয়। ডিপ লার্নিং অ্যালগরিদম নিউরাল নেটওয়ার্ক ব্যবহার করায় এটা বেশির ভাগ ক্ষেত্রে নিজেই ভুল সংশোধন করে নিতে পারে।

আরেকটি গুরুত্বপূর্ণ বিষয় হলো, নাম নিউরাল নেটওয়ার্ক হলেও ভার্চ্যুয়াল এই নেটওয়ার্কের কোনো অনুভূতি বা চেতনা নেই। এটা পুরোপুরি বিজ্ঞান কল্পগল্পের অংশ, লেখকেরা গল্পের প্রয়োজনে লিখতে পছন্দ করেন। বাস্তবে এ রকম কিছু এখনো হয়নি। বিষয়গুলো কী, কীভাবে কাজ করে, এটা আমরা মোটামুটি বুঝলাম। রোবট মানে যান্ত্রিক অবকাঠামো, যেটা স্বয়ংক্রিয়ভাবে কোনো নির্দিষ্ট কাজ করতে পারে। আর কৃত্রিম বুদ্ধিমত্তা হলো শিখে শিখে বা চিন্তাভাবনা করে সিদ্ধান্ত নেওয়া লাগে, এ রকম কাজের জন্য গড়ে তোলা কম্পিউটার প্রোগ্রাম। কৃত্রিম বুদ্ধিমত্তাকে সরাসরি প্রোগ্রামিং করে দেওয়া যায়, আবার মেশিন লার্নিংয়ের মাধ্যমেও শেখানো যায়। কৃত্রিম বুদ্ধিমত্তার সঙ্গে রোবটের পার্থক্য তো দেখলাম, কিন্তু এগুলো কি পুরোপুরি ভিন্ন জিনিস? এগুলোকে তাহলে একই জিনিস বলে মনে করে কেন অনেকে? উত্তরটা আমরা আগেই দেখেছি, এগুলো অনেক ক্ষেত্রেই মিলেমিশে যায়। কীভাবে?

তিন

অনেক জটিল কোনো কাজের জন্য আমাদের যদি কোনো রোবট ডিজাইন করতে হয়, তাহলে সেটাকে শুধু প্রোগ্রামিং করে দিলে কী হবে? ধরুন, আপনি মস্তিষ্কের জটিল কোনো অপারেশনের জন্য রোবট বানাতে চাচ্ছেন। এই রোবটকে মুহূর্তের মধ্যে জটিল সব সিদ্ধান্ত নিতে হবে। এ রকম ক্ষেত্রে সাধারণত রোবটের মধ্যে কৃত্রিম বুদ্ধিমত্তা ব্যবহার করা হয়। আর তাকে শেখানোর জন্য ব্যবহার করা হয় মেশিন লার্নিং।

যেমন, এক কোটি মস্তিষ্ক অপারেশনের ভিডিও রোবটটিকে দেওয়া হলো। কোন অপারেশনগুলো সফল হয়েছে, কোনগুলো ব্যর্থ হয়েছে, তা–ও বলে দেওয়া হলো। রোবটের কৃত্রিম বুদ্ধিমত্তা খুঁটিয়ে দেখবে, ব্যর্থ অপারেশনগুলোতে সমস্যা কী হয়েছিল। সফলগুলোতে কোন পরিস্থিতিতে চিকিৎসক কী করেছেন। ১ কোটি বা ১০ কোটি অপারেশনের তথ্য বিশ্লেষণ করে কৃত্রিম বুদ্ধিমত্তাসম্পন্ন একটি রোবট নিঃসন্দেহে যেকোনো ভালো মানব চিকিৎসকের চেয়ে সফল ও নিখুঁতভাবে অপারেশনটি করতে পারবে। এখানেই কৃত্রিম বুদ্ধিমত্তার সাফল্য।

এ রকম আরেকটি বাস্তব উদাহরণ হলো টেসলার ইলেকট্রিক কার। এটি স্বয়ংক্রিয়ভাবে চলে। এ জন্য এটা ব্যবহার করে কৃত্রিম বুদ্ধিমত্তা। টেসলা এই কৃত্রিম বুদ্ধিমত্তাকে মেশিন লার্নিং ব্যবহার করে প্রশিক্ষণ দিয়েছে। গাড়ি চালানো কিন্তু জটিল একটা কাজ। কতটুকু দূরে, কত গতিবেগে একটা গাড়িকে চলতে দেখলে দুর্ঘটনা ঘটার আশঙ্কা আছে বলে বুঝতে হবে, ব্রেক কষতে হবে, রাস্তার বাঁক আসলে ঘুরতে হবে, ট্রাফিক বাতি দেখে থামতে বা চলতে হবে ইত্যাদি সবই টেসলার এই গাড়ির কৃত্রিম বুদ্ধিমত্তা বুঝতে পারে। তার সেই অভিজ্ঞতা আছে। এই গাড়ির কৃত্রিম বুদ্ধিমত্তার হাতে চালানোর দায়িত্ব দিয়ে আপনি নিশ্চিন্তে ঘুমাতে পারবেন! (যদিও, এখনই সেটা সম্ভব নয়। কৃত্রিম বুদ্ধিমত্তার হাতে চালানোর দায়িত্ব দিয়ে ঘুমিয়ে পড়া আইনত অবৈধ। আপাতত তাই জেগে থাকতে হবে। কারণ, পুরোপুরি নিয়ন্ত্রণ নেওয়ার জন্য গাড়িটিকে আরও শিখতে হবে, আরও অভিজ্ঞতা অর্জন করতে হবে।)

এসব সমস্যা সমাধানের জন্য বিকল্প ভাবা হয়েছে। বর্তমানে এ জন্য যুক্তরাজ্যের ইঞ্জিনিয়ারিং অ্যান্ড ফিজিক্যাল সায়েন্সেস রিসার্চ কাউন্সিল (ইপিএসআরসি) ও আর্টস অ্যান্ড হিউম্যানিটিস রিসার্চ কাউন্সিলের (এএইচআরসি) নির্ধারিত পাঁচটি নিয়ম অনুসরণ করা হয়।

এই গাড়িও কিন্তু একটি রোবট। কৃত্রিম বুদ্ধিমত্তাসম্পন্ন রোবট। কৃত্রিম বুদ্ধিমত্তাবিশিষ্ট রোবট গাড়ি শুনলেই ট্রান্সফরমার্স মনে করার কোনো কারণ নেই। রোবট মানে যে যন্ত্র নির্দিষ্ট কাজ করতে পারে। এই গাড়ি যেহেতু নিরাপদে চলতে পারে, যাত্রীকে গন্তব্যে পৌঁছে দিতে পারে, তাই এটাও একটা রোবট।

এখানেই চলে আসে কল্পবিজ্ঞান লেখকদের কল্পনা বনাম বাস্তবতা। কোনো রোবট গাড়ি যদি তার যাত্রীকে মেরে ফেলতে চায়? কিংবা এটা যদি সামনে চলে আসা কোনো পথচারীর ওপর গাড়ি তুলে দেয়? সত্যি বলতে, এখনো এ রকম কোনো রোবট বা কৃত্রিম বুদ্ধিমত্তা বাস্তবে নেই, যেটা এ রকম কিছু করে বসতে পারে। কারণ, এখন পর্যন্ত কোনো রোবট বা কৃত্রিম বুদ্ধিমত্তা নিজে চিন্তা করতে পারে না। তবু এ নিয়ে মানুষ চিন্তাভাবনা কম করেনি। কারণ, রোবট ও কৃত্রিম বুদ্ধিমত্তা এখন আর বিজ্ঞান কল্পগল্পের অংশ নয়, নিখাদ বাস্তব।

চার

১৯৪২ সালে আইজ্যাক আসিমভ রোবটরা যেন মানুষের ক্ষতি করতে না পারে, সে জন্য তিনটি সূত্র লিখেছিলেন। এই সূত্রগুলো তিনি লিখেছেন একটি ছোটগল্পে। নাম রানঅ্যারাউন্ড। সূত্রগুলো ‘থ্রি লজ অব রোবটিকস’ নামে বিখ্যাত। সূত্র তিনটি হলো—

১. কোনো রোবট জেনেবুঝে মানুষের ক্ষতি করতে পারবে না এবং মানুষের ক্ষতি হতে দেখলে নিষ্ক্রিয় থাকতে পারবে না, থামাতে চেষ্টা করবে।

২. প্রথম সূত্রের সঙ্গে সাংঘর্ষিক না হলে, মানুষের দেওয়া যেকোনো নির্দেশ রোবটকে মানতে হবে।

৩. প্রথম ও দ্বিতীয় সূত্রের সঙ্গে সাংঘর্ষিক না হলে রোবট নিজের অস্তিত্ব রক্ষার জন্য যেকোনো কিছু করতে পারবে।

এই সূত্রগুলো অনেক বিখ্যাত হলেও ঠিক কার্যকর নয়। যেমন, কোনো রোবট হয়তো জানেই না, সে যে খাবার একজন মানুষকে খেতে দিচ্ছে, সেটা বিষাক্ত। অথবা ওপরের গাড়ির কথা ভাবলে, স্বয়ংক্রিয় একটা গাড়ি যদি দেখে, সামনে তিনজন হঠাৎ চলে এসেছে। পাহাড়ি রাস্তা। গাড়িতেও তিনজন বসে আছে। রোবট গাড়িটা সাইড করতে গেলে নিচে পড়ে যাবে। তখন গাড়ির ভেতরের সবাই মারা যেতে পারে। আর সামনের মানুষের ওপর গাড়ি তুলে দিলে তারা মারা যেতে পারে। রোবট গাড়িটা এখন কী করবে? এ ধরনের বিভিন্ন সমস্যার সমাধান আসিমভের সূত্রগুলো দিতে পারে না। তা ছাড়া দ্বিতীয় সূত্রটি দিয়ে রোবটকে সরাসরি মানুষের দাস বানিয়ে দেওয়া হয়। যদিও ‘রোবট’ শব্দটি এসেছেই দাসত্ব থেকে। পূর্ব ইউরোপের স্লাভোনিক ভাষায় ‘রোবোটা’ শব্দের অর্থ দাসত্ব। সেখান থেকেই এসেছে রোবট, যার বাংলা হলো যন্ত্র-দাস।

এসব সমস্যা সমাধানের জন্য বিকল্প ভাবা হয়েছে। বর্তমানে এ জন্য যুক্তরাজ্যের ইঞ্জিনিয়ারিং অ্যান্ড ফিজিক্যাল সায়েন্সেস রিসার্চ কাউন্সিল (ইপিএসআরসি) ও আর্টস অ্যান্ড হিউম্যানিটিস রিসার্চ কাউন্সিলের (এএইচআরসি) নির্ধারিত পাঁচটি নিয়ম অনুসরণ করা হয়। এই নিয়মগুলো উঠে এসেছে আসিমভের সূত্রগুলো থেকেই, কিন্তু এগুলো আরও বেশি বাস্তব। নিয়মগুলো হলো—

১. জাতীয় নিরাপত্তার প্রয়োজন ছাড়া কোনো রোবটিক অস্ত্র বানানো যাবে না।

২. বর্তমান সব আইন ও মানবাধিকার আইন রোবটকে মেনে চলতে হবে। ব্যক্তিগত তথ্যের গোপনীয়তাবিষয়ক আইনও এর অন্তর্ভুক্ত।

৩. অন্যান্য পণ্যের মতোই ব্যবহারকারী ব্যক্তির জন্য রোবটকে যথেষ্ট নিরাপদ হতে হবে।

৪. রোবট দেখলেই বোঝা যেতে হবে, এটা রোবট। মানুষ বা যেকোনো আবেগপ্রবণ প্রাণীর সঙ্গে এর যথেষ্ট পার্থক্য থাকতে হবে, যাতে ব্যবহারকারীর মানসিক স্বাস্থ্যে কোনো ক্ষতিকর প্রভাব না পড়ে। (মানে, রোবটকে যেন প্রাণী মনে না হয় কোনোভাবেই। প্রাণী মনে হলে তার সঙ্গে যাচ্ছেতাই ব্যবহার চলে না, যা যন্ত্রের সঙ্গে করা যায়।)

৫. একটি রোবট বানানো বা ব্যবহারের সময় আইনিভাবে এর দায়িত্ব কার, তা স্পষ্ট থাকতে হবে।

এই সূত্রগুলো মানুষ বা বুদ্ধিমান প্রাণীর সঙ্গে রোবট বা যন্ত্রের পার্থক্য গড়ে দেয় এবং মানুষের নিরাপত্তা নিশ্চিত করে। অনেক দেশ লিখিত রোবট আইন প্রণয়নের কথা বললেও এখনো সে রকম কিছু করা হয়নি। রোবটশিল্পেও তাই লিখিতভাবে মেনে চলার মতো আইন তেমন একটা দেখা যায় না। কারণ, আসিমভ যে রকম ভেবেছেন, এখনো সে রকম বুদ্ধিমান রোবটের অস্তিত্ব নেই। তবে ওপরের নিয়মগুলো মোটামুটি মেনে চলা হয়, যাতে ব্যবহারকারীদের বা আশপাশের কাউকে কোনো সমস্যায় পড়তে না হয়।

পাঁচ

একটি রোবট বা কৃত্রিম বুদ্ধিমত্তা আসলেই বুদ্ধিমান কি না, সেটা আমরা বুঝব কীভাবে? এ জন্য বহুল প্রচলিত পদ্ধতিটির নাম টুরিং টেস্ট। কৃত্রিম বুদ্ধিমত্তা আর সত্যিকারের বুদ্ধিমত্তার সীমানা বেঁধে দেয় এই পরীক্ষা।

১৯৫০ সালে এআই নিয়ে অ্যালান টুরিং একটি গবেষণাপত্র প্রকাশ করেন, ‘কম্পিউটিং মেশিনারি অ্যান্ড ইন্টেলিজেন্স’। এখানেই উঠে আসে টুরিং টেস্টের কথা। এই টুরিং টেস্ট আধুনিক কৃত্রিম বুদ্ধিমত্তার মূল ভিত্তি। মুহম্মদ জাফর ইকবালের বিজ্ঞান কল্পকাহিনিতে টুরিং টেস্টের কথা অনেকবার এসেছে। আমরা যে ক্যাপচা দিই, ব্রাউজারে ‘আই অ্যাম নট আ রোবট’ সিলেক্ট করতে হয়, সেটাও আসলে একধরনের টুরিং টেস্ট।

টুরিং টেস্ট বোঝার জন্য একটা সহজ উদাহরণের কথা ভাবা যেতে পারে। ক, খ দুটি ভিন্ন ঘরে বসে আছে, কেউ কাউকে দেখতে পারছে না। গ একজন পরীক্ষক, যে টুরিং টেস্ট করছে। তার কাছে দুটি কাগজ আছে। কাগজ দুটিতে একই প্রশ্ন, হুবহু লেখা। দুটি ঘরে সে দুটি কাগজ ঢুকিয়ে দিলে ক, খ প্রশ্নগুলোর উত্তর দিল। এখন এই উত্তর পড়ে গ-কে বলতে পারতে হবে, ক ও খ—দুজনই মানুষ কি না, নাকি এর একটা যন্ত্র। ধরে নিই, আমাদের এই উদাহরণে ক একটি যন্ত্র, কিন্তু গ ক-এর উত্তর পড়ে সেটা ধরতে পারল না। তার মানে ক যন্ত্রটি টুরিং টেস্টে পাস করে গেছে। মানুষকে সে সফলভাবে অনুকরণ করতে পেরেছে। এমনটা যদি হয়, তাহলে বুঝতে হবে যন্ত্রটি নিজে নিজে চিন্তা করতে পারছে আসলেই। টুরিং যখন এই টেস্টের কথা বলেন, পুরো ব্যাপারটা শুনিয়েছিল কল্পগল্পের মতো। এখন আমরা জানি, এটা কল্পগল্প নয়। নিখাদ বাস্তব। ক্যাপচা তো আমরা প্রতিদিনই ব্যবহার করি। গুগল অ্যাসিস্ট্যান্ট বা সিরিও আছে আমাদের হাতের মুঠোয়। হয়তো আমাদের জীবদ্দশাতেই আমরা এ রকম যন্ত্রের দেখা পেয়ে যেতে পারি, যেটা সত্যিকার অর্থেই লেটার মার্কস পেয়ে পাস করে যাবে টুরিং টেস্টে।

একটা মজার তথ্য দিই। অ্যালান টুরিং নিজে এই টেস্টকে বলেছেন ইমিটেশন গেম, মানে অনুকরণের খেলা। অনেকেই নিশ্চয়ই জানেন, টুরিংকে নিয়ে একটি মুভি বানানো হয়েছে—দ্য ইমিটেশন গেম। এই চলচ্চিত্রে টুরিংয়ের চরিত্রে অভিনয় করেছেন বেনেডিক্ট কাম্বারব্যাচ। চমৎকার এই মুভির এ রকম নামকরণের কারণ আর কিছু নয়, টুরিং টেস্ট।

টুরিং টেস্টে পাশের নিয়ম হলো, অন্তত ৩০ শতাংশ নম্বর পেতে হবে কৃত্রিম বুদ্ধিমত্তাকে। আজ পর্যন্ত কোনো কৃত্রিম বুদ্ধিমত্তা এই টেস্টে সেভাবে পাস করেনি। এক-দুটি কৃত্রিম বুদ্ধিমত্তা এ রকম পাস করেছে, কিন্তু সেগুলোকে বলা যায় দুর্ঘটনা। যেমন ২০১৪ সালে ইউজিন গুস্তম্যান নামের একটি কৃত্রিম বুদ্ধিমত্তা এই পরীক্ষায় ৩৩ শতাংশ নম্বর পেয়েছে। ইউজিন গুস্তম্যান ১৩ বছরের একটি কিশোরের অনুকরণে তিনজন পরীক্ষকের সঙ্গে আলাপ চালিয়ে গেছে। তিনজনের একজন বুঝতে পারেননি, এটা কৃত্রিম বুদ্ধিমত্তা। কিন্তু এটাকে দুর্ঘটনা বলেই ধরা হয়। এর কারণও আছে। একে তো বিচারকের সংখ্যা মাত্র একজন, এর মধ্যে দুজনই বুঝে গেছেন এটি কৃত্রিম বুদ্ধিমত্তা। তার ওপর লোবনার প্রাইজ টেস্টে এটি সপ্তম হয়েছিল। এটি একটি বার্ষিক আদর্শ টুরিং টেস্ট। এই টেস্টে ইউজিনের আগের ছয়টি কৃত্রিম বুদ্ধিমত্তাও টুরিং টেস্টে পাস করতে পারেনি। কাজেই এটাকে দুর্ঘটনা না বলে উপায় নেই।

অবশ্য টুরিং টেস্ট বহুল প্রচলিত হলেও এটি যে কৃত্রিম বুদ্ধিমত্তার ব্যাপারে শেষ কথা বলার মতো নির্ভরযোগ্য, তা নয়। ২০০৮ সালে অক্সফোর্ড ইউনিভার্সিটির দর্শনবিদ্যার অধ্যাপক লুসিয়ানো ফ্লোরিডি ও তাঁর কয়েকজন শিক্ষার্থী ৯টি এ রকম পরীক্ষা করেন। তাঁরা এর মধ্যকার চারটি পরীক্ষায় যন্ত্রকে মানুষ বলে ভেবেছেন, আবার মানুষকে ভেবেছেন যন্ত্র। অর্থাৎ কোনো যন্ত্র টুরিং টেস্টে পাস করে গেলেই পৃথিবী এলোমেলো হয়ে যাবে বা মানুষের ওপর কৃত্রিম বুদ্ধিমত্তার শ্রেষ্ঠত্ব প্রতিষ্ঠিত হবে, এমনটা ভাবার কারণ নেই। তবে আজ পর্যন্ত এটিই যন্ত্র ও মানুষের বুদ্ধিমত্তার সীমারেখা নির্ধারণকারী সবচেয়ে প্রচলিত ও গ্রহণযোগ্য পরীক্ষা।

ছয়

কৃত্রিম বুদ্ধিমত্তায় ভর করে যন্ত্র কি আসলেই মানুষের জায়গা দখল করে নিতে পারবে বা প্রতিষ্ঠা করতে পারবে নিজের শ্রেষ্ঠত্ব? এখন হয়তো নেই কিন্তু ভবিষ্যতে কি এ রকম হওয়া সম্ভব?

একটু চিন্তা করলেই বোঝা যাবে, বর্তমান বিজ্ঞান ও প্রযুক্তির জ্ঞান অনুসারে এটি সম্ভব নয়। একটা স্বয়ংক্রিয় রোবটকে গাড়ি চালাতে শেখানো বা রোবট চিকিৎসককে অপারেশন করতে শেখানো খানিকটা সার্কাসের প্রাণীকে প্রশিক্ষণ দেওয়ার মতো। এর বাইরে গিয়ে সে আসলে কিছু করতে পারবে না। কাজেই মানুষের জায়গা দখল করা তো দূরের কথা, মানুষের সহযোগী বা বন্ধুও হতে পারবে না কোনো রোবট।

তবে স্বাভাবিকভাবেই স্বয়ংক্রিয় রোবট গাড়ি, রোবট চিকিৎসক, মানে বিভিন্ন ধরনের কৃত্রিম বুদ্ধিমত্তা চাকরি বা কর্মক্ষেত্রে বড় রকমের প্রভাব ফেলবে। বর্তমানে প্রচলিত অনেক কর্মক্ষেত্র চলে যাবে কৃত্রিম বুদ্ধিমত্তার দখলে। পিডব্লিউসি নামে একটি প্রতিষ্ঠান জানিয়েছে, স্বয়ংক্রিয়করণ, রোবটিকস ও কৃত্রিম বুদ্ধিমত্তার কারণে ২০৩০ সালে বিশ্বের ৮০ কোটি বর্তমান চাকরি নাই হয়ে যাবে। কিন্তু নতুন কর্মক্ষেত্র সৃষ্টি হবে প্রায় ১০০ কোটি! স্বাভাবিক। নতুন ধরনের কৃত্রিম বুদ্ধিমত্তার দেখভাল করা, তাকে প্রশিক্ষণ দেওয়া, কোথাও কোনো ভুল করছে কি না, সেসব দেখা—কাজ আসলে অনেক।

কৃত্রিম বুদ্ধিমত্তা বা চতুর্থ শিল্পবিপ্লবকে তাই সংকট ভাবার কিছু নেই। যন্ত্রের সীমানা পেরিয়ে জীবন হয়ে ওঠার দৌড়ে এখনো অনেক, অনেক দূরে কৃত্রিম বুদ্ধিমত্তা।

এটা সহজে বোঝা যাবে এখনকার স্টার্টআপ কোম্পানিগুলোর দিকে তাকালে। যুক্তরাষ্ট্রের সিলিকন ভ্যালির একটা ছোট স্টার্টআপ কোম্পানি যে পরিমাণ টাকা খরচ করছে তার কর্মীদের পেছনে, বাংলাদেশের ২০, ৩০ বা ৫০ বছর বয়সী কতটি প্রতিষ্ঠান সে পরিমাণ টাকা খরচ করতে পারে, খুঁজতে গেলে শার্লক হোমসকে লাগিয়েও কাজ হবে না সে রকম। বাংলাদেশেও এ রকম প্রতিষ্ঠান আছে। পাঠাও কাজ শুরু করেছে কয় বছর হলো? এর ব্যাপ্তি কিন্তু বিশাল। আপনাকে সে যে খাবার দেখাচ্ছে, যে ছাড়ের কুপন দিচ্ছে, এগুলোর পেছনে কাজ করছে কৃত্রিম বুদ্ধিমত্তা। আর সেই কৃত্রিম বুদ্ধিমত্তার দেখভাল করা, উন্নতির কাজে নিয়োজিত আছে বহু কর্মী।

স্বয়ংক্রিয়করণ, রোবটিকস, কৃত্রিম বুদ্ধিমত্তা, ইন্টারনেট অব থিংস (আইওটি)—এসবকে একসঙ্গে বলা হচ্ছে চতুর্থ শিল্পবিপ্লব। এটা এখন হচ্ছে, আমাদের চোখের সামনে। আর এর মেরুদণ্ড হলো এই কৃত্রিম বুদ্ধিমত্তা ও ডেটা সায়েন্স।

কৃত্রিম বুদ্ধিমত্তা প্রতিদিন আরও পরিণত হচ্ছে। এর কর্মক্ষেত্র বিস্তৃত হচ্ছে প্রতিমুহূর্তে। তবে এটা মানুষের জায়গা দখল করে নিতে পারবে না। কিন্তু মানুষকেও এর সঙ্গে পাল্লা দিতে হবে। নতুন কর্মক্ষেত্রে নিশ্চিত করতে হবে নিজের অবস্থান।

কৃত্রিম বুদ্ধিমত্তা বা চতুর্থ শিল্পবিপ্লবকে তাই সংকট ভাবার কিছু নেই। যন্ত্রের সীমানা পেরিয়ে জীবন হয়ে ওঠার দৌড়ে এখনো অনেক, অনেক দূরে কৃত্রিম বুদ্ধিমত্তা। এটি মানুষের সহকারী হয়ে আছে, তা-ই থাকবে। তবে এটি ইতিমধ্যেই হয়ে গেছে আমাদের জীবনের অনস্বীকার্য অংশ। ফেসবুক বা গুগলের দিকে তাকালেই এটা বোঝা যায়। ভবিষ্যতের সব পরিকল্পনা তাই করতে হবে একে কেন্দ্র করে, বাদ দিয়ে নয়।

