যেভাবে কাজ করে কৃত্রিম বুদ্ধিমত্তা

বর্তমান প্রযুক্তির দুনিয়ার জনপ্রিয় ধারার কিছু শব্দ রোবটিকস, কৃত্রিম বুদ্ধিমত্তা, মেশিন লার্নিং ও ডিপ লার্নিং। সঙ্গে যদি ডেটা সায়েন্স আর বিগ ডেটা যোগ করে দেওয়া যায়, তাহলে আধুনিক প্রযুক্তির ধাই ধাই করে এগিয়ে চলার বেশির ভাগটাই চলে আসে। প্রশ্ন হলো, প্রথম বাক্যে আমরা যে চারটা শব্দ বলেছি, এগুলো কি এক? যদি এ নিয়ে তেমন ভেবে না থাকেন, তাহলে একটুখানি থেমে চিন্তা করে নিতে পারেন প্রথম দুটি শব্দ নিয়ে। রোবটিকস আর কৃত্রিম বুদ্ধিমত্তা কি এক জিনিস, নাকি আলাদা কিছু?

সাসপেন্স তৈরি করার কিছু নেই। রোবটিকস আর কৃত্রিম বুদ্ধিমত্তা দুটি আলাদা বিষয়। কিন্তু অনেক ক্ষেত্রেই এ দুটো মিলেমিশে যায়। বাইরে থেকে দেখে তাই দুটিকে একই মনে হওয়া স্বাভাবিক।

রোবট মানে এমন কোনো যন্ত্র, যেটা প্রায় স্বয়ংক্রিয়ভাবে নির্দিষ্ট কোনো কাজ করতে পারে। সে জন্য তাকে প্রোগ্রাম করে দিতে হয়। রোবটের দেহ থাকে। দেহ মানে যান্ত্রিক অবকাঠামো। খুব যত্ন করে এর নকশা করা হয়। বৈদ্যুতিক শক্তি ব্যবহারের মাধ্যমে এই অবকাঠামোর কাজ করে। কাজ মানে, যা বলা থাকে, ঠিক ঠিক তা-ই করা। প্রকৌশলবিদ্যার যে শাখা এই রোবট বানানো নিয়ে কাজ করে, তাকে বলে রোবটিকস।

উদাহরণ দিই। ধরুন, আপনার বাসায় এমন একটা যন্ত্র আছে, যেটা চালু করে দিলে ঘরের মেঝেটা মুছে ফেলে। ঘরের একদিক থেকে সরলরেখায় মুছতে শুরু করে আর সামনে বাধা পেলে ১৮০ ডিগ্রি ঘুরে যায় ধীরে ধীরে। রোবটটাকে এমনভাবে প্রোগ্রাম করে দেওয়া হয়েছে যে ডান দিক থেকে ঘর মোছা শুরু করলে, বাঁয়ে দেয়াল না পাওয়া পর্যন্ত কাজ চালিয়ে যাবে। আবার বাঁ থেকে ঘর মোছা শুরু করলে, ডান দিকে দেয়াল না পাওয়া পর্যন্ত কাজ চালিয়ে যাবে। এই প্রোগ্রাম করা খুব সহজ। কম্পিউটার প্রোগ্রামিংয়ে ‘যদি…না হলে’ বলে একটা কথা আছে। প্রোগ্রাম যেহেতু ইংরেজিতে লেখা হয়, তাই কথাটাকে বলে ‘if…else’। ইফ মানে যদি, এলস মানে না হলে। যেমন ধরুন, আমাদের ঘর মোছার এই রোবটকে আমরা বলে দিয়েছি—

এখন সে আপনাকে ল্যাপটপ ছাড়া আর কী কী জিনিসের বিজ্ঞাপন দেখাতে পারে? এই যে সিদ্ধান্ত নিতে হবে, ফেসবুকের কৃত্রিম বুদ্ধিমত্তা তার বহুল পরীক্ষিত অ্যালগরিদম ব্যবহার করে সেই সিদ্ধান্তে পৌঁছাবে।

যদি তুমি ডান দিক থেকে কাজ শুরু করো, তাহলে (বাঁয়ে দেয়াল আছে কি না, দেখবে)

যদি থাকে—থেমে যাবে;

না হলে—১৮০ ডিগ্রি ঘুরে আবার সরলরেখায় মুছতে থাকবে।

সহজ ভাষায়, এই হলো আমাদের রোবট। (এখানে আমি কোনো প্রোগ্রামিং ভাষা ব্যবহার করিনি সরাসরি, তবে ইংরেজিতে বিষয়টা মোটামুটি এভাবেই লেখা হয়। আমি যেটা লিখেছি, সেটাকে স্যুডোকোড বা অতিসরলীকরণ করে অ্যালগরিদম বলা যায়।)

আরেকটি বিষয় হলো, আমরা যে বলেছি, রোবট প্রায় স্বয়ংক্রিয়, এই ‘প্রায়’ বলার কারণ, স্বয়ংক্রিয় নয়, এমন রোবটও আছে। যেমন টেলিরোবট। দূর থেকে এগুলোকে রিমোট কন্ট্রোলের মাধ্যমে নিয়ন্ত্রণ করা হয়। (রিমোট কন্ট্রোল মানেই কিন্তু দূরনিয়ন্ত্রণব্যবস্থা!)

আরও পড়ুন

দুই

এবার কৃত্রিম বুদ্ধিমত্তার কথায় আসা যাক। রোবটের সঙ্গে কৃত্রিম বুদ্ধিমত্তার সবচেয়ে বড় পার্থক্য, কৃত্রিম বুদ্ধিমত্তা বলতে বোঝানো হয় প্রোগ্রামকে। প্রোগ্রাম মানে কিছু কম্পিউটার কোড, কিছু অ্যালগরিদমের সমষ্টি। অ্যালগরিদম মানে, একটা কাজ ধাপে ধাপে কীভাবে করতে হবে, সেটা বলে দেওয়া। ওপরে আমরা এর একটা সহজ উদাহরণ দেখেছি। যা–ই হোক, আসল কথা হলো, কৃত্রিম বুদ্ধিমত্তার দৃশ্যমান কোনো দেহ বা অবকাঠামো থাকা বাধ্যতামূলক নয়।

আসলে কৃত্রিম বুদ্ধিমত্তা কম্পিউটারবিজ্ঞানের একটি শাখা। শিখে শিখে বা চিন্তাভাবনা করে সিদ্ধান্ত নেওয়া লাগে, এ রকম কাজের জন্য কম্পিউটার প্রোগ্রাম গড়ে তোলাই এই শাখার কাজ। ফেসবুক বা সামাজিক যোগাযোগমাধ্যমে কিংবা গুগলে আমরা যখন কিছু লিখে সার্চ দিই, তখন সংশ্লিষ্ট বিভিন্ন বিজ্ঞাপন গুগল ও ফেসবুক আমাদের দেখায়। এ জন্য ব্যবহৃত হয় কৃত্রিম বুদ্ধিমত্তা বা আর্টিফিশিয়াল ইন্টেলিজেন্স (এআই)। যেমন ধরুন, আপনি ল্যাপটপ লিখে ফেসবুকে সার্চ করলেন। এখন সে আপনাকে ল্যাপটপ ছাড়া আর কী কী জিনিসের বিজ্ঞাপন দেখাতে পারে? এই যে সিদ্ধান্ত নিতে হবে, ফেসবুকের কৃত্রিম বুদ্ধিমত্তা তার বহুল পরীক্ষিত অ্যালগরিদম ব্যবহার করে সেই সিদ্ধান্তে পৌঁছাবে। সে মেমোরিতে খুঁজে দেখবে, আগে যারা ল্যাপটপ কিনেছে, পরবর্তী সময়ে তারা কি–বোর্ড, এসএসডি কিংবা ওয়েবক্যাম বা ল্যাপটপের চার্জার ইত্যাদি জিনিস কিনেছে। তার মানে, আপনিও এই জিনিসগুলো কিনতে চাইতে পারেন। এই সম্ভাবনাকে সে কাজে লাগানোর চেষ্টা করে। এই জিনিসগুলোর বিজ্ঞাপন দেখিয়ে সে আপনাকে ফুসলাতে শুরু করবে। ফেসবুকে ঢুকলেই আপনি দেখতে পাবেন ওয়েবক্যাম বা কি-বোর্ডের বিজ্ঞাপন। কি-বোর্ড বিভিন্ন ধরনের হয়। মেমব্রেন কি-বোর্ড, মেকানিক্যাল কি-বোর্ড, অপটিক্যাল কি-বোর্ড ইত্যাদি। কৃত্রিম বুদ্ধিমত্তা আপনাকে কোন ধরনের কি-বোর্ডের বিজ্ঞাপন দেখাবে? ধরুন, দুই মাস আগে আপনি মেকানিক্যাল কি-বোর্ড সার্চ করেছেন। এই তথ্য ব্যবহার করে সে আপনাকে বেশির ভাগ বিজ্ঞাপন দেখাবে মেকানিক্যাল কি-বোর্ডের। অল্প কিছু অন্য ধরনের কি-বোর্ডের বিজ্ঞাপনও দেখাবে। (এই যে বিভিন্ন তথ্য প্রসেস করে, প্রয়োজনীয় তথ্য খুঁজে বের করে তা কাজে লাগাচ্ছে যন্ত্র, এর নাম ডেটা সায়েন্স বা তথ্য-উপাত্তবিজ্ঞান।)

কৃত্রিম বুদ্ধিমত্তা (এআই)
রয়টার্স

কৃত্রিম বুদ্ধিমত্তা যেন এভাবে নিজে নিজে শিখতে পারে এবং সঠিক সিদ্ধান্ত নিতে পারে, সে জন্য তাকে বলে দিতে হয়, কাজটা সে কীভাবে করবে। এই বলে দেওয়ার পদ্ধতিটার নামই অ্যালগরিদম। এটা আমরা ওপরে দেখেছি। এই অ্যালগরিদমকে প্রধানত দুই ভাগে ভাগ করা যেতে পারে।

প্রচলিত অ্যালগরিদমের ক্ষেত্রে, আমরা কম্পিউটার বা যন্ত্রকে বলে দিই, কাজটা কীভাবে করতে হবে। তারপর তাকে ইনপুট দিয়ে দিই। যন্ত্র তখন অ্যালগরিদমের ধাপগুলো মেনে, ধাপে ধাপে পুরো কাজটা শেষ করে আমাদের আউটপুট বা ফলাফলটা দেয়। কিন্তু কৃত্রিম বুদ্ধিমত্তাকে এভাবে কাজ করতে বললে সমস্যা। কারণ, ছোটখাটো অনেক অনেক বিষয় তখন তাকে বলে দিতে হবে। আর সে নিজে থেকে ঠিক সিদ্ধান্তে আসতে পারবে না। কারণ, কী হলে কী করতে হবে, এটা তাকে একদম ধাপে ধাপে বলে দেওয়া আছে। এ জন্য কৃত্রিম বুদ্ধিমত্তাকে শেখানোর জন্য বিশেষ ধরনের পদ্ধতি ব্যবহার করা হয়। এই পদ্ধতির নাম মেশিন লার্নিং।

অনেকেই মেশিন লার্নিং ও কৃত্রিম বুদ্ধিমত্তাকে এক করে ফেলেন। দুটি পুরোপুরি এক নয়। কৃত্রিম বুদ্ধিমত্তার একটি অংশ এই মেশিন লার্নিং। আবার মেশিন লার্নিং ডেটা সায়েন্সেরও একটি অংশ। (ডেটা সায়েন্স অবশ্য অনেক বিশাল একটি ক্ষেত্র। এ নিয়ে আমরা এখানে আলোচনা করব না। কারণ, ওদিকে গেলে কৃত্রিম বুদ্ধিমত্তা নিয়ে আর কথা বলে শেষ করা যাবে না।)

এটাই মেশিন লার্নিং অ্যালগরিদম। ইনপুট আর আউটপুটের সম্পর্ক হিসাব করে, মানে ছবির সঙ্গে বয়স মিলিয়ে মিলিয়ে কোন বয়সী ব্যক্তিদের চামড়ায় কতটা ভাঁজ পড়ে, কুঁচকে যায় ইত্যাদি বের করে নেওয়াটা হলো তার অভিজ্ঞতা।

মেশিন লার্নিং নামটা শুনেই বোঝা যায়, এটা যন্ত্রকে শেখানোর পদ্ধতি। অথবা যন্ত্রের শেখার পদ্ধতি। এ ক্ষেত্রে প্রোগ্রামার কোন পরিস্থিতিতে ঠিক কী করতে হবে, সেটা না বলে, কীভাবে করতে হবে, সেটা বলে দেয়। পাশাপাশি বেশ কিছু ইনপুট ও সেগুলোর আউটপুট বলে দেয়। যন্ত্র এই ইনপুট ও আউটপুটকে ব্যবহার করে অভিজ্ঞতা হিসেবে।

একটা সহজ উদাহরণ ভাবা যাক। আপনি যখন কারও চেহারার দিকে তাকান, তখন আন্দাজ করতে পারেন, তার বয়স কত। এই আন্দাজ আপনি কীভাবে করেন? করেন অভিজ্ঞতা থেকে। ২০ বছর বয়সী একজনের চেহারা দেখতে কেমন হবে, তা আপনি জানেন, আগে দেখেছেন। একইভাবে ৩০ বছর বয়সী, ৪০ বছর বয়সী বা আরও বয়স্ক মানুষের চেহারা আপনি দেখেছেন। এভাবে দেখতে দেখতে আপনার অভিজ্ঞতা হয়েছে। এখন অচেনা কারও চেহারার দিকে তাকালে সেই অভিজ্ঞতা থেকে আপনি আন্দাজ করতে পারেন, তার বয়স কত।

যন্ত্র এটা কীভাবে করবে? সাধারণ বা প্রচলিত পদ্ধতির প্রোগ্রামিং হলে যন্ত্রকে আপনার বলে দিতে হবে, পুরুষ হলে, মুখে দাড়ি থাকলে তাঁর বয়স হবে ১৮–এর বেশি। দেখতে হবে তাঁর চেহারায়, চামড়ায় কী পরিমাণ ভাঁজ আছে ইত্যাদি। কিন্তু এ রকম করে বলতে গেলে চামড়ায় কতটুকু ভাঁজের জন্য বয়স কত ধরে নিচ্ছেন, এই বিষয়টা বলে দিতে হবে যন্ত্রকে। এটা আমরা স্বাভাবিকভাবে দেখে অনেক নিখুঁতভাবে বুঝতে পারি না। এই সমস্যা সমাধানের জন্য তাই মেশিন লার্নিং কাজে লাগাতে পারি।

ধরুন, একটা যন্ত্রকে আমরা ১০ হাজার মানুষের চেহারার ছবি দিয়েছি। পাশাপাশি তাদের বয়স কত, সেটাও বলে দিয়েছি। এখানে ইনপুট হলো ছবি, আউটপুট হলো তাদের বয়স। তারপর বলে দিয়েছি, চামড়ার ভাঁজ, কুঁচকে যাওয়া, চোখের কোণে কালশিটে পড়ে যাওয়া ইত্যাদি বিষয় কোন বয়সীদের জন্য কী রকম, সেটা বের করো। যন্ত্র তখন ছবিগুলোকে প্রসেস করবে। খুঁটিয়ে দেখবে সবকিছু। কীভাবে করবে, মানে কী কী দেখবে, সেটা তাকে বলে দিয়েছি আমরা। এটাই মেশিন লার্নিং অ্যালগরিদম। ইনপুট আর আউটপুটের সম্পর্ক হিসাব করে, মানে ছবির সঙ্গে বয়স মিলিয়ে মিলিয়ে কোন বয়সী ব্যক্তিদের চামড়ায় কতটা ভাঁজ পড়ে, কুঁচকে যায় ইত্যাদি বের করে নেওয়াটা হলো তার অভিজ্ঞতা। এখন নতুন কারও ছবি যদি ইনপুট দিয়ে বয়স জিজ্ঞাসা করি, সে আগের অভিজ্ঞতা ব্যবহার করে আউটপুট দেবে, মানে বয়সটা বলে দেবে। কতটা নিখুঁতভাবে এই কৃত্রিম বুদ্ধিমত্তা বয়স বলতে পারছে, সেটা দেখা হয়। এটা হলো তার এফিশিয়েন্সি বা কার্যদক্ষতা। আর কতটা ভুল করছে, তা হলো এরর। ১০০টা এ রকম নতুন ছবি দিলে যদি দেখা যায়, ৯০ জনের ছবি থেকে সে বয়সটা নিখুঁতভাবে বের করতে পারছে, তাহলে এর এফিশিয়েন্সি ৯০ শতাংশ, এরর ১০ শতাংশ। অভিজ্ঞতা অর্জনের জন্য বা শেখার জন্য এই কৃত্রিম বুদ্ধিমত্তাকে যত বেশি ছবি দেব, তার শেখা তত ভালো হবে। মানে এফিশিয়েন্সি তত বাড়বে। ১০ হাজারের জায়গায় ১ লাখ দিলে তার অভিজ্ঞতা অনেকটা বাড়বে। আর শেখার জন্য যদি মাত্র ১ হাজার ছবি দিই, তার অভিজ্ঞতা হবে অনেক কম।

গুগলের কৃত্রিম বুদ্ধিমত্তার কাছে সারা পৃথিবীর প্রায় সব মানুষের চেহারার তথ্য আছে। আমরা গুগল ড্রাইভে বা ফটোসে যেসব ছবি রাখি, এগুলো থেকে সে শেখে। এ জন্য যেকোনো ছবি দেখলেই সে বলতে পারে, এটা কার ছবি। ফেসবুকেও এটা দেখা যায়। অচেনা কেউ আপনার ছবি আপলোড করলেও ফেসবুক নোটিফিকেশন দেয়, আপনার একটা ছবি হয়তো অমুক আপলোড করেছে। দেখুন তো এটা আপনার ছবি কি না?

কৃত্রিম বুদ্ধিমত্তার ব্যবহার এখন সব জায়গায় হচ্ছে। ফেসবুক বা গুগলের সার্চ অ্যালগরিদম বা বিজ্ঞাপন দেখানো থেকে শুরু করে ব্যবসা-বাণিজ্য, চিকিৎসাবিজ্ঞান কিংবা দাবা খেলার মতো জটিল সব বিষয়েও এর ব্যবহার হচ্ছে নিয়মিত। আবহাওয়া নির্ণয়ের জন্যও এখন ব্যবহৃত হচ্ছে কৃত্রিম বুদ্ধিমত্তা। আকাশের অবস্থা, মেঘের অবস্থা, ঘূর্ণিবায়ু আছে কি না, কতটা আছে, আর্দ্রতা কত, তাপমাত্রা ইত্যাদি দেখে অ্যালগরিদম ও অভিজ্ঞতা থেকে কৃত্রিম বুদ্ধিমত্তা বের করে ফেলতে পারছে, কোথাও ঝড়-বৃষ্টি হবে কি না।

মেশিন লার্নিংয়ের আবার বিভিন্ন ভাগ আছে। আমরা অতটা গভীরে যাব না। তবে এখানে আমরা ডিপ লার্নিংটা কী, সেটা একটু বুঝতে চেষ্টা করব। মেশিন লার্নিংয়ের একটা অংশ এই ডিপ লার্নিং। এ ক্ষেত্রে যে বিশেষ ধরনের অ্যালগরিদম ব্যবহার করা হয় তথ্য প্রসেস করার জন্য, সেটাই পার্থক্য গড়ে দেয়। এই অ্যালগরিদম একধরনের নেটওয়ার্ক গড়ে তোলে। এই নেটওয়ার্কের জন্য ডিপ লার্নিং অনেক জটিল কাজ করতে পারে, কোথাও ভুল হলে বুঝতে পারে নিজে নিজেই। ব্যবহৃত নেটওয়ার্কটি বিজ্ঞান কল্পগল্পের কল্যাণে আমাদের বহুল পরিচিত—নিউরাল নেটওয়ার্ক।

মুহম্মদ জাফর ইকবালের একটি বিজ্ঞান কল্পকাহিনি আছে। প্রডিজি। এই বইয়ে দেখানো হয়েছে, সত্যি সত্যি মানবমস্তিষ্ক ব্যবহার করা হচ্ছে নিউরাল নেটওয়ার্ক হিসেবে। পড়ে আমি মোটামুটি বিশ্বাস করে ফেলেছিলাম, নিউরাল নেটওয়ার্ক মানেই বুঝি মানুষের মস্তিষ্ককে ব্যবহার করে গড়ে তোলা নেটওয়ার্ক। আসলে তা নয়।

আরও পড়ুন

মানুষের মস্তিষ্কে এক হাজার কোটি স্নায়ুকোষ বা নিউরন একে অন্যের সঙ্গে জটিল এক সম্পর্কের জালে যুক্ত থাকে। একে বলে জৈবিক নিউরাল নেটওয়ার্ক। আমরা এখানে কথা বলছি কৃত্রিম নিউরাল নেটওয়ার্ক নিয়ে। এর মানে, অনেক অনেক নোড এখানে একে অন্যের সঙ্গে যুক্ত আছে। নোড মানে নেটওয়ার্কের একেকটি জয়েন্ট বা একেকটি বিন্দু। (নিচের ছবিটি দেখুন) এটা মানুষের মস্তিষ্ক যেভাবে সিদ্ধান্তে পৌঁছায়, সেভাবেই তথ্য প্রসেস করে সিদ্ধান্তে পৌঁছাতে চেষ্টা করে। বলে রাখা প্রয়োজন, যে কৃত্রিম নিউরাল নেটওয়ার্ক ডিপ লার্নিং অ্যালগরিদমের মাধ্যমে গড়ে ওঠে, তা আসলে সত্যিকারের কোনো নেটওয়ার্ক না। ভার্চ্যুয়াল নেটওয়ার্ক। এর কোনো দৃশ্যমান গঠন নেই। শুধু অ্যালগরিদমটা নেটওয়ার্কের মতো কাজ করে। একই মুহূর্তে বিভিন্ন নোডে বিভিন্ন ধরনের কাজ হচ্ছে, ভুল হচ্ছে কি না, সেটা বের করার চেষ্টা চলছে, আবার কাজ এগিয়েও যাচ্ছে। এভাবে ধীরে ধীরে এটি একটি সিদ্ধান্তে পৌঁছায়। ভুল হলে মেশিন লার্নিং অ্যালগরিদমে সাধারণত কোনো মানুষকে ঠিক করে দিতে হয় বা নতুন তথ্য দিতে হয়। ডিপ লার্নিং অ্যালগরিদম নিউরাল নেটওয়ার্ক ব্যবহার করায় এটা বেশির ভাগ ক্ষেত্রে নিজেই ভুল সংশোধন করে নিতে পারে।

এআই
ছবি: রয়টার্স

আরেকটি গুরুত্বপূর্ণ বিষয় হলো, নাম নিউরাল নেটওয়ার্ক হলেও ভার্চ্যুয়াল এই নেটওয়ার্কের কোনো অনুভূতি বা চেতনা নেই। এটা পুরোপুরি বিজ্ঞান কল্পগল্পের অংশ, লেখকেরা গল্পের প্রয়োজনে লিখতে পছন্দ করেন। বাস্তবে এ রকম কিছু এখনো হয়নি। বিষয়গুলো কী, কীভাবে কাজ করে, এটা আমরা মোটামুটি বুঝলাম। রোবট মানে যান্ত্রিক অবকাঠামো, যেটা স্বয়ংক্রিয়ভাবে কোনো নির্দিষ্ট কাজ করতে পারে। আর কৃত্রিম বুদ্ধিমত্তা হলো শিখে শিখে বা চিন্তাভাবনা করে সিদ্ধান্ত নেওয়া লাগে, এ রকম কাজের জন্য গড়ে তোলা কম্পিউটার প্রোগ্রাম। কৃত্রিম বুদ্ধিমত্তাকে সরাসরি প্রোগ্রামিং করে দেওয়া যায়, আবার মেশিন লার্নিংয়ের মাধ্যমেও শেখানো যায়। কৃত্রিম বুদ্ধিমত্তার সঙ্গে রোবটের পার্থক্য তো দেখলাম, কিন্তু এগুলো কি পুরোপুরি ভিন্ন জিনিস? এগুলোকে তাহলে একই জিনিস বলে মনে করে কেন অনেকে? উত্তরটা আমরা আগেই দেখেছি, এগুলো অনেক ক্ষেত্রেই মিলেমিশে যায়। কীভাবে?

তিন

অনেক জটিল কোনো কাজের জন্য আমাদের যদি কোনো রোবট ডিজাইন করতে হয়, তাহলে সেটাকে শুধু প্রোগ্রামিং করে দিলে কী হবে? ধরুন, আপনি মস্তিষ্কের জটিল কোনো অপারেশনের জন্য রোবট বানাতে চাচ্ছেন। এই রোবটকে মুহূর্তের মধ্যে জটিল সব সিদ্ধান্ত নিতে হবে। এ রকম ক্ষেত্রে সাধারণত রোবটের মধ্যে কৃত্রিম বুদ্ধিমত্তা ব্যবহার করা হয়। আর তাকে শেখানোর জন্য ব্যবহার করা হয় মেশিন লার্নিং।

যেমন, এক কোটি মস্তিষ্ক অপারেশনের ভিডিও রোবটটিকে দেওয়া হলো। কোন অপারেশনগুলো সফল হয়েছে, কোনগুলো ব্যর্থ হয়েছে, তা–ও বলে দেওয়া হলো। রোবটের কৃত্রিম বুদ্ধিমত্তা খুঁটিয়ে দেখবে, ব্যর্থ অপারেশনগুলোতে সমস্যা কী হয়েছিল। সফলগুলোতে কোন পরিস্থিতিতে চিকিৎসক কী করেছেন। ১ কোটি বা ১০ কোটি অপারেশনের তথ্য বিশ্লেষণ করে কৃত্রিম বুদ্ধিমত্তাসম্পন্ন একটি রোবট নিঃসন্দেহে যেকোনো ভালো মানব চিকিৎসকের চেয়ে সফল ও নিখুঁতভাবে অপারেশনটি করতে পারবে। এখানেই কৃত্রিম বুদ্ধিমত্তার সাফল্য।

এ রকম আরেকটি বাস্তব উদাহরণ হলো টেসলার ইলেকট্রিক কার। এটি স্বয়ংক্রিয়ভাবে চলে। এ জন্য এটা ব্যবহার করে কৃত্রিম বুদ্ধিমত্তা। টেসলা এই কৃত্রিম বুদ্ধিমত্তাকে মেশিন লার্নিং ব্যবহার করে প্রশিক্ষণ দিয়েছে। গাড়ি চালানো কিন্তু জটিল একটা কাজ। কতটুকু দূরে, কত গতিবেগে একটা গাড়িকে চলতে দেখলে দুর্ঘটনা ঘটার আশঙ্কা আছে বলে বুঝতে হবে, ব্রেক কষতে হবে, রাস্তার বাঁক আসলে ঘুরতে হবে, ট্রাফিক বাতি দেখে থামতে বা চলতে হবে ইত্যাদি সবই টেসলার এই গাড়ির কৃত্রিম বুদ্ধিমত্তা বুঝতে পারে। তার সেই অভিজ্ঞতা আছে। এই গাড়ির কৃত্রিম বুদ্ধিমত্তার হাতে চালানোর দায়িত্ব দিয়ে আপনি নিশ্চিন্তে ঘুমাতে পারবেন! (যদিও, এখনই সেটা সম্ভব নয়। কৃত্রিম বুদ্ধিমত্তার হাতে চালানোর দায়িত্ব দিয়ে ঘুমিয়ে পড়া আইনত অবৈধ। আপাতত তাই জেগে থাকতে হবে। কারণ, পুরোপুরি নিয়ন্ত্রণ নেওয়ার জন্য গাড়িটিকে আরও শিখতে হবে, আরও অভিজ্ঞতা অর্জন করতে হবে।)

এসব সমস্যা সমাধানের জন্য বিকল্প ভাবা হয়েছে। বর্তমানে এ জন্য যুক্তরাজ্যের ইঞ্জিনিয়ারিং অ্যান্ড ফিজিক্যাল সায়েন্সেস রিসার্চ কাউন্সিল (ইপিএসআরসি) ও আর্টস অ্যান্ড হিউম্যানিটিস রিসার্চ কাউন্সিলের (এএইচআরসি) নির্ধারিত পাঁচটি নিয়ম অনুসরণ করা হয়।

এই গাড়িও কিন্তু একটি রোবট। কৃত্রিম বুদ্ধিমত্তাসম্পন্ন রোবট। কৃত্রিম বুদ্ধিমত্তাবিশিষ্ট রোবট গাড়ি শুনলেই ট্রান্সফরমার্স মনে করার কোনো কারণ নেই। রোবট মানে যে যন্ত্র নির্দিষ্ট কাজ করতে পারে। এই গাড়ি যেহেতু নিরাপদে চলতে পারে, যাত্রীকে গন্তব্যে পৌঁছে দিতে পারে, তাই এটাও একটা রোবট।

এখানেই চলে আসে কল্পবিজ্ঞান লেখকদের কল্পনা বনাম বাস্তবতা। কোনো রোবট গাড়ি যদি তার যাত্রীকে মেরে ফেলতে চায়? কিংবা এটা যদি সামনে চলে আসা কোনো পথচারীর ওপর গাড়ি তুলে দেয়? সত্যি বলতে, এখনো এ রকম কোনো রোবট বা কৃত্রিম বুদ্ধিমত্তা বাস্তবে নেই, যেটা এ রকম কিছু করে বসতে পারে। কারণ, এখন পর্যন্ত কোনো রোবট বা কৃত্রিম বুদ্ধিমত্তা নিজে চিন্তা করতে পারে না। তবু এ নিয়ে মানুষ চিন্তাভাবনা কম করেনি। কারণ, রোবট ও কৃত্রিম বুদ্ধিমত্তা এখন আর বিজ্ঞান কল্পগল্পের অংশ নয়, নিখাদ বাস্তব।

চার

১৯৪২ সালে আইজ্যাক আসিমভ রোবটরা যেন মানুষের ক্ষতি করতে না পারে, সে জন্য তিনটি সূত্র লিখেছিলেন। এই সূত্রগুলো তিনি লিখেছেন একটি ছোটগল্পে। নাম রানঅ্যারাউন্ড। সূত্রগুলো ‘থ্রি লজ অব রোবটিকস’ নামে বিখ্যাত। সূত্র তিনটি হলো—

১. কোনো রোবট জেনেবুঝে মানুষের ক্ষতি করতে পারবে না এবং মানুষের ক্ষতি হতে দেখলে নিষ্ক্রিয় থাকতে পারবে না, থামাতে চেষ্টা করবে।

২. প্রথম সূত্রের সঙ্গে সাংঘর্ষিক না হলে, মানুষের দেওয়া যেকোনো নির্দেশ রোবটকে মানতে হবে।

৩. প্রথম ও দ্বিতীয় সূত্রের সঙ্গে সাংঘর্ষিক না হলে রোবট নিজের অস্তিত্ব রক্ষার জন্য যেকোনো কিছু করতে পারবে।

এই সূত্রগুলো অনেক বিখ্যাত হলেও ঠিক কার্যকর নয়। যেমন, কোনো রোবট হয়তো জানেই না, সে যে খাবার একজন মানুষকে খেতে দিচ্ছে, সেটা বিষাক্ত। অথবা ওপরের গাড়ির কথা ভাবলে, স্বয়ংক্রিয় একটা গাড়ি যদি দেখে, সামনে তিনজন হঠাৎ চলে এসেছে। পাহাড়ি রাস্তা। গাড়িতেও তিনজন বসে আছে। রোবট গাড়িটা সাইড করতে গেলে নিচে পড়ে যাবে। তখন গাড়ির ভেতরের সবাই মারা যেতে পারে। আর সামনের মানুষের ওপর গাড়ি তুলে দিলে তারা মারা যেতে পারে। রোবট গাড়িটা এখন কী করবে? এ ধরনের বিভিন্ন সমস্যার সমাধান আসিমভের সূত্রগুলো দিতে পারে না। তা ছাড়া দ্বিতীয় সূত্রটি দিয়ে রোবটকে সরাসরি মানুষের দাস বানিয়ে দেওয়া হয়। যদিও ‘রোবট’ শব্দটি এসেছেই দাসত্ব থেকে। পূর্ব ইউরোপের স্লাভোনিক ভাষায় ‘রোবোটা’ শব্দের অর্থ দাসত্ব। সেখান থেকেই এসেছে রোবট, যার বাংলা হলো যন্ত্র-দাস।

এসব সমস্যা সমাধানের জন্য বিকল্প ভাবা হয়েছে। বর্তমানে এ জন্য যুক্তরাজ্যের ইঞ্জিনিয়ারিং অ্যান্ড ফিজিক্যাল সায়েন্সেস রিসার্চ কাউন্সিল (ইপিএসআরসি) ও আর্টস অ্যান্ড হিউম্যানিটিস রিসার্চ কাউন্সিলের (এএইচআরসি) নির্ধারিত পাঁচটি নিয়ম অনুসরণ করা হয়। এই নিয়মগুলো উঠে এসেছে আসিমভের সূত্রগুলো থেকেই, কিন্তু এগুলো আরও বেশি বাস্তব। নিয়মগুলো হলো—

১. জাতীয় নিরাপত্তার প্রয়োজন ছাড়া কোনো রোবটিক অস্ত্র বানানো যাবে না।

২. বর্তমান সব আইন ও মানবাধিকার আইন রোবটকে মেনে চলতে হবে। ব্যক্তিগত তথ্যের গোপনীয়তাবিষয়ক আইনও এর অন্তর্ভুক্ত।

৩. অন্যান্য পণ্যের মতোই ব্যবহারকারী ব্যক্তির জন্য রোবটকে যথেষ্ট নিরাপদ হতে হবে।

৪. রোবট দেখলেই বোঝা যেতে হবে, এটা রোবট। মানুষ বা যেকোনো আবেগপ্রবণ প্রাণীর সঙ্গে এর যথেষ্ট পার্থক্য থাকতে হবে, যাতে ব্যবহারকারীর মানসিক স্বাস্থ্যে কোনো ক্ষতিকর প্রভাব না পড়ে। (মানে, রোবটকে যেন প্রাণী মনে না হয় কোনোভাবেই। প্রাণী মনে হলে তার সঙ্গে যাচ্ছেতাই ব্যবহার চলে না, যা যন্ত্রের সঙ্গে করা যায়।)

৫. একটি রোবট বানানো বা ব্যবহারের সময় আইনিভাবে এর দায়িত্ব কার, তা স্পষ্ট থাকতে হবে।

এই সূত্রগুলো মানুষ বা বুদ্ধিমান প্রাণীর সঙ্গে রোবট বা যন্ত্রের পার্থক্য গড়ে দেয় এবং মানুষের নিরাপত্তা নিশ্চিত করে। অনেক দেশ লিখিত রোবট আইন প্রণয়নের কথা বললেও এখনো সে রকম কিছু করা হয়নি। রোবটশিল্পেও তাই লিখিতভাবে মেনে চলার মতো আইন তেমন একটা দেখা যায় না। কারণ, আসিমভ যে রকম ভেবেছেন, এখনো সে রকম বুদ্ধিমান রোবটের অস্তিত্ব নেই। তবে ওপরের নিয়মগুলো মোটামুটি মেনে চলা হয়, যাতে ব্যবহারকারীদের বা আশপাশের কাউকে কোনো সমস্যায় পড়তে না হয়।

পাঁচ

একটি রোবট বা কৃত্রিম বুদ্ধিমত্তা আসলেই বুদ্ধিমান কি না, সেটা আমরা বুঝব কীভাবে? এ জন্য বহুল প্রচলিত পদ্ধতিটির নাম টুরিং টেস্ট। কৃত্রিম বুদ্ধিমত্তা আর সত্যিকারের বুদ্ধিমত্তার সীমানা বেঁধে দেয় এই পরীক্ষা।

১৯৫০ সালে এআই নিয়ে অ্যালান টুরিং একটি গবেষণাপত্র প্রকাশ করেন, ‘কম্পিউটিং মেশিনারি অ্যান্ড ইন্টেলিজেন্স’। এখানেই উঠে আসে টুরিং টেস্টের কথা। এই টুরিং টেস্ট আধুনিক কৃত্রিম বুদ্ধিমত্তার মূল ভিত্তি। মুহম্মদ জাফর ইকবালের বিজ্ঞান কল্পকাহিনিতে টুরিং টেস্টের কথা অনেকবার এসেছে। আমরা যে ক্যাপচা দিই, ব্রাউজারে ‘আই অ্যাম নট আ রোবট’ সিলেক্ট করতে হয়, সেটাও আসলে একধরনের টুরিং টেস্ট।

টুরিং টেস্ট বোঝার জন্য একটা সহজ উদাহরণের কথা ভাবা যেতে পারে। ক, খ দুটি ভিন্ন ঘরে বসে আছে, কেউ কাউকে দেখতে পারছে না। গ একজন পরীক্ষক, যে টুরিং টেস্ট করছে। তার কাছে দুটি কাগজ আছে। কাগজ দুটিতে একই প্রশ্ন, হুবহু লেখা। দুটি ঘরে সে দুটি কাগজ ঢুকিয়ে দিলে ক, খ প্রশ্নগুলোর উত্তর দিল। এখন এই উত্তর পড়ে গ-কে বলতে পারতে হবে, ক ও খ—দুজনই মানুষ কি না, নাকি এর একটা যন্ত্র। ধরে নিই, আমাদের এই উদাহরণে ক একটি যন্ত্র, কিন্তু গ ক-এর উত্তর পড়ে সেটা ধরতে পারল না। তার মানে ক যন্ত্রটি টুরিং টেস্টে পাস করে গেছে। মানুষকে সে সফলভাবে অনুকরণ করতে পেরেছে। এমনটা যদি হয়, তাহলে বুঝতে হবে যন্ত্রটি নিজে নিজে চিন্তা করতে পারছে আসলেই। টুরিং যখন এই টেস্টের কথা বলেন, পুরো ব্যাপারটা শুনিয়েছিল কল্পগল্পের মতো। এখন আমরা জানি, এটা কল্পগল্প নয়। নিখাদ বাস্তব। ক্যাপচা তো আমরা প্রতিদিনই ব্যবহার করি। গুগল অ্যাসিস্ট্যান্ট বা সিরিও আছে আমাদের হাতের মুঠোয়। হয়তো আমাদের জীবদ্দশাতেই আমরা এ রকম যন্ত্রের দেখা পেয়ে যেতে পারি, যেটা সত্যিকার অর্থেই লেটার মার্কস পেয়ে পাস করে যাবে টুরিং টেস্টে।

একটা মজার তথ্য দিই। অ্যালান টুরিং নিজে এই টেস্টকে বলেছেন ইমিটেশন গেম, মানে অনুকরণের খেলা। অনেকেই নিশ্চয়ই জানেন, টুরিংকে নিয়ে একটি মুভি বানানো হয়েছে—দ্য ইমিটেশন গেম। এই চলচ্চিত্রে টুরিংয়ের চরিত্রে অভিনয় করেছেন বেনেডিক্ট কাম্বারব্যাচ। চমৎকার এই মুভির এ রকম নামকরণের কারণ আর কিছু নয়, টুরিং টেস্ট।

আরও পড়ুন

টুরিং টেস্টে পাশের নিয়ম হলো, অন্তত ৩০ শতাংশ নম্বর পেতে হবে কৃত্রিম বুদ্ধিমত্তাকে। আজ পর্যন্ত কোনো কৃত্রিম বুদ্ধিমত্তা এই টেস্টে সেভাবে পাস করেনি। এক-দুটি কৃত্রিম বুদ্ধিমত্তা এ রকম পাস করেছে, কিন্তু সেগুলোকে বলা যায় দুর্ঘটনা। যেমন ২০১৪ সালে ইউজিন গুস্তম্যান নামের একটি কৃত্রিম বুদ্ধিমত্তা এই পরীক্ষায় ৩৩ শতাংশ নম্বর পেয়েছে। ইউজিন গুস্তম্যান ১৩ বছরের একটি কিশোরের অনুকরণে তিনজন পরীক্ষকের সঙ্গে আলাপ চালিয়ে গেছে। তিনজনের একজন বুঝতে পারেননি, এটা কৃত্রিম বুদ্ধিমত্তা। কিন্তু এটাকে দুর্ঘটনা বলেই ধরা হয়। এর কারণও আছে। একে তো বিচারকের সংখ্যা মাত্র একজন, এর মধ্যে দুজনই বুঝে গেছেন এটি কৃত্রিম বুদ্ধিমত্তা। তার ওপর লোবনার প্রাইজ টেস্টে এটি সপ্তম হয়েছিল। এটি একটি বার্ষিক আদর্শ টুরিং টেস্ট। এই টেস্টে ইউজিনের আগের ছয়টি কৃত্রিম বুদ্ধিমত্তাও টুরিং টেস্টে পাস করতে পারেনি। কাজেই এটাকে দুর্ঘটনা না বলে উপায় নেই।

অবশ্য টুরিং টেস্ট বহুল প্রচলিত হলেও এটি যে কৃত্রিম বুদ্ধিমত্তার ব্যাপারে শেষ কথা বলার মতো নির্ভরযোগ্য, তা নয়। ২০০৮ সালে অক্সফোর্ড ইউনিভার্সিটির দর্শনবিদ্যার অধ্যাপক লুসিয়ানো ফ্লোরিডি ও তাঁর কয়েকজন শিক্ষার্থী ৯টি এ রকম পরীক্ষা করেন। তাঁরা এর মধ্যকার চারটি পরীক্ষায় যন্ত্রকে মানুষ বলে ভেবেছেন, আবার মানুষকে ভেবেছেন যন্ত্র। অর্থাৎ কোনো যন্ত্র টুরিং টেস্টে পাস করে গেলেই পৃথিবী এলোমেলো হয়ে যাবে বা মানুষের ওপর কৃত্রিম বুদ্ধিমত্তার শ্রেষ্ঠত্ব প্রতিষ্ঠিত হবে, এমনটা ভাবার কারণ নেই। তবে আজ পর্যন্ত এটিই যন্ত্র ও মানুষের বুদ্ধিমত্তার সীমারেখা নির্ধারণকারী সবচেয়ে প্রচলিত ও গ্রহণযোগ্য পরীক্ষা।

ছয়

কৃত্রিম বুদ্ধিমত্তায় ভর করে যন্ত্র কি আসলেই মানুষের জায়গা দখল করে নিতে পারবে বা প্রতিষ্ঠা করতে পারবে নিজের শ্রেষ্ঠত্ব? এখন হয়তো নেই কিন্তু ভবিষ্যতে কি এ রকম হওয়া সম্ভব?

একটু চিন্তা করলেই বোঝা যাবে, বর্তমান বিজ্ঞান ও প্রযুক্তির জ্ঞান অনুসারে এটি সম্ভব নয়। একটা স্বয়ংক্রিয় রোবটকে গাড়ি চালাতে শেখানো বা রোবট চিকিৎসককে অপারেশন করতে শেখানো খানিকটা সার্কাসের প্রাণীকে প্রশিক্ষণ দেওয়ার মতো। এর বাইরে গিয়ে সে আসলে কিছু করতে পারবে না। কাজেই মানুষের জায়গা দখল করা তো দূরের কথা, মানুষের সহযোগী বা বন্ধুও হতে পারবে না কোনো রোবট।

তবে স্বাভাবিকভাবেই স্বয়ংক্রিয় রোবট গাড়ি, রোবট চিকিৎসক, মানে বিভিন্ন ধরনের কৃত্রিম বুদ্ধিমত্তা চাকরি বা কর্মক্ষেত্রে বড় রকমের প্রভাব ফেলবে। বর্তমানে প্রচলিত অনেক কর্মক্ষেত্র চলে যাবে কৃত্রিম বুদ্ধিমত্তার দখলে। পিডব্লিউসি নামে একটি প্রতিষ্ঠান জানিয়েছে, স্বয়ংক্রিয়করণ, রোবটিকস ও কৃত্রিম বুদ্ধিমত্তার কারণে ২০৩০ সালে বিশ্বের ৮০ কোটি বর্তমান চাকরি নাই হয়ে যাবে। কিন্তু নতুন কর্মক্ষেত্র সৃষ্টি হবে প্রায় ১০০ কোটি! স্বাভাবিক। নতুন ধরনের কৃত্রিম বুদ্ধিমত্তার দেখভাল করা, তাকে প্রশিক্ষণ দেওয়া, কোথাও কোনো ভুল করছে কি না, সেসব দেখা—কাজ আসলে অনেক।

কৃত্রিম বুদ্ধিমত্তা বা চতুর্থ শিল্পবিপ্লবকে তাই সংকট ভাবার কিছু নেই। যন্ত্রের সীমানা পেরিয়ে জীবন হয়ে ওঠার দৌড়ে এখনো অনেক, অনেক দূরে কৃত্রিম বুদ্ধিমত্তা।

এটা সহজে বোঝা যাবে এখনকার স্টার্টআপ কোম্পানিগুলোর দিকে তাকালে। যুক্তরাষ্ট্রের সিলিকন ভ্যালির একটা ছোট স্টার্টআপ কোম্পানি যে পরিমাণ টাকা খরচ করছে তার কর্মীদের পেছনে, বাংলাদেশের ২০, ৩০ বা ৫০ বছর বয়সী কতটি প্রতিষ্ঠান সে পরিমাণ টাকা খরচ করতে পারে, খুঁজতে গেলে শার্লক হোমসকে লাগিয়েও কাজ হবে না সে রকম। বাংলাদেশেও এ রকম প্রতিষ্ঠান আছে। পাঠাও কাজ শুরু করেছে কয় বছর হলো? এর ব্যাপ্তি কিন্তু বিশাল। আপনাকে সে যে খাবার দেখাচ্ছে, যে ছাড়ের কুপন দিচ্ছে, এগুলোর পেছনে কাজ করছে কৃত্রিম বুদ্ধিমত্তা। আর সেই কৃত্রিম বুদ্ধিমত্তার দেখভাল করা, উন্নতির কাজে নিয়োজিত আছে বহু কর্মী।

স্বয়ংক্রিয়করণ, রোবটিকস, কৃত্রিম বুদ্ধিমত্তা, ইন্টারনেট অব থিংস (আইওটি)—এসবকে একসঙ্গে বলা হচ্ছে চতুর্থ শিল্পবিপ্লব। এটা এখন হচ্ছে, আমাদের চোখের সামনে। আর এর মেরুদণ্ড হলো এই কৃত্রিম বুদ্ধিমত্তা ও ডেটা সায়েন্স।

কৃত্রিম বুদ্ধিমত্তা প্রতিদিন আরও পরিণত হচ্ছে। এর কর্মক্ষেত্র বিস্তৃত হচ্ছে প্রতিমুহূর্তে। তবে এটা মানুষের জায়গা দখল করে নিতে পারবে না। কিন্তু মানুষকেও এর সঙ্গে পাল্লা দিতে হবে। নতুন কর্মক্ষেত্রে নিশ্চিত করতে হবে নিজের অবস্থান।

কৃত্রিম বুদ্ধিমত্তা বা চতুর্থ শিল্পবিপ্লবকে তাই সংকট ভাবার কিছু নেই। যন্ত্রের সীমানা পেরিয়ে জীবন হয়ে ওঠার দৌড়ে এখনো অনেক, অনেক দূরে কৃত্রিম বুদ্ধিমত্তা। এটি মানুষের সহকারী হয়ে আছে, তা-ই থাকবে। তবে এটি ইতিমধ্যেই হয়ে গেছে আমাদের জীবনের অনস্বীকার্য অংশ। ফেসবুক বা গুগলের দিকে তাকালেই এটা বোঝা যায়। ভবিষ্যতের সব পরিকল্পনা তাই করতে হবে একে কেন্দ্র করে, বাদ দিয়ে নয়।

সূত্র: উইকিপিডিয়া, বিবিসি, স্প্রিঞ্জার, ইপিএসআরসি, স্ট্যানফোর্ড ডট এডু, পিইডব্লিউ রিসার্চ সেন্টার, ডেটাকোনমি, পিডব্লিউসি, রোবটিক ডটকম, মাইন্ডম্যাটারস ডট এআই

*লেখাটি ২০২১ সালে বিজ্ঞানচিন্তার সেপ্টেম্বর সংখ্যায় প্রকাশিত

আরও পড়ুন