যেভাবে কাজ করে কৃত্রিম বুদ্ধিমত্তা
বর্তমান প্রযুক্তির দুনিয়ার জনপ্রিয় ধারার কিছু শব্দ রোবটিকস, কৃত্রিম বুদ্ধিমত্তা, মেশিন লার্নিং ও ডিপ লার্নিং। সঙ্গে যদি ডেটা সায়েন্স আর বিগ ডেটা যোগ করে দেওয়া যায়, তাহলে আধুনিক প্রযুক্তির ধাই ধাই করে এগিয়ে চলার বেশির ভাগটাই চলে আসে। প্রশ্ন হলো, প্রথম বাক্যে আমরা যে চারটা শব্দ বলেছি, এগুলো কি এক? যদি এ নিয়ে তেমন ভেবে না থাকেন, তাহলে একটুখানি থেমে চিন্তা করে নিতে পারেন প্রথম দুটি শব্দ নিয়ে। রোবটিকস আর কৃত্রিম বুদ্ধিমত্তা কি এক জিনিস, নাকি আলাদা কিছু?
সাসপেন্স তৈরি করার কিছু নেই। রোবটিকস আর কৃত্রিম বুদ্ধিমত্তা দুটি আলাদা বিষয়। কিন্তু অনেক ক্ষেত্রেই এ দুটো মিলেমিশে যায়। বাইরে থেকে দেখে তাই দুটিকে একই মনে হওয়া স্বাভাবিক।
রোবট মানে এমন কোনো যন্ত্র, যেটা প্রায় স্বয়ংক্রিয়ভাবে নির্দিষ্ট কোনো কাজ করতে পারে। সে জন্য তাকে প্রোগ্রাম করে দিতে হয়। রোবটের দেহ থাকে। দেহ মানে যান্ত্রিক অবকাঠামো। খুব যত্ন করে এর নকশা করা হয়। বৈদ্যুতিক শক্তি ব্যবহারের মাধ্যমে এই অবকাঠামোর কাজ করে। কাজ মানে, যা বলা থাকে, ঠিক ঠিক তা-ই করা। প্রকৌশলবিদ্যার যে শাখা এই রোবট বানানো নিয়ে কাজ করে, তাকে বলে রোবটিকস।
উদাহরণ দিই। ধরুন, আপনার বাসায় এমন একটা যন্ত্র আছে, যেটা চালু করে দিলে ঘরের মেঝেটা মুছে ফেলে। ঘরের একদিক থেকে সরলরেখায় মুছতে শুরু করে আর সামনে বাধা পেলে ১৮০ ডিগ্রি ঘুরে যায় ধীরে ধীরে। রোবটটাকে এমনভাবে প্রোগ্রাম করে দেওয়া হয়েছে যে ডান দিক থেকে ঘর মোছা শুরু করলে, বাঁয়ে দেয়াল না পাওয়া পর্যন্ত কাজ চালিয়ে যাবে। আবার বাঁ থেকে ঘর মোছা শুরু করলে, ডান দিকে দেয়াল না পাওয়া পর্যন্ত কাজ চালিয়ে যাবে। এই প্রোগ্রাম করা খুব সহজ। কম্পিউটার প্রোগ্রামিংয়ে ‘যদি…না হলে’ বলে একটা কথা আছে। প্রোগ্রাম যেহেতু ইংরেজিতে লেখা হয়, তাই কথাটাকে বলে ‘if…else’। ইফ মানে যদি, এলস মানে না হলে। যেমন ধরুন, আমাদের ঘর মোছার এই রোবটকে আমরা বলে দিয়েছি—
এখন সে আপনাকে ল্যাপটপ ছাড়া আর কী কী জিনিসের বিজ্ঞাপন দেখাতে পারে? এই যে সিদ্ধান্ত নিতে হবে, ফেসবুকের কৃত্রিম বুদ্ধিমত্তা তার বহুল পরীক্ষিত অ্যালগরিদম ব্যবহার করে সেই সিদ্ধান্তে পৌঁছাবে।
যদি তুমি ডান দিক থেকে কাজ শুরু করো, তাহলে (বাঁয়ে দেয়াল আছে কি না, দেখবে)
যদি থাকে—থেমে যাবে;
না হলে—১৮০ ডিগ্রি ঘুরে আবার সরলরেখায় মুছতে থাকবে।
সহজ ভাষায়, এই হলো আমাদের রোবট। (এখানে আমি কোনো প্রোগ্রামিং ভাষা ব্যবহার করিনি সরাসরি, তবে ইংরেজিতে বিষয়টা মোটামুটি এভাবেই লেখা হয়। আমি যেটা লিখেছি, সেটাকে স্যুডোকোড বা অতিসরলীকরণ করে অ্যালগরিদম বলা যায়।)
আরেকটি বিষয় হলো, আমরা যে বলেছি, রোবট প্রায় স্বয়ংক্রিয়, এই ‘প্রায়’ বলার কারণ, স্বয়ংক্রিয় নয়, এমন রোবটও আছে। যেমন টেলিরোবট। দূর থেকে এগুলোকে রিমোট কন্ট্রোলের মাধ্যমে নিয়ন্ত্রণ করা হয়। (রিমোট কন্ট্রোল মানেই কিন্তু দূরনিয়ন্ত্রণব্যবস্থা!)
দুই
এবার কৃত্রিম বুদ্ধিমত্তার কথায় আসা যাক। রোবটের সঙ্গে কৃত্রিম বুদ্ধিমত্তার সবচেয়ে বড় পার্থক্য, কৃত্রিম বুদ্ধিমত্তা বলতে বোঝানো হয় প্রোগ্রামকে। প্রোগ্রাম মানে কিছু কম্পিউটার কোড, কিছু অ্যালগরিদমের সমষ্টি। অ্যালগরিদম মানে, একটা কাজ ধাপে ধাপে কীভাবে করতে হবে, সেটা বলে দেওয়া। ওপরে আমরা এর একটা সহজ উদাহরণ দেখেছি। যা–ই হোক, আসল কথা হলো, কৃত্রিম বুদ্ধিমত্তার দৃশ্যমান কোনো দেহ বা অবকাঠামো থাকা বাধ্যতামূলক নয়।
আসলে কৃত্রিম বুদ্ধিমত্তা কম্পিউটারবিজ্ঞানের একটি শাখা। শিখে শিখে বা চিন্তাভাবনা করে সিদ্ধান্ত নেওয়া লাগে, এ রকম কাজের জন্য কম্পিউটার প্রোগ্রাম গড়ে তোলাই এই শাখার কাজ। ফেসবুক বা সামাজিক যোগাযোগমাধ্যমে কিংবা গুগলে আমরা যখন কিছু লিখে সার্চ দিই, তখন সংশ্লিষ্ট বিভিন্ন বিজ্ঞাপন গুগল ও ফেসবুক আমাদের দেখায়। এ জন্য ব্যবহৃত হয় কৃত্রিম বুদ্ধিমত্তা বা আর্টিফিশিয়াল ইন্টেলিজেন্স (এআই)। যেমন ধরুন, আপনি ল্যাপটপ লিখে ফেসবুকে সার্চ করলেন। এখন সে আপনাকে ল্যাপটপ ছাড়া আর কী কী জিনিসের বিজ্ঞাপন দেখাতে পারে? এই যে সিদ্ধান্ত নিতে হবে, ফেসবুকের কৃত্রিম বুদ্ধিমত্তা তার বহুল পরীক্ষিত অ্যালগরিদম ব্যবহার করে সেই সিদ্ধান্তে পৌঁছাবে। সে মেমোরিতে খুঁজে দেখবে, আগে যারা ল্যাপটপ কিনেছে, পরবর্তী সময়ে তারা কি–বোর্ড, এসএসডি কিংবা ওয়েবক্যাম বা ল্যাপটপের চার্জার ইত্যাদি জিনিস কিনেছে। তার মানে, আপনিও এই জিনিসগুলো কিনতে চাইতে পারেন। এই সম্ভাবনাকে সে কাজে লাগানোর চেষ্টা করে। এই জিনিসগুলোর বিজ্ঞাপন দেখিয়ে সে আপনাকে ফুসলাতে শুরু করবে। ফেসবুকে ঢুকলেই আপনি দেখতে পাবেন ওয়েবক্যাম বা কি-বোর্ডের বিজ্ঞাপন। কি-বোর্ড বিভিন্ন ধরনের হয়। মেমব্রেন কি-বোর্ড, মেকানিক্যাল কি-বোর্ড, অপটিক্যাল কি-বোর্ড ইত্যাদি। কৃত্রিম বুদ্ধিমত্তা আপনাকে কোন ধরনের কি-বোর্ডের বিজ্ঞাপন দেখাবে? ধরুন, দুই মাস আগে আপনি মেকানিক্যাল কি-বোর্ড সার্চ করেছেন। এই তথ্য ব্যবহার করে সে আপনাকে বেশির ভাগ বিজ্ঞাপন দেখাবে মেকানিক্যাল কি-বোর্ডের। অল্প কিছু অন্য ধরনের কি-বোর্ডের বিজ্ঞাপনও দেখাবে। (এই যে বিভিন্ন তথ্য প্রসেস করে, প্রয়োজনীয় তথ্য খুঁজে বের করে তা কাজে লাগাচ্ছে যন্ত্র, এর নাম ডেটা সায়েন্স বা তথ্য-উপাত্তবিজ্ঞান।)
কৃত্রিম বুদ্ধিমত্তা যেন এভাবে নিজে নিজে শিখতে পারে এবং সঠিক সিদ্ধান্ত নিতে পারে, সে জন্য তাকে বলে দিতে হয়, কাজটা সে কীভাবে করবে। এই বলে দেওয়ার পদ্ধতিটার নামই অ্যালগরিদম। এটা আমরা ওপরে দেখেছি। এই অ্যালগরিদমকে প্রধানত দুই ভাগে ভাগ করা যেতে পারে।
প্রচলিত অ্যালগরিদমের ক্ষেত্রে, আমরা কম্পিউটার বা যন্ত্রকে বলে দিই, কাজটা কীভাবে করতে হবে। তারপর তাকে ইনপুট দিয়ে দিই। যন্ত্র তখন অ্যালগরিদমের ধাপগুলো মেনে, ধাপে ধাপে পুরো কাজটা শেষ করে আমাদের আউটপুট বা ফলাফলটা দেয়। কিন্তু কৃত্রিম বুদ্ধিমত্তাকে এভাবে কাজ করতে বললে সমস্যা। কারণ, ছোটখাটো অনেক অনেক বিষয় তখন তাকে বলে দিতে হবে। আর সে নিজে থেকে ঠিক সিদ্ধান্তে আসতে পারবে না। কারণ, কী হলে কী করতে হবে, এটা তাকে একদম ধাপে ধাপে বলে দেওয়া আছে। এ জন্য কৃত্রিম বুদ্ধিমত্তাকে শেখানোর জন্য বিশেষ ধরনের পদ্ধতি ব্যবহার করা হয়। এই পদ্ধতির নাম মেশিন লার্নিং।
অনেকেই মেশিন লার্নিং ও কৃত্রিম বুদ্ধিমত্তাকে এক করে ফেলেন। দুটি পুরোপুরি এক নয়। কৃত্রিম বুদ্ধিমত্তার একটি অংশ এই মেশিন লার্নিং। আবার মেশিন লার্নিং ডেটা সায়েন্সেরও একটি অংশ। (ডেটা সায়েন্স অবশ্য অনেক বিশাল একটি ক্ষেত্র। এ নিয়ে আমরা এখানে আলোচনা করব না। কারণ, ওদিকে গেলে কৃত্রিম বুদ্ধিমত্তা নিয়ে আর কথা বলে শেষ করা যাবে না।)
এটাই মেশিন লার্নিং অ্যালগরিদম। ইনপুট আর আউটপুটের সম্পর্ক হিসাব করে, মানে ছবির সঙ্গে বয়স মিলিয়ে মিলিয়ে কোন বয়সী ব্যক্তিদের চামড়ায় কতটা ভাঁজ পড়ে, কুঁচকে যায় ইত্যাদি বের করে নেওয়াটা হলো তার অভিজ্ঞতা।
মেশিন লার্নিং নামটা শুনেই বোঝা যায়, এটা যন্ত্রকে শেখানোর পদ্ধতি। অথবা যন্ত্রের শেখার পদ্ধতি। এ ক্ষেত্রে প্রোগ্রামার কোন পরিস্থিতিতে ঠিক কী করতে হবে, সেটা না বলে, কীভাবে করতে হবে, সেটা বলে দেয়। পাশাপাশি বেশ কিছু ইনপুট ও সেগুলোর আউটপুট বলে দেয়। যন্ত্র এই ইনপুট ও আউটপুটকে ব্যবহার করে অভিজ্ঞতা হিসেবে।
একটা সহজ উদাহরণ ভাবা যাক। আপনি যখন কারও চেহারার দিকে তাকান, তখন আন্দাজ করতে পারেন, তার বয়স কত। এই আন্দাজ আপনি কীভাবে করেন? করেন অভিজ্ঞতা থেকে। ২০ বছর বয়সী একজনের চেহারা দেখতে কেমন হবে, তা আপনি জানেন, আগে দেখেছেন। একইভাবে ৩০ বছর বয়সী, ৪০ বছর বয়সী বা আরও বয়স্ক মানুষের চেহারা আপনি দেখেছেন। এভাবে দেখতে দেখতে আপনার অভিজ্ঞতা হয়েছে। এখন অচেনা কারও চেহারার দিকে তাকালে সেই অভিজ্ঞতা থেকে আপনি আন্দাজ করতে পারেন, তার বয়স কত।
যন্ত্র এটা কীভাবে করবে? সাধারণ বা প্রচলিত পদ্ধতির প্রোগ্রামিং হলে যন্ত্রকে আপনার বলে দিতে হবে, পুরুষ হলে, মুখে দাড়ি থাকলে তাঁর বয়স হবে ১৮–এর বেশি। দেখতে হবে তাঁর চেহারায়, চামড়ায় কী পরিমাণ ভাঁজ আছে ইত্যাদি। কিন্তু এ রকম করে বলতে গেলে চামড়ায় কতটুকু ভাঁজের জন্য বয়স কত ধরে নিচ্ছেন, এই বিষয়টা বলে দিতে হবে যন্ত্রকে। এটা আমরা স্বাভাবিকভাবে দেখে অনেক নিখুঁতভাবে বুঝতে পারি না। এই সমস্যা সমাধানের জন্য তাই মেশিন লার্নিং কাজে লাগাতে পারি।
ধরুন, একটা যন্ত্রকে আমরা ১০ হাজার মানুষের চেহারার ছবি দিয়েছি। পাশাপাশি তাদের বয়স কত, সেটাও বলে দিয়েছি। এখানে ইনপুট হলো ছবি, আউটপুট হলো তাদের বয়স। তারপর বলে দিয়েছি, চামড়ার ভাঁজ, কুঁচকে যাওয়া, চোখের কোণে কালশিটে পড়ে যাওয়া ইত্যাদি বিষয় কোন বয়সীদের জন্য কী রকম, সেটা বের করো। যন্ত্র তখন ছবিগুলোকে প্রসেস করবে। খুঁটিয়ে দেখবে সবকিছু। কীভাবে করবে, মানে কী কী দেখবে, সেটা তাকে বলে দিয়েছি আমরা। এটাই মেশিন লার্নিং অ্যালগরিদম। ইনপুট আর আউটপুটের সম্পর্ক হিসাব করে, মানে ছবির সঙ্গে বয়স মিলিয়ে মিলিয়ে কোন বয়সী ব্যক্তিদের চামড়ায় কতটা ভাঁজ পড়ে, কুঁচকে যায় ইত্যাদি বের করে নেওয়াটা হলো তার অভিজ্ঞতা। এখন নতুন কারও ছবি যদি ইনপুট দিয়ে বয়স জিজ্ঞাসা করি, সে আগের অভিজ্ঞতা ব্যবহার করে আউটপুট দেবে, মানে বয়সটা বলে দেবে। কতটা নিখুঁতভাবে এই কৃত্রিম বুদ্ধিমত্তা বয়স বলতে পারছে, সেটা দেখা হয়। এটা হলো তার এফিশিয়েন্সি বা কার্যদক্ষতা। আর কতটা ভুল করছে, তা হলো এরর। ১০০টা এ রকম নতুন ছবি দিলে যদি দেখা যায়, ৯০ জনের ছবি থেকে সে বয়সটা নিখুঁতভাবে বের করতে পারছে, তাহলে এর এফিশিয়েন্সি ৯০ শতাংশ, এরর ১০ শতাংশ। অভিজ্ঞতা অর্জনের জন্য বা শেখার জন্য এই কৃত্রিম বুদ্ধিমত্তাকে যত বেশি ছবি দেব, তার শেখা তত ভালো হবে। মানে এফিশিয়েন্সি তত বাড়বে। ১০ হাজারের জায়গায় ১ লাখ দিলে তার অভিজ্ঞতা অনেকটা বাড়বে। আর শেখার জন্য যদি মাত্র ১ হাজার ছবি দিই, তার অভিজ্ঞতা হবে অনেক কম।
গুগলের কৃত্রিম বুদ্ধিমত্তার কাছে সারা পৃথিবীর প্রায় সব মানুষের চেহারার তথ্য আছে। আমরা গুগল ড্রাইভে বা ফটোসে যেসব ছবি রাখি, এগুলো থেকে সে শেখে। এ জন্য যেকোনো ছবি দেখলেই সে বলতে পারে, এটা কার ছবি। ফেসবুকেও এটা দেখা যায়। অচেনা কেউ আপনার ছবি আপলোড করলেও ফেসবুক নোটিফিকেশন দেয়, আপনার একটা ছবি হয়তো অমুক আপলোড করেছে। দেখুন তো এটা আপনার ছবি কি না?
কৃত্রিম বুদ্ধিমত্তার ব্যবহার এখন সব জায়গায় হচ্ছে। ফেসবুক বা গুগলের সার্চ অ্যালগরিদম বা বিজ্ঞাপন দেখানো থেকে শুরু করে ব্যবসা-বাণিজ্য, চিকিৎসাবিজ্ঞান কিংবা দাবা খেলার মতো জটিল সব বিষয়েও এর ব্যবহার হচ্ছে নিয়মিত। আবহাওয়া নির্ণয়ের জন্যও এখন ব্যবহৃত হচ্ছে কৃত্রিম বুদ্ধিমত্তা। আকাশের অবস্থা, মেঘের অবস্থা, ঘূর্ণিবায়ু আছে কি না, কতটা আছে, আর্দ্রতা কত, তাপমাত্রা ইত্যাদি দেখে অ্যালগরিদম ও অভিজ্ঞতা থেকে কৃত্রিম বুদ্ধিমত্তা বের করে ফেলতে পারছে, কোথাও ঝড়-বৃষ্টি হবে কি না।
মেশিন লার্নিংয়ের আবার বিভিন্ন ভাগ আছে। আমরা অতটা গভীরে যাব না। তবে এখানে আমরা ডিপ লার্নিংটা কী, সেটা একটু বুঝতে চেষ্টা করব। মেশিন লার্নিংয়ের একটা অংশ এই ডিপ লার্নিং। এ ক্ষেত্রে যে বিশেষ ধরনের অ্যালগরিদম ব্যবহার করা হয় তথ্য প্রসেস করার জন্য, সেটাই পার্থক্য গড়ে দেয়। এই অ্যালগরিদম একধরনের নেটওয়ার্ক গড়ে তোলে। এই নেটওয়ার্কের জন্য ডিপ লার্নিং অনেক জটিল কাজ করতে পারে, কোথাও ভুল হলে বুঝতে পারে নিজে নিজেই। ব্যবহৃত নেটওয়ার্কটি বিজ্ঞান কল্পগল্পের কল্যাণে আমাদের বহুল পরিচিত—নিউরাল নেটওয়ার্ক।
মুহম্মদ জাফর ইকবালের একটি বিজ্ঞান কল্পকাহিনি আছে। প্রডিজি। এই বইয়ে দেখানো হয়েছে, সত্যি সত্যি মানবমস্তিষ্ক ব্যবহার করা হচ্ছে নিউরাল নেটওয়ার্ক হিসেবে। পড়ে আমি মোটামুটি বিশ্বাস করে ফেলেছিলাম, নিউরাল নেটওয়ার্ক মানেই বুঝি মানুষের মস্তিষ্ককে ব্যবহার করে গড়ে তোলা নেটওয়ার্ক। আসলে তা নয়।
মানুষের মস্তিষ্কে এক হাজার কোটি স্নায়ুকোষ বা নিউরন একে অন্যের সঙ্গে জটিল এক সম্পর্কের জালে যুক্ত থাকে। একে বলে জৈবিক নিউরাল নেটওয়ার্ক। আমরা এখানে কথা বলছি কৃত্রিম নিউরাল নেটওয়ার্ক নিয়ে। এর মানে, অনেক অনেক নোড এখানে একে অন্যের সঙ্গে যুক্ত আছে। নোড মানে নেটওয়ার্কের একেকটি জয়েন্ট বা একেকটি বিন্দু। (নিচের ছবিটি দেখুন) এটা মানুষের মস্তিষ্ক যেভাবে সিদ্ধান্তে পৌঁছায়, সেভাবেই তথ্য প্রসেস করে সিদ্ধান্তে পৌঁছাতে চেষ্টা করে। বলে রাখা প্রয়োজন, যে কৃত্রিম নিউরাল নেটওয়ার্ক ডিপ লার্নিং অ্যালগরিদমের মাধ্যমে গড়ে ওঠে, তা আসলে সত্যিকারের কোনো নেটওয়ার্ক না। ভার্চ্যুয়াল নেটওয়ার্ক। এর কোনো দৃশ্যমান গঠন নেই। শুধু অ্যালগরিদমটা নেটওয়ার্কের মতো কাজ করে। একই মুহূর্তে বিভিন্ন নোডে বিভিন্ন ধরনের কাজ হচ্ছে, ভুল হচ্ছে কি না, সেটা বের করার চেষ্টা চলছে, আবার কাজ এগিয়েও যাচ্ছে। এভাবে ধীরে ধীরে এটি একটি সিদ্ধান্তে পৌঁছায়। ভুল হলে মেশিন লার্নিং অ্যালগরিদমে সাধারণত কোনো মানুষকে ঠিক করে দিতে হয় বা নতুন তথ্য দিতে হয়। ডিপ লার্নিং অ্যালগরিদম নিউরাল নেটওয়ার্ক ব্যবহার করায় এটা বেশির ভাগ ক্ষেত্রে নিজেই ভুল সংশোধন করে নিতে পারে।
আরেকটি গুরুত্বপূর্ণ বিষয় হলো, নাম নিউরাল নেটওয়ার্ক হলেও ভার্চ্যুয়াল এই নেটওয়ার্কের কোনো অনুভূতি বা চেতনা নেই। এটা পুরোপুরি বিজ্ঞান কল্পগল্পের অংশ, লেখকেরা গল্পের প্রয়োজনে লিখতে পছন্দ করেন। বাস্তবে এ রকম কিছু এখনো হয়নি। বিষয়গুলো কী, কীভাবে কাজ করে, এটা আমরা মোটামুটি বুঝলাম। রোবট মানে যান্ত্রিক অবকাঠামো, যেটা স্বয়ংক্রিয়ভাবে কোনো নির্দিষ্ট কাজ করতে পারে। আর কৃত্রিম বুদ্ধিমত্তা হলো শিখে শিখে বা চিন্তাভাবনা করে সিদ্ধান্ত নেওয়া লাগে, এ রকম কাজের জন্য গড়ে তোলা কম্পিউটার প্রোগ্রাম। কৃত্রিম বুদ্ধিমত্তাকে সরাসরি প্রোগ্রামিং করে দেওয়া যায়, আবার মেশিন লার্নিংয়ের মাধ্যমেও শেখানো যায়। কৃত্রিম বুদ্ধিমত্তার সঙ্গে রোবটের পার্থক্য তো দেখলাম, কিন্তু এগুলো কি পুরোপুরি ভিন্ন জিনিস? এগুলোকে তাহলে একই জিনিস বলে মনে করে কেন অনেকে? উত্তরটা আমরা আগেই দেখেছি, এগুলো অনেক ক্ষেত্রেই মিলেমিশে যায়। কীভাবে?
তিন
অনেক জটিল কোনো কাজের জন্য আমাদের যদি কোনো রোবট ডিজাইন করতে হয়, তাহলে সেটাকে শুধু প্রোগ্রামিং করে দিলে কী হবে? ধরুন, আপনি মস্তিষ্কের জটিল কোনো অপারেশনের জন্য রোবট বানাতে চাচ্ছেন। এই রোবটকে মুহূর্তের মধ্যে জটিল সব সিদ্ধান্ত নিতে হবে। এ রকম ক্ষেত্রে সাধারণত রোবটের মধ্যে কৃত্রিম বুদ্ধিমত্তা ব্যবহার করা হয়। আর তাকে শেখানোর জন্য ব্যবহার করা হয় মেশিন লার্নিং।
যেমন, এক কোটি মস্তিষ্ক অপারেশনের ভিডিও রোবটটিকে দেওয়া হলো। কোন অপারেশনগুলো সফল হয়েছে, কোনগুলো ব্যর্থ হয়েছে, তা–ও বলে দেওয়া হলো। রোবটের কৃত্রিম বুদ্ধিমত্তা খুঁটিয়ে দেখবে, ব্যর্থ অপারেশনগুলোতে সমস্যা কী হয়েছিল। সফলগুলোতে কোন পরিস্থিতিতে চিকিৎসক কী করেছেন। ১ কোটি বা ১০ কোটি অপারেশনের তথ্য বিশ্লেষণ করে কৃত্রিম বুদ্ধিমত্তাসম্পন্ন একটি রোবট নিঃসন্দেহে যেকোনো ভালো মানব চিকিৎসকের চেয়ে সফল ও নিখুঁতভাবে অপারেশনটি করতে পারবে। এখানেই কৃত্রিম বুদ্ধিমত্তার সাফল্য।
এ রকম আরেকটি বাস্তব উদাহরণ হলো টেসলার ইলেকট্রিক কার। এটি স্বয়ংক্রিয়ভাবে চলে। এ জন্য এটা ব্যবহার করে কৃত্রিম বুদ্ধিমত্তা। টেসলা এই কৃত্রিম বুদ্ধিমত্তাকে মেশিন লার্নিং ব্যবহার করে প্রশিক্ষণ দিয়েছে। গাড়ি চালানো কিন্তু জটিল একটা কাজ। কতটুকু দূরে, কত গতিবেগে একটা গাড়িকে চলতে দেখলে দুর্ঘটনা ঘটার আশঙ্কা আছে বলে বুঝতে হবে, ব্রেক কষতে হবে, রাস্তার বাঁক আসলে ঘুরতে হবে, ট্রাফিক বাতি দেখে থামতে বা চলতে হবে ইত্যাদি সবই টেসলার এই গাড়ির কৃত্রিম বুদ্ধিমত্তা বুঝতে পারে। তার সেই অভিজ্ঞতা আছে। এই গাড়ির কৃত্রিম বুদ্ধিমত্তার হাতে চালানোর দায়িত্ব দিয়ে আপনি নিশ্চিন্তে ঘুমাতে পারবেন! (যদিও, এখনই সেটা সম্ভব নয়। কৃত্রিম বুদ্ধিমত্তার হাতে চালানোর দায়িত্ব দিয়ে ঘুমিয়ে পড়া আইনত অবৈধ। আপাতত তাই জেগে থাকতে হবে। কারণ, পুরোপুরি নিয়ন্ত্রণ নেওয়ার জন্য গাড়িটিকে আরও শিখতে হবে, আরও অভিজ্ঞতা অর্জন করতে হবে।)
এসব সমস্যা সমাধানের জন্য বিকল্প ভাবা হয়েছে। বর্তমানে এ জন্য যুক্তরাজ্যের ইঞ্জিনিয়ারিং অ্যান্ড ফিজিক্যাল সায়েন্সেস রিসার্চ কাউন্সিল (ইপিএসআরসি) ও আর্টস অ্যান্ড হিউম্যানিটিস রিসার্চ কাউন্সিলের (এএইচআরসি) নির্ধারিত পাঁচটি নিয়ম অনুসরণ করা হয়।
এই গাড়িও কিন্তু একটি রোবট। কৃত্রিম বুদ্ধিমত্তাসম্পন্ন রোবট। কৃত্রিম বুদ্ধিমত্তাবিশিষ্ট রোবট গাড়ি শুনলেই ট্রান্সফরমার্স মনে করার কোনো কারণ নেই। রোবট মানে যে যন্ত্র নির্দিষ্ট কাজ করতে পারে। এই গাড়ি যেহেতু নিরাপদে চলতে পারে, যাত্রীকে গন্তব্যে পৌঁছে দিতে পারে, তাই এটাও একটা রোবট।
এখানেই চলে আসে কল্পবিজ্ঞান লেখকদের কল্পনা বনাম বাস্তবতা। কোনো রোবট গাড়ি যদি তার যাত্রীকে মেরে ফেলতে চায়? কিংবা এটা যদি সামনে চলে আসা কোনো পথচারীর ওপর গাড়ি তুলে দেয়? সত্যি বলতে, এখনো এ রকম কোনো রোবট বা কৃত্রিম বুদ্ধিমত্তা বাস্তবে নেই, যেটা এ রকম কিছু করে বসতে পারে। কারণ, এখন পর্যন্ত কোনো রোবট বা কৃত্রিম বুদ্ধিমত্তা নিজে চিন্তা করতে পারে না। তবু এ নিয়ে মানুষ চিন্তাভাবনা কম করেনি। কারণ, রোবট ও কৃত্রিম বুদ্ধিমত্তা এখন আর বিজ্ঞান কল্পগল্পের অংশ নয়, নিখাদ বাস্তব।
চার
১৯৪২ সালে আইজ্যাক আসিমভ রোবটরা যেন মানুষের ক্ষতি করতে না পারে, সে জন্য তিনটি সূত্র লিখেছিলেন। এই সূত্রগুলো তিনি লিখেছেন একটি ছোটগল্পে। নাম রানঅ্যারাউন্ড। সূত্রগুলো ‘থ্রি লজ অব রোবটিকস’ নামে বিখ্যাত। সূত্র তিনটি হলো—
১. কোনো রোবট জেনেবুঝে মানুষের ক্ষতি করতে পারবে না এবং মানুষের ক্ষতি হতে দেখলে নিষ্ক্রিয় থাকতে পারবে না, থামাতে চেষ্টা করবে।
২. প্রথম সূত্রের সঙ্গে সাংঘর্ষিক না হলে, মানুষের দেওয়া যেকোনো নির্দেশ রোবটকে মানতে হবে।
৩. প্রথম ও দ্বিতীয় সূত্রের সঙ্গে সাংঘর্ষিক না হলে রোবট নিজের অস্তিত্ব রক্ষার জন্য যেকোনো কিছু করতে পারবে।
এই সূত্রগুলো অনেক বিখ্যাত হলেও ঠিক কার্যকর নয়। যেমন, কোনো রোবট হয়তো জানেই না, সে যে খাবার একজন মানুষকে খেতে দিচ্ছে, সেটা বিষাক্ত। অথবা ওপরের গাড়ির কথা ভাবলে, স্বয়ংক্রিয় একটা গাড়ি যদি দেখে, সামনে তিনজন হঠাৎ চলে এসেছে। পাহাড়ি রাস্তা। গাড়িতেও তিনজন বসে আছে। রোবট গাড়িটা সাইড করতে গেলে নিচে পড়ে যাবে। তখন গাড়ির ভেতরের সবাই মারা যেতে পারে। আর সামনের মানুষের ওপর গাড়ি তুলে দিলে তারা মারা যেতে পারে। রোবট গাড়িটা এখন কী করবে? এ ধরনের বিভিন্ন সমস্যার সমাধান আসিমভের সূত্রগুলো দিতে পারে না। তা ছাড়া দ্বিতীয় সূত্রটি দিয়ে রোবটকে সরাসরি মানুষের দাস বানিয়ে দেওয়া হয়। যদিও ‘রোবট’ শব্দটি এসেছেই দাসত্ব থেকে। পূর্ব ইউরোপের স্লাভোনিক ভাষায় ‘রোবোটা’ শব্দের অর্থ দাসত্ব। সেখান থেকেই এসেছে রোবট, যার বাংলা হলো যন্ত্র-দাস।
এসব সমস্যা সমাধানের জন্য বিকল্প ভাবা হয়েছে। বর্তমানে এ জন্য যুক্তরাজ্যের ইঞ্জিনিয়ারিং অ্যান্ড ফিজিক্যাল সায়েন্সেস রিসার্চ কাউন্সিল (ইপিএসআরসি) ও আর্টস অ্যান্ড হিউম্যানিটিস রিসার্চ কাউন্সিলের (এএইচআরসি) নির্ধারিত পাঁচটি নিয়ম অনুসরণ করা হয়। এই নিয়মগুলো উঠে এসেছে আসিমভের সূত্রগুলো থেকেই, কিন্তু এগুলো আরও বেশি বাস্তব। নিয়মগুলো হলো—
১. জাতীয় নিরাপত্তার প্রয়োজন ছাড়া কোনো রোবটিক অস্ত্র বানানো যাবে না।
২. বর্তমান সব আইন ও মানবাধিকার আইন রোবটকে মেনে চলতে হবে। ব্যক্তিগত তথ্যের গোপনীয়তাবিষয়ক আইনও এর অন্তর্ভুক্ত।
৩. অন্যান্য পণ্যের মতোই ব্যবহারকারী ব্যক্তির জন্য রোবটকে যথেষ্ট নিরাপদ হতে হবে।
৪. রোবট দেখলেই বোঝা যেতে হবে, এটা রোবট। মানুষ বা যেকোনো আবেগপ্রবণ প্রাণীর সঙ্গে এর যথেষ্ট পার্থক্য থাকতে হবে, যাতে ব্যবহারকারীর মানসিক স্বাস্থ্যে কোনো ক্ষতিকর প্রভাব না পড়ে। (মানে, রোবটকে যেন প্রাণী মনে না হয় কোনোভাবেই। প্রাণী মনে হলে তার সঙ্গে যাচ্ছেতাই ব্যবহার চলে না, যা যন্ত্রের সঙ্গে করা যায়।)
৫. একটি রোবট বানানো বা ব্যবহারের সময় আইনিভাবে এর দায়িত্ব কার, তা স্পষ্ট থাকতে হবে।
এই সূত্রগুলো মানুষ বা বুদ্ধিমান প্রাণীর সঙ্গে রোবট বা যন্ত্রের পার্থক্য গড়ে দেয় এবং মানুষের নিরাপত্তা নিশ্চিত করে। অনেক দেশ লিখিত রোবট আইন প্রণয়নের কথা বললেও এখনো সে রকম কিছু করা হয়নি। রোবটশিল্পেও তাই লিখিতভাবে মেনে চলার মতো আইন তেমন একটা দেখা যায় না। কারণ, আসিমভ যে রকম ভেবেছেন, এখনো সে রকম বুদ্ধিমান রোবটের অস্তিত্ব নেই। তবে ওপরের নিয়মগুলো মোটামুটি মেনে চলা হয়, যাতে ব্যবহারকারীদের বা আশপাশের কাউকে কোনো সমস্যায় পড়তে না হয়।
পাঁচ
একটি রোবট বা কৃত্রিম বুদ্ধিমত্তা আসলেই বুদ্ধিমান কি না, সেটা আমরা বুঝব কীভাবে? এ জন্য বহুল প্রচলিত পদ্ধতিটির নাম টুরিং টেস্ট। কৃত্রিম বুদ্ধিমত্তা আর সত্যিকারের বুদ্ধিমত্তার সীমানা বেঁধে দেয় এই পরীক্ষা।
১৯৫০ সালে এআই নিয়ে অ্যালান টুরিং একটি গবেষণাপত্র প্রকাশ করেন, ‘কম্পিউটিং মেশিনারি অ্যান্ড ইন্টেলিজেন্স’। এখানেই উঠে আসে টুরিং টেস্টের কথা। এই টুরিং টেস্ট আধুনিক কৃত্রিম বুদ্ধিমত্তার মূল ভিত্তি। মুহম্মদ জাফর ইকবালের বিজ্ঞান কল্পকাহিনিতে টুরিং টেস্টের কথা অনেকবার এসেছে। আমরা যে ক্যাপচা দিই, ব্রাউজারে ‘আই অ্যাম নট আ রোবট’ সিলেক্ট করতে হয়, সেটাও আসলে একধরনের টুরিং টেস্ট।
টুরিং টেস্ট বোঝার জন্য একটা সহজ উদাহরণের কথা ভাবা যেতে পারে। ক, খ দুটি ভিন্ন ঘরে বসে আছে, কেউ কাউকে দেখতে পারছে না। গ একজন পরীক্ষক, যে টুরিং টেস্ট করছে। তার কাছে দুটি কাগজ আছে। কাগজ দুটিতে একই প্রশ্ন, হুবহু লেখা। দুটি ঘরে সে দুটি কাগজ ঢুকিয়ে দিলে ক, খ প্রশ্নগুলোর উত্তর দিল। এখন এই উত্তর পড়ে গ-কে বলতে পারতে হবে, ক ও খ—দুজনই মানুষ কি না, নাকি এর একটা যন্ত্র। ধরে নিই, আমাদের এই উদাহরণে ক একটি যন্ত্র, কিন্তু গ ক-এর উত্তর পড়ে সেটা ধরতে পারল না। তার মানে ক যন্ত্রটি টুরিং টেস্টে পাস করে গেছে। মানুষকে সে সফলভাবে অনুকরণ করতে পেরেছে। এমনটা যদি হয়, তাহলে বুঝতে হবে যন্ত্রটি নিজে নিজে চিন্তা করতে পারছে আসলেই। টুরিং যখন এই টেস্টের কথা বলেন, পুরো ব্যাপারটা শুনিয়েছিল কল্পগল্পের মতো। এখন আমরা জানি, এটা কল্পগল্প নয়। নিখাদ বাস্তব। ক্যাপচা তো আমরা প্রতিদিনই ব্যবহার করি। গুগল অ্যাসিস্ট্যান্ট বা সিরিও আছে আমাদের হাতের মুঠোয়। হয়তো আমাদের জীবদ্দশাতেই আমরা এ রকম যন্ত্রের দেখা পেয়ে যেতে পারি, যেটা সত্যিকার অর্থেই লেটার মার্কস পেয়ে পাস করে যাবে টুরিং টেস্টে।
একটা মজার তথ্য দিই। অ্যালান টুরিং নিজে এই টেস্টকে বলেছেন ইমিটেশন গেম, মানে অনুকরণের খেলা। অনেকেই নিশ্চয়ই জানেন, টুরিংকে নিয়ে একটি মুভি বানানো হয়েছে—দ্য ইমিটেশন গেম। এই চলচ্চিত্রে টুরিংয়ের চরিত্রে অভিনয় করেছেন বেনেডিক্ট কাম্বারব্যাচ। চমৎকার এই মুভির এ রকম নামকরণের কারণ আর কিছু নয়, টুরিং টেস্ট।
টুরিং টেস্টে পাশের নিয়ম হলো, অন্তত ৩০ শতাংশ নম্বর পেতে হবে কৃত্রিম বুদ্ধিমত্তাকে। আজ পর্যন্ত কোনো কৃত্রিম বুদ্ধিমত্তা এই টেস্টে সেভাবে পাস করেনি। এক-দুটি কৃত্রিম বুদ্ধিমত্তা এ রকম পাস করেছে, কিন্তু সেগুলোকে বলা যায় দুর্ঘটনা। যেমন ২০১৪ সালে ইউজিন গুস্তম্যান নামের একটি কৃত্রিম বুদ্ধিমত্তা এই পরীক্ষায় ৩৩ শতাংশ নম্বর পেয়েছে। ইউজিন গুস্তম্যান ১৩ বছরের একটি কিশোরের অনুকরণে তিনজন পরীক্ষকের সঙ্গে আলাপ চালিয়ে গেছে। তিনজনের একজন বুঝতে পারেননি, এটা কৃত্রিম বুদ্ধিমত্তা। কিন্তু এটাকে দুর্ঘটনা বলেই ধরা হয়। এর কারণও আছে। একে তো বিচারকের সংখ্যা মাত্র একজন, এর মধ্যে দুজনই বুঝে গেছেন এটি কৃত্রিম বুদ্ধিমত্তা। তার ওপর লোবনার প্রাইজ টেস্টে এটি সপ্তম হয়েছিল। এটি একটি বার্ষিক আদর্শ টুরিং টেস্ট। এই টেস্টে ইউজিনের আগের ছয়টি কৃত্রিম বুদ্ধিমত্তাও টুরিং টেস্টে পাস করতে পারেনি। কাজেই এটাকে দুর্ঘটনা না বলে উপায় নেই।
অবশ্য টুরিং টেস্ট বহুল প্রচলিত হলেও এটি যে কৃত্রিম বুদ্ধিমত্তার ব্যাপারে শেষ কথা বলার মতো নির্ভরযোগ্য, তা নয়। ২০০৮ সালে অক্সফোর্ড ইউনিভার্সিটির দর্শনবিদ্যার অধ্যাপক লুসিয়ানো ফ্লোরিডি ও তাঁর কয়েকজন শিক্ষার্থী ৯টি এ রকম পরীক্ষা করেন। তাঁরা এর মধ্যকার চারটি পরীক্ষায় যন্ত্রকে মানুষ বলে ভেবেছেন, আবার মানুষকে ভেবেছেন যন্ত্র। অর্থাৎ কোনো যন্ত্র টুরিং টেস্টে পাস করে গেলেই পৃথিবী এলোমেলো হয়ে যাবে বা মানুষের ওপর কৃত্রিম বুদ্ধিমত্তার শ্রেষ্ঠত্ব প্রতিষ্ঠিত হবে, এমনটা ভাবার কারণ নেই। তবে আজ পর্যন্ত এটিই যন্ত্র ও মানুষের বুদ্ধিমত্তার সীমারেখা নির্ধারণকারী সবচেয়ে প্রচলিত ও গ্রহণযোগ্য পরীক্ষা।
ছয়
কৃত্রিম বুদ্ধিমত্তায় ভর করে যন্ত্র কি আসলেই মানুষের জায়গা দখল করে নিতে পারবে বা প্রতিষ্ঠা করতে পারবে নিজের শ্রেষ্ঠত্ব? এখন হয়তো নেই কিন্তু ভবিষ্যতে কি এ রকম হওয়া সম্ভব?
একটু চিন্তা করলেই বোঝা যাবে, বর্তমান বিজ্ঞান ও প্রযুক্তির জ্ঞান অনুসারে এটি সম্ভব নয়। একটা স্বয়ংক্রিয় রোবটকে গাড়ি চালাতে শেখানো বা রোবট চিকিৎসককে অপারেশন করতে শেখানো খানিকটা সার্কাসের প্রাণীকে প্রশিক্ষণ দেওয়ার মতো। এর বাইরে গিয়ে সে আসলে কিছু করতে পারবে না। কাজেই মানুষের জায়গা দখল করা তো দূরের কথা, মানুষের সহযোগী বা বন্ধুও হতে পারবে না কোনো রোবট।
তবে স্বাভাবিকভাবেই স্বয়ংক্রিয় রোবট গাড়ি, রোবট চিকিৎসক, মানে বিভিন্ন ধরনের কৃত্রিম বুদ্ধিমত্তা চাকরি বা কর্মক্ষেত্রে বড় রকমের প্রভাব ফেলবে। বর্তমানে প্রচলিত অনেক কর্মক্ষেত্র চলে যাবে কৃত্রিম বুদ্ধিমত্তার দখলে। পিডব্লিউসি নামে একটি প্রতিষ্ঠান জানিয়েছে, স্বয়ংক্রিয়করণ, রোবটিকস ও কৃত্রিম বুদ্ধিমত্তার কারণে ২০৩০ সালে বিশ্বের ৮০ কোটি বর্তমান চাকরি নাই হয়ে যাবে। কিন্তু নতুন কর্মক্ষেত্র সৃষ্টি হবে প্রায় ১০০ কোটি! স্বাভাবিক। নতুন ধরনের কৃত্রিম বুদ্ধিমত্তার দেখভাল করা, তাকে প্রশিক্ষণ দেওয়া, কোথাও কোনো ভুল করছে কি না, সেসব দেখা—কাজ আসলে অনেক।
কৃত্রিম বুদ্ধিমত্তা বা চতুর্থ শিল্পবিপ্লবকে তাই সংকট ভাবার কিছু নেই। যন্ত্রের সীমানা পেরিয়ে জীবন হয়ে ওঠার দৌড়ে এখনো অনেক, অনেক দূরে কৃত্রিম বুদ্ধিমত্তা।
এটা সহজে বোঝা যাবে এখনকার স্টার্টআপ কোম্পানিগুলোর দিকে তাকালে। যুক্তরাষ্ট্রের সিলিকন ভ্যালির একটা ছোট স্টার্টআপ কোম্পানি যে পরিমাণ টাকা খরচ করছে তার কর্মীদের পেছনে, বাংলাদেশের ২০, ৩০ বা ৫০ বছর বয়সী কতটি প্রতিষ্ঠান সে পরিমাণ টাকা খরচ করতে পারে, খুঁজতে গেলে শার্লক হোমসকে লাগিয়েও কাজ হবে না সে রকম। বাংলাদেশেও এ রকম প্রতিষ্ঠান আছে। পাঠাও কাজ শুরু করেছে কয় বছর হলো? এর ব্যাপ্তি কিন্তু বিশাল। আপনাকে সে যে খাবার দেখাচ্ছে, যে ছাড়ের কুপন দিচ্ছে, এগুলোর পেছনে কাজ করছে কৃত্রিম বুদ্ধিমত্তা। আর সেই কৃত্রিম বুদ্ধিমত্তার দেখভাল করা, উন্নতির কাজে নিয়োজিত আছে বহু কর্মী।
স্বয়ংক্রিয়করণ, রোবটিকস, কৃত্রিম বুদ্ধিমত্তা, ইন্টারনেট অব থিংস (আইওটি)—এসবকে একসঙ্গে বলা হচ্ছে চতুর্থ শিল্পবিপ্লব। এটা এখন হচ্ছে, আমাদের চোখের সামনে। আর এর মেরুদণ্ড হলো এই কৃত্রিম বুদ্ধিমত্তা ও ডেটা সায়েন্স।
কৃত্রিম বুদ্ধিমত্তা প্রতিদিন আরও পরিণত হচ্ছে। এর কর্মক্ষেত্র বিস্তৃত হচ্ছে প্রতিমুহূর্তে। তবে এটা মানুষের জায়গা দখল করে নিতে পারবে না। কিন্তু মানুষকেও এর সঙ্গে পাল্লা দিতে হবে। নতুন কর্মক্ষেত্রে নিশ্চিত করতে হবে নিজের অবস্থান।
কৃত্রিম বুদ্ধিমত্তা বা চতুর্থ শিল্পবিপ্লবকে তাই সংকট ভাবার কিছু নেই। যন্ত্রের সীমানা পেরিয়ে জীবন হয়ে ওঠার দৌড়ে এখনো অনেক, অনেক দূরে কৃত্রিম বুদ্ধিমত্তা। এটি মানুষের সহকারী হয়ে আছে, তা-ই থাকবে। তবে এটি ইতিমধ্যেই হয়ে গেছে আমাদের জীবনের অনস্বীকার্য অংশ। ফেসবুক বা গুগলের দিকে তাকালেই এটা বোঝা যায়। ভবিষ্যতের সব পরিকল্পনা তাই করতে হবে একে কেন্দ্র করে, বাদ দিয়ে নয়।
