কথা বলার ক্ষমতা হারিয়ে ফেলা একজন মানুষ এখন রিয়েল টাইমে কথোপকথন করতে পারছেন। এমনকি গাইতে পারছেন গানও! এই অসাধ্য সাধন সম্ভব হয়েছে মস্তিষ্ক নিয়ন্ত্রিত কৃত্রিম কণ্ঠস্বরের মাধ্যমে।
ব্রেন-কম্পিউটার ইন্টারফেস (বিসিআই) নামের এই প্রযুক্তি মানুষের মস্তিষ্কে লাগানো ইলেকট্রোড দিয়ে স্নায়বিক কার্যকলাপ পড়ে নেয়। মানে মানুষ যা মনে মনে ভাবছে—সে যা উচ্চারণ করতে চাইছে—তা এআইয়ের সাহায্যে বুঝে নেয় বিসিআই। তারপর প্রায় সঙ্গে সঙ্গে তা আবার শোনা যায় স্পিকারে। সবমিলিয়ে এমন একজন মানুষের সঙ্গে কথা বললে আপনার মনেই হবে না যে যন্ত্রের সঙ্গে কথা বলছেন। মনে হবে কথা বলছেন একজন স্বাভাবিক মানুষের সঙ্গে।
যুক্তরাষ্ট্রের ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়ের গবেষক সের্গেই স্ট্যাভিস্কি বলেন, ‘তাৎক্ষণিক কথা বলার জন্য এটি প্রথম এ ধরনের প্রযুক্তি। মাত্র ২৫ মিলিসেকেন্ডের মধ্যে এটা কাজ করতে পারে।’
কথোপকথন যাতে আরও বাস্তবসম্মত হয়, তাই ওই ব্যক্তির মস্তিষ্কের যে অংশ মুখের পেশি নিয়ন্ত্রণ করে, সেখানে ২৫৬টি ইলেকট্রোড বসানো হয়েছে। তারপর একাধিক সেশনে গবেষকেরা তাঁকে স্ক্রিনে হাজার হাজার বাক্য দেখিয়ে জোরে বলতে বলেন।
বর্তমানে যে ব্যক্তি এই প্রযুক্তির সাহায্যে কথা বলতে পারছেন, তিনি অ্যামায়োট্রফিক ল্যাটেরাল স্ক্লেরোসিস রোগে ভুগছিলেন। এতে তাঁর কথা বলার ক্ষমতা হারিয়ে যায়। প্রযুক্তির সাহায্যে আবার কথা বলার ক্ষমতা ফিরে পেয়ে তিনি খুব খুশি। বলে রাখা প্রয়োজন, গবেষণা পর্যায়ে রয়েছে বলে এই ব্যক্তির নাম প্রকাশ করা হয়নি। তিনি জানিয়েছেন, ‘আমার নিজেকে সুখী মনে হচ্ছে। মনে হচ্ছে এটাই আমার আসল কণ্ঠস্বর।’
ব্রেন-কম্পিউটার ইন্টারফেস ব্যবহার করে কথা বলার প্রযুক্তি আগেও ছিল। কিন্তু সেগুলো মস্তিষ্কের কার্যকলাপকে আওয়াজে রূপ দিতে কয়েক সেকেন্ড সময় নিত। এতে স্বাভাবিক কথোপকথন কঠিন হয়ে পড়ত। বিষয়টা একটু বুঝিয়ে বলি।
ধরুন, এমন প্রযুক্তি ব্যবহার করা কোনো মানুষের সঙ্গে আপনি কথা বলছেন। আপনি তাকে জিজ্ঞেস করলেন, ‘কেমন আছেন?’
সে এটা শুনে সঙ্গে সঙ্গে বলছে (মনে মনে, যেহেতু মুখে কথা বলতে পারে না), ‘ভালো আছি।’
কিন্তু আপনি তার কথা সঙ্গে সঙ্গে শুনতে পাচ্ছেন না। কারণ ওই প্রযুক্তি ওটা ঠিকভাবে বুঝে রিপ্লাই দিতে কয়েক সেকেন্ড লাগবে। ততক্ষণ আপনি চুপ করে বসে আছেন। তারপর হঠাৎ জিজ্ঞেস করলেন, ‘আপনার নাম কী?’
যতক্ষণে নাম জিজ্ঞেস করেছেন, ততক্ষণে যন্ত্রটি কেবল উত্তর দেওয়া শুরু করেছে, ‘আমি ভালো…’
এর মধ্যে যেহেতু আপনি নাম জিজ্ঞেস করে ফেলেছেন, সেই ব্যক্তি কিন্তু ততক্ষণে তার নামও মনে মনে বলেছে। যন্ত্র সেটাও ধরে ফেলেছে। তাই প্রথম প্রশ্নের সম্পূর্ণ উত্তর দেওয়ার আগে সে পরের প্রশ্নের উত্তর দেওয়ার চেষ্টা করছে। এভাবে কিছুক্ষণ কথা বললে আপনি টের পাবেন, এই কথোপকথন চালানো কঠিন।
এই প্রযুক্তি এমন সব মানুষের জন্য নতুন আশার আলো নিয়ে এসেছে, যারা বিভিন্ন রোগ বা দুর্ঘটনার কারণে কথা বলার ক্ষমতা হারিয়েছেন। যদিও এখনো অনেক উন্নতির সুযোগ আছে, তবু এই প্রযুক্তি ভবিষ্যতে হয়তো মানুষের চিন্তাভাবনাকে সরাসরি কথায় রূপ দিতে পারবে।
বাংলায় প্রচলিত একটা বাক্য আছে, ‘কথার স্রোত’। ইংরেজিতে বলা হয়, কথার ‘ফ্লো’। অর্থাৎ টানা কথা বলা। আবার আমরা মাঝেমধ্যে কথার মাঝখানেই আরেকটা কথা বলি, ভুল হলে সংশোধন করে দিই। কিন্তু মস্তিষ্কের তা প্রসেস করতে যদি কয়েক সেকেন্ডের বেশি সময় লাগে, তাহলে এক সময় একটার সঙ্গে আরেকটা মিলে যাবে। তাতে কথোপকথন চালানো কঠিন হয়ে পড়াই স্বাভাবিক। মোবাইলে কথা বলার সময় নেটওয়ার্ক না পেলে যেমন অর্ধেক অর্ধেক কথা শোনা যেত, আগের প্রযুক্তির অবস্থা ছিল অনেকটা সেরকম। নতুন প্রযুক্তি সেই সমস্যা সমাধান করেছে কৃত্রিম বুদ্ধিমত্তার সাহায্যে। এখন এর সাহায্যে বাকপ্রতিবন্ধী মানুষ রিয়েল টাইম জবাব দিতে পারে।
কথোপকথন যাতে আরও বাস্তবসম্মত হয়, তাই ওই ব্যক্তির মস্তিষ্কের যে অংশ মুখের পেশি নিয়ন্ত্রণ করে, সেখানে ২৫৬টি ইলেকট্রোড বসানো হয়েছে। তারপর একাধিক সেশনে গবেষকেরা তাঁকে স্ক্রিনে হাজার হাজার বাক্য দেখিয়ে জোরে বলতে বলেন। মাঝেমধ্যে একটা নির্দিষ্ট সুরে কথা বলতে বলেন। এই পুরো সময় তাঁরা তাঁর মস্তিষ্কের কার্যকলাপ রেকর্ড করে রাখেন।
এরপর দলটি এসব তথ্য একটি কৃত্রিম বুদ্ধিমত্তার মডেলে ঢুকিয়ে দেয়। এই মডেলকে শেখানো হয়, কোন স্নায়বিক কার্যকলাপের প্যাটার্ন কোন শব্দ আর উচ্চারণের সঙ্গে মেলে। তারপর মেশিন মস্তিষ্কের সংকেত দেখে কথা তৈরি করে। এরপর ওই ব্যক্তি কি বলতে চেয়েছেন আর কীভাবে বলতে চেয়েছেন, সেভাবে স্পিকারে তা উচ্চারিত হয়।
ওই ব্যক্তি যে বলেছেন, কণ্ঠস্বর তাঁর নিজের মতো মনে হচ্ছে, এটা কীভাবে হলো? গবেষকেরা ওই ব্যক্তির রোগ বাড়ার আগের কণ্ঠস্বরের রেকর্ডিং দিয়ে প্রশিক্ষণ দিয়েছেন কৃত্রিম বুদ্ধিমত্তাকে। ভয়েস ক্লোনিং প্রযুক্তি ব্যবহার করে কৃত্রিম কণ্ঠস্বরকে তার নিজের কণ্ঠের মতো শোনানোর চেষ্টা করেছেন। এমনকি গবেষকেরা তাঁকে বিভিন্ন সুরে গান গাইতে বলেন। এআই সেই কাঙ্ক্ষিত সুর বুঝে নিয়ে সে অনুযায়ী গানের কণ্ঠস্বরও তৈরি করেছে।
বাংলায় প্রচলিত একটা বাক্য আছে, ‘কথার স্রোত’। ইংরেজিতে বলা হয়, কথার ‘ফ্লো’। অর্থাৎ টানা কথা বলা। আবার আমরা মাঝেমধ্যে কথার মাঝখানেই আরেকটা কথা বলি, ভুল হলে সংশোধন করে দিই।
এই গবেষক দলের সদস্য ডেভিড ব্র্যান্ডম্যান বলেন, ‘তিনি খুবই বাকপটু এবং বুদ্ধিমান মানুষ। পক্ষাঘাতগ্রস্ত হয়ে কথা বলতে না পারার অবস্থা তিনি কাটিয়ে উঠেছেন। এখন তিনি পূর্ণ সময় কাজ করছেন এবং কথোপকথনও করতে পারছেন।’
এই প্রযুক্তি এমন সব মানুষের জন্য নতুন আশার আলো নিয়ে এসেছে, যারা বিভিন্ন রোগ বা দুর্ঘটনার কারণে কথা বলার ক্ষমতা হারিয়েছেন। যদিও এখনো অনেক উন্নতির সুযোগ আছে, তবু এই প্রযুক্তি ভবিষ্যতে হয়তো মানুষের চিন্তাভাবনাকে সরাসরি কথায় রূপ দিতে পারবে।
এই একই প্রযুক্তি ব্যবহৃত হয়েছে ইলন মাস্কের নিউরালিংকে। এর মাধ্যমে শারিরীকভাবে পঙ্গু মানুষ শুধু চিন্তা করে কম্পিউটারে মাউস নাড়াতে পারছেন। এ প্রযুক্তি আরও উন্নত করার জন্য এখনো চলছে গবেষণা।
