বাদ্যযন্ত্র ও কৃত্রিম বুদ্ধিমত্তা

রোবট কি বাদ্যযন্ত্র বাজাতে পারে?

হ্যাঁ, পারে।

মানুষের চেয়েও ভালো পারে?

সেটা নির্ভর করে কোন মানুষের কথা বলছ, তার ওপর!

ব্যাপারটা চিন্তার বটে। আমার কথা যদি বলি, রোবট নিশ্চয়ই আমার চেয়ে ভালো বাদ্য বাজাতে পারে। আবার আমার বন্ধু অমল সাংঘাতিক তবলা বাজায়। রোবটরা হয়তো অমলের সঙ্গে পাল্লা দিয়ে পারবে না...অন্তত এখনো।

এটা নিয়েই মাঝেমধ্যে কেউ কেউ বড় দুশ্চিন্তায় পড়ে। এই মুহূর্তে অমলের সঙ্গে কোনো রোবট পাল্লা দিতে পারে না—বেশ কথা, কিন্তু পাঁচ বছর পরেও কি পারবে না? এই প্রশ্নের উত্তর দেওয়ার আগে আমাদের একটু পেছনে তাকানো উচিত:

কোনো কোনো যন্ত্র একটু বেশি যান্ত্রিক!

জর্জ অরওয়েল তাঁর বিখ্যাত উপন্যাসে লিখেছিলেন, ‘সব প্রাণীই পশু, কিছু কিছু প্রাণী একটু বেশিও পশু।’ সংগীতেও এমন একটা ধারণা আছে। সব বাদ্যযন্ত্রই যান্ত্রিক, কিন্তু কোনো কোনোটা একটু বেশি যান্ত্রিক!

ধারণাটার কবে শুরু হয়েছিল, তা বলা কঠিন। তবে ষাটের দশকে বিটলস যখন সারা পৃথিবী মাতিয়ে বেড়াচ্ছে, মোটামুটি তখন থেকে সংগীতে প্রচুর পরিমাণে ইলেকট্রনিক যন্ত্রপাতির ব্যবহার শুরু হয়। এসব যন্ত্রের চেহারা যেমন ছিল বিচিত্র, এগুলো কাজও করতে পারত বিচিত্র রকমের। কোনোটা অবিকল বাঁশির মতো শব্দ তৈরি করত, কোনোটা পিয়ানোর মতো, এমনকি কোনোটা খোদ অর্কেস্ট্রার মতো!

এসব ইলেকট্রনিক যন্ত্রকে ডাকা হয় সিনথেসাইজার নামে। বেশির ভাগ সময়েই এগুলো দেখতে আমাদের চেনা–পরিচিত কি–বোর্ডের মতো। কিন্তু কাজের বেলায় এগুলো বিভিন্ন বাদ্যযন্ত্রের শব্দ তৈরি করে ফেলতে পারে।

যারা কনসার্টে, গানের অনুষ্ঠানে মাঝেমধ্যে যায়, তারা হয়তো ব্যাপারটা খেয়াল করেছে। মঞ্চের কোথাও বাঁশি নেই, তবু হয়তো বাঁশির শব্দ শোনা যাচ্ছে। প্রায় সব ক্ষেত্রেই লক্ষ করলে দেখা যাবে, শব্দটা তৈরি হচ্ছে কি–বোর্ডের মতো একটা যন্ত্র থেকে। ওটাই সিনথেসাইজার। ওটা বাঁশির শব্দে সেট করা আছে বলে বাঁশি বাজছে, একটু পর পিয়ানোর শব্দে সেট করলে পিয়ানোর মতোই আওয়াজ আসবে।

সিনথেসাইজারের ব্যাপারটা নিয়ে অনেক মানুষই বীতশ্রদ্ধ ছিলেন (এখনো আছেন বটে)। তাঁদের ধারণা ছিল, এটা সত্যিকারের সংগীতকে ধ্বংস করে দিচ্ছে। দ্য স্মিথসের বিখ্যাত শিল্পী মরিসে একবার রীতিমতো খেপেই গিয়েছিলেন। বলেছিলেন, ‘আশ্চর্য লাগে কিছু মানুষের এমন মূর্খ আর নির্বোধ হওয়া দেখে। অবশ্যই পৃথিবীর সবচেয়ে জঘন্য জিনিসটার নাম সিনথেসাইজার!’

সিনথেসাইজারের বিরুদ্ধে যাঁরা ছিলেন, তাঁদের যুক্তিটা সহজে বোঝা যায়। সেতার বাজাতে না জেনেও যদি যন্ত্র দিয়ে সেতারের শব্দ যদি তৈরি করা যায়, তাহলে মানুষের কৌশলটা আর থাকল কোথায়। অর্ধেক কাজটুকু তো যন্ত্রের হয়ে গেল! কথাটা আসলে পুরোপুরি সত্যি নয়। কোনো র৵ান্ডম মানুষকে সিনথেসাইজারের সামনে বসিয়ে দেওয়া হলে স্রেফ আজগুবি-উদ্ভট কিছু সুর বের হবে! অর্থাৎ সিনথেসাইজার ঠিকমতো ব্যবহার করতেও একজন রক্ত–মাংসের শিল্পীকে দরকার হয়।

শিল্পী ছাড়াই শিল্প

কিন্তু রক্ত–মাংসের শিল্পী ছাড়া কি কাজটা করা সম্ভব? উত্তর হচ্ছে, হ্যাঁ, সেটাও সম্ভব। বর্তমানে প্রচুর টুল আছে, সেগুলো ব্যবহার করে মোটামুটি যেকোনো যন্ত্রের শব্দ তৈরি করা যায়।

অনেকেই ড্রাম বাজাতে পারে না। সেই মানুষ যদি আন্দাজে গুগলে সার্চ দেয়, ‘drum generator’, তাহলে প্রথম যে লিংকটা আসবে, সেখানে গিয়েই একটা টুল পাওয়া যাবে, যেটা দিয়ে মোটামুটি যেকোনো ড্রামিং প্যাটার্ন তৈরি করা যায়। চাইলে ঘরে বসেই ‘উই উইল রক ইউ’-এর ড্রামিং প্যাটার্ন বানিয়ে ফেলতে পারে। কী ভয়াবহ!

ঠিক এই কাজই আজকাল গানের মাঝে প্রায়ই করা হয়, অন্তত পপুলার ধাঁচের গানে। কেন করা হয়, সেটা বোঝাও সহজ। সত্যিকারের ড্রামার চাইলে প্রথমে একটা মানুষ খুঁজে বের করতে হবে, তার সঙ্গে গানটা নিয়ে বিশদ আলোচনা করতে হবে, তাঁকে ড্রাম বাজানোর জন্য টাকা দিতে হবে—এত ঝামেলায় কে যেতে চায়! এর চেয়ে কোনো টুল ব্যবহার করে কাজটা সেরে ফেললে ঝামেলা কম। এসব টুলকে বলা হয় ড্রাম মেশিন। পুরোনো ড্রাম মেশিনগুলো দেখতে বিকট একেকটা যন্ত্রের মতো ছিল। আধুনিক ড্রাম মেশিন মূলত একেকটা সফটওয়্যার। গুগল সার্চ করে যেটা পাওয়া যায়, সেটাও একটা ড্রাম মেশিন।

এই ড্রাম মেশিন ব্যবহার করে কম ঝামেলায় ‘কাজ সেরে ফেলা’র ব্যাপারটা অনেকেই করত (এখনো করে), বিশেষ করে পপ গায়কেরা এটাকে বেশ পছন্দই করতেন। ম্যাডোনার ‘বার্নিং আপ’ কিংবা মাইকেল জ্যাকসনের ‘ওয়ানা বি স্টার্টিন’ সামথিং যারা শুনেছে, তাদের খেয়াল করার কথা, এই গানগুলোর প্রায় পুরোটাজুড়েই একইভাবে ড্রাম বাজে। এগুলো নিখাদ ড্রাম মেশিনের কাজ।

শুধু ড্রাম মেশিন নয়, প্রোগ্রাম করে যেকোনো বাদ্যযন্ত্রই বাজানো সম্ভব। একটু অর্থ আর শ্রম দিলে এমন রোবটও বানানো সম্ভব, যেটা হাত দিয়ে ধরে বাদ্যযন্ত্র বাজিয়ে শোনাবে। সত্যি বলতে গেলে, এসব রোবট বেশ অনেক দিন ধরে বানানো হচ্ছেও। শুধু বানানো হচ্ছে না, এমন রোবটের রীতিমতো ব্যান্ড দলও আছে এবং কিছুদিন আগে চীনের সিংগুয়া বিশ্ববিদ্যালয়ে সেসব রোবট একটা কনসার্টও করেছে।

না, ব্যাপারটা শুনতে যেমন মনে হচ্ছে, অতটা বিষম খাওয়ার মতো নয়। রোবটরা নিজে নিজে ‘এসো বাহে ব্যান্ড করি’ বলে গাইতে শুরু করেনি। তাদের ধরে ধরে প্রোগ্রাম করতে হয়েছে, মঞ্চে যেসব গান তারা বাজাবে, সেগুলো বাজানোর প্রক্রিয়া তাদের মাথায় (অর্থাৎ মেমোরিতে) ঢোকাতে হয়েছে, এরপরই তারা দু-চারটা গান বাজাতে পেরেছে। অর্থাৎ এসব রোবটকে যদি দুম করে বলা হয়, ‘গাও তো দেখি বকুল ফুল’ তারা কিচ্ছুটি করতে পারবে না। প্রথমে প্রোগ্রাম করে তাদের মধ্যে গানটা বাজানোর প্রক্রিয়া ঢোকাতে হবে, কেবল এরপরই তারা কাজটা করতে পারবে।

এআইয়ের সংগীত

এমন কোনো যন্ত্র কি আছে, যেটা মানুষের সাহায্য ছাড়াই নিজে নিজে সুর তৈরি করতে পারে? উত্তর হলো, হ্যাঁ, পারে! এই কাজ করা হয় আর্টিফিশিয়াল ইন্টেলিজেন্স (এআই) ব্যবহার করে। মানুষ যেমন গান শুনে শুনে গান করতে শেখে, এআইও অমন একটু একটু করে শেখে।

এসব এআই তৈরি করে—এমন প্রতিষ্ঠানের সংখ্যাও একেবারে অল্প নয়। পপগান নামে একটা অস্ট্রেলিয়ান প্রতিষ্ঠান আছে। তারা যে এআই তৈরি করেছে, সেটা শুধু বাদ্য বাজানো নয়, রীতিমতো মানুষের কণ্ঠে গান গেয়েও শোনাতে পারে!

আবার কিছু এআই প্রোগ্রাম আছে, যাকে কেবল বলে দিতে হয় আমি কেমন গান চাইছি। গানটা কোন ঘরানার হবে, কত দ্রুত বাজবে, কতক্ষণের হবে, গানের সুরে খুশি খুশি ভাব থাকবে, নাকি দুঃখ দুঃখ ভাব থাকবে, এসব বলে দিলে সেটা পুরোপুরি নতুন গান তৈরি করে দিতে পারে। ব্যাপারটার মধ্যে কি একটা ব্যবসা ব্যবসা গন্ধ পাওয়া যায়?

তাহলে এটাও বলে ফেলি, এআই ব্যবহার করে গান তৈরি করা হয় প্রধানত বাণিজ্যিক উদ্দেশ্যেই। এই গানগুলো কোনোটা ব্যবহার করা হয় টিভির বিজ্ঞাপনে, কোনোটা অনলাইন কনটেন্টে, কোনোটা হয়তো মোবাইল গেমে। আজকাল বিজ্ঞাপন, কনটেন্ট, গেম—এসবে এত বেশি সংগীতের প্রয়োজন হয় যে প্রতিটি জায়গায় মানুষ দিয়ে কাজ করানো সময়সাপেক্ষ ব্যাপার; খরচসাপেক্ষও বটে! সময় আর খরচ বাঁচাতে অনেকেই এআই দিয়ে কাজটা সেরে ফেলে।

কিন্তু বিজ্ঞাপনের গান তো কেবল প্রেক্ষাপট হিসেবে ব্যবহার করা হয়। একদিন যদি আবিষ্কার করি, অঞ্জন দত্তের সব কটি গান আমার শোনা হয়ে গেছে, তখন এআইকে বললে কি আমাকে নতুন একটা অঞ্জনের গান বানিয়ে দিয়ে পারবে? হ্যাঁ, সেটাও পারবে (যদিও তর্কসাপেক্ষ)। এমন এআইয়ের সংখ্যাও পর্যাপ্ত, যাদের অঞ্জনের গানের একটা তালিকা ধরিয়ে দিলে একটা নতুন গান বানাতে পারবে, যেটা অঞ্জনের মতোই শোনাবে।

অনুমান করা হয়, আর বছর দশেকের মাথায় মানুষ রাতে ঘুমানোর আগে ফোন বের করবে এবং সেখানে থাকা এআইকে বলবে, ‘আমাকে একটা শান্ত গান শোনাও, নতুন,’ সঙ্গে সঙ্গে নতুন একটা গান তৈরি হয়ে বাজতে শুরু করবে। কিংবা ‘কাল আমার অমুক বন্ধুর জন্মদিন, তাকে নিয়ে একটা গান বানাও,’ তৎক্ষণাৎ সেই অমুক বন্ধুকে নিয়ে গান বাঁধা হয়ে যাবে। তবু একটা কিন্তু কি থেকে যাচ্ছে?

প্রযুক্তি ব্যবহার করে র৵ান্ডম গানের কথা লেখা যায়, র৵ান্ডম সুরও তৈরি করা যায়, কিন্তু যেকোনো কথায় যেকোনো সুর বসিয়ে দিলেই কি সেটা আমাদের গভীর তৃপ্তি দিতে পারে? নিশ্চয়ই না। সেটা হলে সব কথাই হতো সুন্দর কথা, আর সব সুরই স্বর্গীয় সুর হয়ে যেত। কিন্তু এরপরও কথা আর সুরের কিছু প্যাটার্ন তো থাকে, যেটা আমাদের শুনতে ভালো লাগে। পপগানের বেশির ভাগ শিল্পীই এই প্যাটার্নগুলো অনুসরণ করেন। উদাহরণ হিসেবে উইনিং ব্যান্ডের কথা মনে পড়ে কিংবা বি গিজের ‘স্টেয়িং অ্যালাইভ’-এর মতো গানের কথা মনে করা যায়। এই গানগুলো শুরুই হয় শক্ত ড্রামের বিট দিয়ে, গান শুরুর পাঁচ সেকেন্ডের মাথায় আশপাশের সবাই মাথা ঝাঁকাতে, পা নাচাতে বাধ্য!

কিন্তু নির্দিষ্ট প্যাটার্নের পপগানই তো আর গানের সবকিছু নয়! সত্যিকারের ভালো গান আসলে কী?

এর উত্তর কেউ জানে না। কবীর সুমনের ‘তিনি বৃদ্ধ হলেন’ গানটার কথা ভাবি। গানটার গঠন খুবই অদ্ভুত, ঠিক ওভাবে কোনো নিয়ম মানে না। কোনো তাল ছাড়াই গানটা শুরু হয়, মাঝখানে গিয়ে হঠাৎ মনে হয় কী সুন্দর ছন্দে ছন্দে এগোচ্ছে, আবার হুট করেই তালটা উধাও হয়ে যায়। তবু এই বেতালের গানটাই ভালো লাগে শুনতে।

গানের তাল না থাকলে সেটা হতশ্রীই হওয়ার কথা, তবু তালহীন একটা ‘ভুল গান’ও তো সুন্দর হতে পারে! কোন ভুলটা সুন্দর আর কোনটা বিচ্ছিরি, তার আসলে কোনো সূত্র থাকে না। তাই এই জিনিস কোনো রোবটকে কিংবা এআই প্রোগ্রামকে বোঝানো দারুণ দুঃসাধ্য!

জর্জ হ্যারিসনের কথাও মনে পড়ছে আমার। তিনি বিটলসে থাকার সময় আশ্চর্য সুন্দর যে কয়েকটা কাজ করেছিলেন, তার মধ্যে একটা হলো গানের মধ্যে সেতারের ব্যবহার। ইউরোপের একটা ব্যান্ড রক গান করছে উপমহাদেশের সেতার বাজিয়ে, কথাটা চিন্তা করলেই তো গায়ের লোম দাঁড়িয়ে যায়।

এসব রোমহর্ষক কাজ করতে জর্জ হ্যারিসনের প্রয়োজন। সুন্দর একটা ভুল করতে কবীর সুমনের প্রয়োজন।

সেই জায়গাতেও হয়তো একদিন আমাদের প্রযুক্তি পৌঁছাবে। কিন্তু সেটা এখনো অনেক অনেক দূরের পথ।

লেখক: শিক্ষার্থী, ঢাকা বিশ্ববিদ্যালয়

সূত্র: মিডিয়াম ডট কম, গার্ডিয়ান