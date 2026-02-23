প্রযুক্তি

কণ্ঠস্বরই কি আপনার গোপনীয়তার সবচেয়ে বড় হুমকি

আসহাবিল ইয়ামিন
আপনার কণ্ঠস্বর কি তবে আপনার ব্যক্তিগত তথ্য ফাঁস করছে?ছবি: ইয়ারোস্লাভ কুশ্তা / গেটি ইমেজ

আপনার কণ্ঠস্বর এখন আর শুধু কথা বলার মাধ্যম নয়। একজন কণ্ঠ বিশেষজ্ঞ আপনার কথা বলার ধরন শুনেই অনেক কিছু বলে দিতে পারেন। আপনার শিক্ষা, মানসিক অবস্থা, এমনকি পেশা বা আর্থিক অবস্থাও তাঁর কাছে স্পষ্ট হয়ে উঠতে পারে। বিষয়টি শুনতে অদ্ভুত মনে হলেও বিজ্ঞানীরা এখন এক বড় আশঙ্কার কথা জানাচ্ছেন। তাঁরা বলছেন, কৃত্রিম বুদ্ধিমত্তা আপনার গলার স্বর বিশ্লেষণ করে আপনার অজান্তেই একটি নিখুঁত ব্যক্তিগত প্রোফাইল তৈরি করে ফেলতে পারে। এর ফলে এই প্রযুক্তি ব্যবহার করে অন্যের কাছ থেকে অন্যায্য সুবিধা নেওয়া বা আপনাকে হয়রানি করার সুযোগ তৈরি হতে পারে।

মানুষ কথা বলার সময় অন্যের ক্লান্তি, দুশ্চিন্তা বা আনন্দ বেশ সহজেই বুঝতে পারে। কিন্তু কম্পিউটার বা এআই এই কাজটি করতে পারে আরও দ্রুত এবং মানুষের চেয়েও অনেক বেশি নিখুঁতভাবে। নতুন এক গবেষণা বলছে, আপনার কথা বলার ধরন থেকে অনেক কিছুই জানা সম্ভব। এমনকি আপনার ব্যবহৃত শব্দগুলো থেকে আপনার মনের খবরও পাওয়া যায়। এর মাধ্যমে আপনার রাজনৈতিক পছন্দ যেমন বোঝা যায়, তেমনি শরীরের জটিল কোনো রোগ বা স্বাস্থ্যের অবস্থা সম্পর্কেও আগাম ধারণা পাওয়া সম্ভব।

ছবি: রেডিট

গত ১৯ নভেম্বর যুক্তরাষ্ট্রের প্রসিডিংস অব দ্য আইইইই জার্নালে এ সংক্রান্ত একটি গবেষণা প্রকাশিত হয়। গবেষকদের সবচেয়ে বড় উদ্বেগ হলো, প্রযুক্তির এই ক্ষমতা যদি ভুল পথে ব্যবহৃত হয়, তবে তা আমাদের ব্যক্তিগত গোপনীয়তার জন্য মারাত্মক হুমকি হয়ে দাঁড়াতে পারে।

কণ্ঠস্বর শনাক্তকরণ প্রযুক্তি আমাদের জন্য অনেক সুযোগ তৈরি করলেও এর পেছনে লুকিয়ে আছে বড় এক ঝুঁকি। ফিনল্যান্ডের আল্টো বিশ্ববিদ্যালয়ের সহযোগী অধ্যাপক ও এই গবেষণার প্রধান লেখক টম বাকস্ট্রোম একটি গুরুতর আশঙ্কার কথা জানিয়েছেন। তাঁর মতে, কোনো বাণিজ্যিক প্রতিষ্ঠান যদি আপনার কণ্ঠস্বর বিশ্লেষণ করে আপনার আর্থিক অবস্থা বা প্রয়োজনের কথা বুঝে ফেলে, তবে তারা সেটিকে আপনার বিরুদ্ধেই ব্যবহার করতে পারে। ধরুন, আপনার গলার স্বর শুনে কোনো এআই বুঝে ফেলল আপনি আর্থিকভাবে বেশ সচ্ছল। অথবা আপনার কথা শুনে মনে হলো, এই মুহূর্তে আপনার কোনো সেবা খুব জরুরি। এমন পরিস্থিতিতে বিমা কোম্পানিগুলো আপনার জন্য সেবার দাম বাড়িয়ে দিতে পারে। আপনার কণ্ঠস্বরের ওপর ভিত্তি করে নেওয়া এই অন্যায্য সুযোগকেই বলা হয় ডিজিটাল বৈষম্য।

কণ্ঠস্বর আমাদের ব্যক্তিগত তথ্য ফাঁস করতে পারে, যা সাইবার অপরাধীরা ব্যবহার করে নির্দিষ্ট ব্যাক্তিকে শনাক্ত করতে পারে
ছবি: লিঙ্কডইন

ঝুঁকি এখানেই শেষ নয়। আমাদের কণ্ঠস্বর আমাদের মানসিক দুর্বলতা, লিঙ্গপরিচয় ও আরও অনেক ব্যক্তিগত তথ্য ফাঁস করে দিতে পারে। সাইবার অপরাধীরা বিভিন্ন প্ল্যাটফর্মে এই তথ্য ব্যবহার করে নির্দিষ্ট ব্যক্তিকে খুঁজে বের করতে পারে। ফলে ব্যক্তিগত জীবনে হয়রানি বা ব্ল্যাকমেইলের মতো ঘটনা ঘটার আশঙ্কা বেড়ে যায়। আমরা যখন কথা বলি, তখন অবচেতনভাবেই এই তথ্যগুলো অন্যের কাছে পৌঁছে দিই এবং আমাদের মস্তিষ্কও অন্যের কণ্ঠের প্রতি অবচেতনভাবেই সাড়া দেয়।

মানুষের স্নায়ুতন্ত্র নিয়ে কাজ করছেন গবেষক জেনালিন পোনরাজ। তিনি বলেন, ‘আমরা সাধারণত শোনার বায়োলজিক্যাল দিকটি নিয়ে খুব একটা ভাবি না। কিন্তু কোনো সংকটময় মুহূর্তে মানুষ সামনের জনের ভাষার চেয়ে তার গলার স্বর, কথা বলার ছন্দ এবং শ্বাসের ওঠানামার ওপর আগে সাড়া দেয়।’ অর্থাৎ আমাদের মস্তিষ্ক কথার অর্থ বোঝার আগেই গলার সুর বা টোন বুঝে প্রতিক্রিয়া দেখায়।

অধ্যাপক বাকস্ট্রোম জানিয়েছেন, এই প্রযুক্তি এখনো হয়তো ব্যাপকভাবে ব্যবহৃত হচ্ছে না, কিন্তু এর শক্ত ভিত্তি তৈরি হয়ে গেছে। বর্তমানে অনলাইন গেমিং বা কলসেন্টারগুলোতে মানুষের রাগ বা মেজাজ বোঝার জন্য স্বয়ংক্রিয় প্রযুক্তি ব্যবহার করা হচ্ছে। প্রথম দেখায় এর উদ্দেশ্য ভালো মনে হতে পারে, তবে এর আড়ালে লুকিয়ে আছে বড় আশঙ্কা। যখন কোনো রোবট বা এআই আপনার কথা বলার ভঙ্গি নকল করে হুবহু আপনার মতোই সুরে কথা বলতে শুরু করে, তখন বুঝতে হবে প্রযুক্তির এই ক্ষমতাকে চাইলে খারাপ উদ্দেশ্যেও ব্যবহার করা সম্ভব।

বর্তমানে অনলাইন গেমে মানুষের মেজাজ বুঝতে স্বয়ংক্রিয় প্রযুক্তি ব্যবহার হচ্ছে
ছবি: অনলাইন গেমার / মিডিয়াম

সবচেয়ে ভয়ের বিষয় হলো, আমাদের কণ্ঠস্বরের নমুনা এখন সবখানেই ছড়িয়ে আছে। আমরা কাউকে ভয়েস মেসেজ পাঠাই কিংবা কাস্টমার কেয়ারে কথা বলি, সবই কিন্তু রেকর্ড হয়ে থাকছে। আমাদের অনলাইন পোস্ট বা কেনাকাটার তথ্যের মতো এই ভয়েস রেকর্ডগুলোও আমাদের একধরনের ডিজিটাল ফুটপ্রিন্ট হিসেবে রয়ে যায়।

ভবিষ্যতে যদি কোনো বড় বিমা কোম্পানি এআই ব্যবহার করে আপনার কণ্ঠস্বর বিশ্লেষণ করে এবং আপনার শারীরিক বা আর্থিক অবস্থা বুঝে সেবার দাম বাড়িয়ে দেয়, তবে তাদের আটকানোর মতো শক্ত কোনো ব্যবস্থা কি আমাদের আছে? বাকস্ট্রোম সতর্ক করে বলেছেন, ‘এই বিষয়গুলো নিয়ে কথা বলা মানে প্যান্ডোরার বাক্স খুলে দেওয়ার মতো; যা অপরাধীদেরও এই নতুন প্রযুক্তির ব্যাপারে সচেতন করে তুলতে পারে।’ তবুও তিনি কথা বলছেন, কারণ গোপনীয়তা নষ্ট করার মতো অনেক মেশিন লার্নিং টুল বা সরঞ্জাম বর্তমানে বেশ সহজলভ্য। সাধারণ মানুষকে এই বিপদ সম্পর্কে এখনই সচেতন হতে হবে। তা না হলে বড় বড় করপোরেশন ও নজরদারি রাষ্ট্রগুলো আমাদের ব্যক্তিগত জীবনের ওপর পুরোপুরি নিয়ন্ত্রণ নিয়ে নেবে। পরিস্থিতি হতাশাজনক মনে হলেও সঠিক সচেতনতাই পারে এই ঝুঁকি মোকাবিলা করতে।

গ্রাহক সেবা থেকে শুরু করে ভয়েস মেইল কিংবা ভয়েস মেমো—সবখানেই রেকর্ড হচ্ছে আমাদের কথা
ছবি: টেরো ভেসালাইনেন / আলামি

আশার কথা হলো, আমাদের এই কণ্ঠস্বর সুরক্ষিত রাখার প্রযুক্তিও বর্তমানে তৈরি হচ্ছে। তবে এর প্রথম ধাপ হলো, আমাদের কণ্ঠস্বর আসলে কতটুকু তথ্য ফাঁস করে দেয়, তা সঠিকভাবে মেপে দেখা। কারণ আপনি যদি না-ই জানেন যে আপনার ঠিক কোন জিনিসটি রক্ষা করা প্রয়োজন, তবে সেটি সুরক্ষার জন্য সঠিক হাতিয়ার তৈরি করা অসম্ভব। এই ভাবনা থেকেই তৈরি হয়েছে সিকিউরিটি অ্যান্ড প্রাইভেসি ইন স্পিচ কমিউনিকেশন ইন্টারেস্ট গ্রুপ। এই গবেষক দলটির কাজ হলো একটি সুনির্দিষ্ট কাঠামো তৈরি করা, যার মাধ্যমে বোঝা যাবে আমাদের কথার ভেতরে ব্যক্তিগত তথ্যের পরিমাণ আসলে কতটুকু।

গবেষকদের মতে, সুরক্ষার একটি কার্যকর উপায় হতে পারে কেবল প্রয়োজনীয় তথ্যটুকু আদান-প্রদান করা। ধরুন, আপনি কোনো কাস্টমার কেয়ারে কথা বলছেন। সেখানে আপনার পুরো কণ্ঠস্বর রেকর্ড না করে প্রযুক্তি কেবল আপনার প্রয়োজনীয় কথাটুকুকে টেক্সট বা লেখায় রূপান্তর করে নিতে পারে। অর্থাৎ আপনার ফোন আপনার কথাকে সরাসরি অডিও হিসেবে না পাঠিয়ে কেবল তথ্যের একটি সারি হিসেবে পাঠাবে। এতে আপনার গলার স্বর, আবেগ বা ব্যক্তিগত বৈশিষ্ট্যগুলো অন্য প্রান্তে পৌঁছাবে না। বাকস্ট্রোমের ভাষায়, ‘কোনো সেবা পাওয়ার জন্য যতটুকু তথ্য প্রয়োজন, ঠিক ততটুকুই কেবল আদান-প্রদান হওয়া উচিত।’

আপনার কণ্ঠস্বর রেকর্ড না করে প্রযুক্তি কেবল আপনার প্রয়োজনীয় কথাটুকুকে লেখায় রূপান্তর করে নিতে পারে
ছবি: নিয়ারিটি

তবে গোপনীয়তা রক্ষার মানে এই নয় যে সব তথ্য মুছে ফেলতে হবে। বরং ঠিক কোন তথ্যটুকু সংগ্রহ করা হচ্ছে এবং সেটি কী উদ্দেশ্যে ব্যবহার করা হচ্ছে, তা নিশ্চিত করাই হলো মূল লক্ষ্য। যদি এই প্রযুক্তির সঠিক রক্ষণাবেক্ষণ ও নৈতিক ব্যবহার নিশ্চিত করা যায়, তবে এটি মানুষের অনেক কাজে আসবে। বাকস্ট্রোম আশাবাদী যে ভবিষ্যতে এমন স্পিচ প্রযুক্তি তৈরি করা সম্ভব হবে, যা মানুষের কথা বলার ধরন বুঝে নিজেকে মানিয়ে নেবে এবং যার ব্যবহার হবে অনেক বেশি স্বাভাবিক ও নিরাপদ।

লেখক: প্রদায়ক, বিজ্ঞানচিন্তা

সূত্র: লাইভ সায়েন্স

