কণ্ঠস্বরই কি আপনার গোপনীয়তার সবচেয়ে বড় হুমকি

আপনার কণ্ঠস্বর কি তবে আপনার ব্যক্তিগত তথ্য ফাঁস করছে?ছবি: ইয়ারোস্লাভ কুশ্তা / গেটি ইমেজ

আপনার কণ্ঠস্বর এখন আর শুধু কথা বলার মাধ্যম নয়। একজন কণ্ঠ বিশেষজ্ঞ আপনার কথা বলার ধরন শুনেই অনেক কিছু বলে দিতে পারেন। আপনার শিক্ষা, মানসিক অবস্থা, এমনকি পেশা বা আর্থিক অবস্থাও তাঁর কাছে স্পষ্ট হয়ে উঠতে পারে। বিষয়টি শুনতে অদ্ভুত মনে হলেও বিজ্ঞানীরা এখন এক বড় আশঙ্কার কথা জানাচ্ছেন। তাঁরা বলছেন, কৃত্রিম বুদ্ধিমত্তা আপনার গলার স্বর বিশ্লেষণ করে আপনার অজান্তেই একটি নিখুঁত ব্যক্তিগত প্রোফাইল তৈরি করে ফেলতে পারে। এর ফলে এই প্রযুক্তি ব্যবহার করে অন্যের কাছ থেকে অন্যায্য সুবিধা নেওয়া বা আপনাকে হয়রানি করার সুযোগ তৈরি হতে পারে।

মানুষ কথা বলার সময় অন্যের ক্লান্তি, দুশ্চিন্তা বা আনন্দ বেশ সহজেই বুঝতে পারে। কিন্তু কম্পিউটার বা এআই এই কাজটি করতে পারে আরও দ্রুত এবং মানুষের চেয়েও অনেক বেশি নিখুঁতভাবে। নতুন এক গবেষণা বলছে, আপনার কথা বলার ধরন থেকে অনেক কিছুই জানা সম্ভব। এমনকি আপনার ব্যবহৃত শব্দগুলো থেকে আপনার মনের খবরও পাওয়া যায়। এর মাধ্যমে আপনার রাজনৈতিক পছন্দ যেমন বোঝা যায়, তেমনি শরীরের জটিল কোনো রোগ বা স্বাস্থ্যের অবস্থা সম্পর্কেও আগাম ধারণা পাওয়া সম্ভব।

কৃত্রিম বুদ্ধিমত্তা আপনার গলার স্বর বিশ্লেষণ করে আপনার অজান্তেই একটি ব্যক্তিগত প্রোফাইল তৈরি করে পারে
ছবি: রেডিট

গত ১৯ নভেম্বর যুক্তরাষ্ট্রের প্রসিডিংস অব দ্য আইইইই জার্নালে এ সংক্রান্ত একটি গবেষণা প্রকাশিত হয়। গবেষকদের সবচেয়ে বড় উদ্বেগ হলো, প্রযুক্তির এই ক্ষমতা যদি ভুল পথে ব্যবহৃত হয়, তবে তা আমাদের ব্যক্তিগত গোপনীয়তার জন্য মারাত্মক হুমকি হয়ে দাঁড়াতে পারে।

আরও পড়ুন
নতুন এক গবেষণা বলছে, আপনার কথা বলার ধরন থেকে অনেক কিছুই জানা সম্ভব। এমনকি আপনার ব্যবহৃত শব্দগুলো থেকে আপনার মনের খবরও পাওয়া যায়।

কণ্ঠস্বর শনাক্তকরণ প্রযুক্তি আমাদের জন্য অনেক সুযোগ তৈরি করলেও এর পেছনে লুকিয়ে আছে বড় এক ঝুঁকি। ফিনল্যান্ডের আল্টো বিশ্ববিদ্যালয়ের সহযোগী অধ্যাপক ও এই গবেষণার প্রধান লেখক টম বাকস্ট্রোম একটি গুরুতর আশঙ্কার কথা জানিয়েছেন। তাঁর মতে, কোনো বাণিজ্যিক প্রতিষ্ঠান যদি আপনার কণ্ঠস্বর বিশ্লেষণ করে আপনার আর্থিক অবস্থা বা প্রয়োজনের কথা বুঝে ফেলে, তবে তারা সেটিকে আপনার বিরুদ্ধেই ব্যবহার করতে পারে। ধরুন, আপনার গলার স্বর শুনে কোনো এআই বুঝে ফেলল আপনি আর্থিকভাবে বেশ সচ্ছল। অথবা আপনার কথা শুনে মনে হলো, এই মুহূর্তে আপনার কোনো সেবা খুব জরুরি। এমন পরিস্থিতিতে বিমা কোম্পানিগুলো আপনার জন্য সেবার দাম বাড়িয়ে দিতে পারে। আপনার কণ্ঠস্বরের ওপর ভিত্তি করে নেওয়া এই অন্যায্য সুযোগকেই বলা হয় ডিজিটাল বৈষম্য।

কণ্ঠস্বর আমাদের ব্যক্তিগত তথ্য ফাঁস করতে পারে, যা সাইবার অপরাধীরা ব্যবহার করে নির্দিষ্ট ব্যাক্তিকে শনাক্ত করতে পারে
ছবি: লিঙ্কডইন

ঝুঁকি এখানেই শেষ নয়। আমাদের কণ্ঠস্বর আমাদের মানসিক দুর্বলতা, লিঙ্গপরিচয় ও আরও অনেক ব্যক্তিগত তথ্য ফাঁস করে দিতে পারে। সাইবার অপরাধীরা বিভিন্ন প্ল্যাটফর্মে এই তথ্য ব্যবহার করে নির্দিষ্ট ব্যক্তিকে খুঁজে বের করতে পারে। ফলে ব্যক্তিগত জীবনে হয়রানি বা ব্ল্যাকমেইলের মতো ঘটনা ঘটার আশঙ্কা বেড়ে যায়। আমরা যখন কথা বলি, তখন অবচেতনভাবেই এই তথ্যগুলো অন্যের কাছে পৌঁছে দিই এবং আমাদের মস্তিষ্কও অন্যের কণ্ঠের প্রতি অবচেতনভাবেই সাড়া দেয়।

আরও পড়ুন
টম বাকস্ট্রোমের মতে, কোনো বাণিজ্যিক প্রতিষ্ঠান যদি আপনার কণ্ঠস্বর বিশ্লেষণ করে আপনার আর্থিক অবস্থা বা প্রয়োজনের কথা বুঝে ফেলে, তবে তারা সেটিকে আপনার বিরুদ্ধেই ব্যবহার করতে পারে।

মানুষের স্নায়ুতন্ত্র নিয়ে কাজ করছেন গবেষক জেনালিন পোনরাজ। তিনি বলেন, ‘আমরা সাধারণত শোনার বায়োলজিক্যাল দিকটি নিয়ে খুব একটা ভাবি না। কিন্তু কোনো সংকটময় মুহূর্তে মানুষ সামনের জনের ভাষার চেয়ে তার গলার স্বর, কথা বলার ছন্দ এবং শ্বাসের ওঠানামার ওপর আগে সাড়া দেয়।’ অর্থাৎ আমাদের মস্তিষ্ক কথার অর্থ বোঝার আগেই গলার সুর বা টোন বুঝে প্রতিক্রিয়া দেখায়।

অধ্যাপক বাকস্ট্রোম জানিয়েছেন, এই প্রযুক্তি এখনো হয়তো ব্যাপকভাবে ব্যবহৃত হচ্ছে না, কিন্তু এর শক্ত ভিত্তি তৈরি হয়ে গেছে। বর্তমানে অনলাইন গেমিং বা কলসেন্টারগুলোতে মানুষের রাগ বা মেজাজ বোঝার জন্য স্বয়ংক্রিয় প্রযুক্তি ব্যবহার করা হচ্ছে। প্রথম দেখায় এর উদ্দেশ্য ভালো মনে হতে পারে, তবে এর আড়ালে লুকিয়ে আছে বড় আশঙ্কা। যখন কোনো রোবট বা এআই আপনার কথা বলার ভঙ্গি নকল করে হুবহু আপনার মতোই সুরে কথা বলতে শুরু করে, তখন বুঝতে হবে প্রযুক্তির এই ক্ষমতাকে চাইলে খারাপ উদ্দেশ্যেও ব্যবহার করা সম্ভব।

বর্তমানে অনলাইন গেমে মানুষের মেজাজ বুঝতে স্বয়ংক্রিয় প্রযুক্তি ব্যবহার হচ্ছে
ছবি: অনলাইন গেমার / মিডিয়াম

সবচেয়ে ভয়ের বিষয় হলো, আমাদের কণ্ঠস্বরের নমুনা এখন সবখানেই ছড়িয়ে আছে। আমরা কাউকে ভয়েস মেসেজ পাঠাই কিংবা কাস্টমার কেয়ারে কথা বলি, সবই কিন্তু রেকর্ড হয়ে থাকছে। আমাদের অনলাইন পোস্ট বা কেনাকাটার তথ্যের মতো এই ভয়েস রেকর্ডগুলোও আমাদের একধরনের ডিজিটাল ফুটপ্রিন্ট হিসেবে রয়ে যায়।

আরও পড়ুন
কোনো রোবট বা এআই আপনার কথা বলার ভঙ্গি নকল করে হুবহু আপনার মতোই সুরে কথা বলতে শুরু করে, তখন বুঝতে হবে প্রযুক্তির এই ক্ষমতাকে চাইলে খারাপ উদ্দেশ্যেও ব্যবহার করা সম্ভব।

ভবিষ্যতে যদি কোনো বড় বিমা কোম্পানি এআই ব্যবহার করে আপনার কণ্ঠস্বর বিশ্লেষণ করে এবং আপনার শারীরিক বা আর্থিক অবস্থা বুঝে সেবার দাম বাড়িয়ে দেয়, তবে তাদের আটকানোর মতো শক্ত কোনো ব্যবস্থা কি আমাদের আছে? বাকস্ট্রোম সতর্ক করে বলেছেন, ‘এই বিষয়গুলো নিয়ে কথা বলা মানে প্যান্ডোরার বাক্স খুলে দেওয়ার মতো; যা অপরাধীদেরও এই নতুন প্রযুক্তির ব্যাপারে সচেতন করে তুলতে পারে।’ তবুও তিনি কথা বলছেন, কারণ গোপনীয়তা নষ্ট করার মতো অনেক মেশিন লার্নিং টুল বা সরঞ্জাম বর্তমানে বেশ সহজলভ্য। সাধারণ মানুষকে এই বিপদ সম্পর্কে এখনই সচেতন হতে হবে। তা না হলে বড় বড় করপোরেশন ও নজরদারি রাষ্ট্রগুলো আমাদের ব্যক্তিগত জীবনের ওপর পুরোপুরি নিয়ন্ত্রণ নিয়ে নেবে। পরিস্থিতি হতাশাজনক মনে হলেও সঠিক সচেতনতাই পারে এই ঝুঁকি মোকাবিলা করতে।

গ্রাহক সেবা থেকে শুরু করে ভয়েস মেইল কিংবা ভয়েস মেমো—সবখানেই রেকর্ড হচ্ছে আমাদের কথা
ছবি: টেরো ভেসালাইনেন / আলামি

আশার কথা হলো, আমাদের এই কণ্ঠস্বর সুরক্ষিত রাখার প্রযুক্তিও বর্তমানে তৈরি হচ্ছে। তবে এর প্রথম ধাপ হলো, আমাদের কণ্ঠস্বর আসলে কতটুকু তথ্য ফাঁস করে দেয়, তা সঠিকভাবে মেপে দেখা। কারণ আপনি যদি না-ই জানেন যে আপনার ঠিক কোন জিনিসটি রক্ষা করা প্রয়োজন, তবে সেটি সুরক্ষার জন্য সঠিক হাতিয়ার তৈরি করা অসম্ভব। এই ভাবনা থেকেই তৈরি হয়েছে সিকিউরিটি অ্যান্ড প্রাইভেসি ইন স্পিচ কমিউনিকেশন ইন্টারেস্ট গ্রুপ। এই গবেষক দলটির কাজ হলো একটি সুনির্দিষ্ট কাঠামো তৈরি করা, যার মাধ্যমে বোঝা যাবে আমাদের কথার ভেতরে ব্যক্তিগত তথ্যের পরিমাণ আসলে কতটুকু।

আরও পড়ুন
আশার কথা হলো, আমাদের এই কণ্ঠস্বর সুরক্ষিত রাখার প্রযুক্তিও বর্তমানে তৈরি হচ্ছে। তবে এর প্রথম ধাপ হলো, আমাদের কণ্ঠস্বর আসলে কতটুকু তথ্য ফাঁস করে দেয়, তা সঠিকভাবে মেপে দেখা।

গবেষকদের মতে, সুরক্ষার একটি কার্যকর উপায় হতে পারে কেবল প্রয়োজনীয় তথ্যটুকু আদান-প্রদান করা। ধরুন, আপনি কোনো কাস্টমার কেয়ারে কথা বলছেন। সেখানে আপনার পুরো কণ্ঠস্বর রেকর্ড না করে প্রযুক্তি কেবল আপনার প্রয়োজনীয় কথাটুকুকে টেক্সট বা লেখায় রূপান্তর করে নিতে পারে। অর্থাৎ আপনার ফোন আপনার কথাকে সরাসরি অডিও হিসেবে না পাঠিয়ে কেবল তথ্যের একটি সারি হিসেবে পাঠাবে। এতে আপনার গলার স্বর, আবেগ বা ব্যক্তিগত বৈশিষ্ট্যগুলো অন্য প্রান্তে পৌঁছাবে না। বাকস্ট্রোমের ভাষায়, ‘কোনো সেবা পাওয়ার জন্য যতটুকু তথ্য প্রয়োজন, ঠিক ততটুকুই কেবল আদান-প্রদান হওয়া উচিত।’

আপনার কণ্ঠস্বর রেকর্ড না করে প্রযুক্তি কেবল আপনার প্রয়োজনীয় কথাটুকুকে লেখায় রূপান্তর করে নিতে পারে
ছবি: নিয়ারিটি

তবে গোপনীয়তা রক্ষার মানে এই নয় যে সব তথ্য মুছে ফেলতে হবে। বরং ঠিক কোন তথ্যটুকু সংগ্রহ করা হচ্ছে এবং সেটি কী উদ্দেশ্যে ব্যবহার করা হচ্ছে, তা নিশ্চিত করাই হলো মূল লক্ষ্য। যদি এই প্রযুক্তির সঠিক রক্ষণাবেক্ষণ ও নৈতিক ব্যবহার নিশ্চিত করা যায়, তবে এটি মানুষের অনেক কাজে আসবে। বাকস্ট্রোম আশাবাদী যে ভবিষ্যতে এমন স্পিচ প্রযুক্তি তৈরি করা সম্ভব হবে, যা মানুষের কথা বলার ধরন বুঝে নিজেকে মানিয়ে নেবে এবং যার ব্যবহার হবে অনেক বেশি স্বাভাবিক ও নিরাপদ।

লেখক: প্রদায়ক, বিজ্ঞানচিন্তা

সূত্র: লাইভ সায়েন্স

আরও পড়ুন