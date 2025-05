এতক্ষণে যে প্রশ্নটা আপনার মনে উঁকি দিচ্ছে, সেটার কথাই এবারে—কেন ছবি শনাক্ত করা কঠিন? আসলে, একটি সাধারণ ছবিতে অনেক কিছু বিভিন্নভাবে থাকতে পারে, যা কম্পিউটারের জন্য প্রসেস করে নির্ণয় করাটা খুব সহজ কাজ নয়। সেই টিয়া পাখিটির কথাই আবার ভাবুন। এই ছবিতে পাখিটি বিভিন্নভাবে থাকতে পারে—একটু বাঁকা হয়ে, সোজা হয়ে; কিংবা ছবিটা নিজেই বাঁকা হতে পারে, আবার এতে কোণ বা অ্যাঙ্গেল ভিন্ন হতে পারে। অর্থাৎ এই একই ছবি বিভিন্ন ধরনের হতে পারে। কম্পিউটারের পক্ষে এগুলো আলাদা করা কঠিন। ছবিগুলো শনাক্ত করতে গিয়ে এত ধরনের সম্ভাবনা বিবেচনা করতে হবে, এতরকম হিসাব কষতে হবে যে সবকটি মাপজোক করে বোঝা অনেক কঠিন হয়ে পড়ে। বিজ্ঞানীদের কাছে বিষয়টা প্রথম দিকে একেবারেই অসম্ভব বলে মনে হয়েছিল।

কিন্তু আমাদের বিজ্ঞানীরা যে একটু পাগলাটে হন, সে তো আপনিও জানেন। তাঁরা কঠিন, অসম্ভব এবং চ্যালেঞ্জিং কাজ পেলে আরও বেশি উৎসাহী হয়ে ওঠেন। সেই সমস্যার সমাধান করার জন্য দিন-রাত এক করে লেগে থাকেন। নিজের কাছে যুক্তিসঙ্গত কোনো পদ্ধতি প্রথমে প্রয়োগ করে দেখেন। হয়তো ব্যর্থ হন। এরপর তিনি সেই কৌশল বিশ্লেষণ করেন; কেন ব্যর্থ হলেন, তা বৈজ্ঞানিক জার্নালে লিপিবদ্ধ করেন; আবার কেউ বৈজ্ঞানিক কনফারেন্সগুলোতে গিয়ে বক্তৃতা দেন, আলোচনা করেন। তাঁর ব্যর্থতার কথা জেনে পরে আরেক বিজ্ঞানী অন্যভাবে চেষ্টা করেন। এভাবে সেই সমস্যাটির সম্ভব্য সমাধানের দিকে বিজ্ঞানীরা এগিয়ে যান।

বিজ্ঞানীরা কীভাবে ছবি শনাক্তের সেই সমস্যার সমাধান করলেন, এ নিয়েই আজকের গল্প।

২.

ছবি শনাক্ত করার জন্য বিজ্ঞানীরা বিভিন্ন ধরনের অ্যালগরিদম তৈরি করছিলেন বেশ কবছর ধরেই। ৮০ থেকে ৯০-এর দশকের দিকে বিজ্ঞানীরা অ্যালগরিদমকেই গুরুত্ব দিয়ে এসেছেন। তাঁদের লক্ষ্য ছিল, যদি ভালো কোনো গাণিতিক অ্যালগরিদম তৈরি করা যায়, তবেই তাঁরা সফল হবেন। কিন্তু অ্যালগরিদমকে প্রশিক্ষণ দেওয়া এবং তা ঠিকমতন কাজ করছে কি না, তা পরীক্ষা করার জন্য অনেক ছবি বা তথ্যের প্রয়োজন ছিল। সেই সময়ে হাজার খানেক ছবিকে কিছু ক্যাটাগরি বা শ্রেণিতে ভাগ করে বিজ্ঞানীরা কাজটি করতেন।

তাঁদের তৈরি অ্যালগরিদম ঠিক মতো কাজ করছে কি না, তা যাচাই করার জন্য তাঁরা নানা ধরনের প্রতিযোগিতা করতেন। তেমনই একটি নামকরা প্রতিযোগিতা হলো প্যাসকেল ভিজ্যুয়াল অবজেক্ট ক্লাসেস। নামটি একটু বিদঘুটে শোনালেও সেই সময়ে বিজ্ঞানীরা এই প্রতিযোগিতার মাধ্যমেই পরীক্ষা করে দেখতেন, তাঁদের সিস্টেমটি কেমন কাজ করে। তাঁদের তৈরি কৃত্রিম বুদ্ধিমত্তা কতটা ভালোভাবে ছবি শনাক্ত করতে পারছে। ২০০৫ থেকে ২০১০ পর্যন্ত বিজ্ঞানীদের মধ্যে বেশ জনপ্রিয় ছিল এই প্রতিযোগিতা। এ ছাড়া আরও কিছু প্রতিযোগিতা ছিল—TRECVID (Text REtrieval Conference Video Retrieval), The Microsoft Research Cambridge (MSRC) Object Recognition Challenge, KTH Action Recognition Challenge, The Caltech 101 and Caltech 256 Challenges ইত্যাদি। (এখানে বলে নিই, বিজ্ঞানীরা প্রতিযোগিতার এমন বিদঘুটে নাম কেন দিতেন, তা বোঝা কঠিন।)