কৃত্রিম বুদ্ধিমত্তার অগ্রদূত ইয়ান লেকুনের সিএনএন

ইয়ান লেকুনছবি: ফ্রেঞ্চ মর্নিং

মনে করুন, আপনি নোটখাতায় নিজ হাতে কলম দিয়ে কিছু লিখেছেন। সে ক্ষেত্রে কম্পিউটার কি করে আপনার হাতের লেখা পড়বে? কয়েক দশক আগেও এটিকে অসম্ভব বলে মনে করা হতো। সেই প্রযুক্তিগত সক্ষমতা তখন ছিল না। কিন্তু এক তরুণ বিজ্ঞানীর স্বপ্ন আর অধ্যবসায় এই অসম্ভবকে সম্ভব করে তোলে। তিনি ইয়ান লেকুন, যাঁর উদ্ভাবনী গবেষণায় ভর করে ডিপ লার্নিং এর একটি অংশ—কনভোল্যুশনাল নিউরাল নেটওয়ার্কের মাধ্যমে হাতের লেখা শনাক্ত করতে পারবে। যেকোনো হাতের লেখা শনাক্ত করা কঠিন। তাই লেকুন প্রথমে শুধু সংখ্যাকে শনাক্ত করার কাজে হাত দিলেন। এতে সফল হওয়ার মাধ্যমে কৃত্রিম বুদ্ধিমত্তার জগতে এক নতুন সূচনা এল। আজ সেই গল্পই বলব।

কে এই ইয়ান লেকুন

ইয়ান লেকুন বড় হয়েছেন ফ্রান্সের প্যারিস শহরতলিতে। শৈশব থেকেই ইলেকট্রনিকস আর যন্ত্রের প্রতি তাঁর ছিল প্রবল আগ্রহ। তরুণ বয়সে বিজ্ঞান কল্পকাহিনি চলচ্চিত্রে দেখা বুদ্ধিমান কম্পিউটার তাঁকে মুগ্ধ করেছিল। তখন থেকেই স্বপ্ন দেখতেন, কীভাবে কম্পিউটারকে মানুষের মস্তিষ্কের মতো শিখতে ও চিনতে শেখানো যায়। সমসাময়িক বিজ্ঞানীরা যে ধরনের পদ্ধতিতে এটি করার চেষ্টা করছিলেন, তা নয়; বরং তুলনামূলক অপরিচিত ‘নিউরাল নেটওয়ার্ক’ পদ্ধতি বেছে নেন তিনি। সেই সময় যখন অনেক বিজ্ঞানী নিউরাল নেটওয়ার্কের ক্ষমতা নিয়ে সন্দিহান ছিলেন, কিন্তু লেকুন তাঁর বিশ্বাস আঁকড়ে ছিলেন যে সঠিক পদ্ধতিতে ট্রেনিং করালে এই নেটওয়ার্ক মানুষের মতো শিখতে পারবে।

ছবি: ইয়ান লেকুন; সূত্র: উইকিপিডিয়া

৮০-এর দশকের শেষে লেকুন তাঁর পিএইচ.ডি. গবেষণায় মেশিন লার্নিংয়ে মনোনিবেশ করেন এবং কৃত্রিম নিউরাল নেটওয়ার্কের ওপর কাজ শুরু করেন। পিএইচ.ডি. শেষ করার পর, ১৯৮৮ সালে যুক্তরাষ্ট্রের বিখ্যাত এটিঅ্যান্ডটি বেল ল্যাবসে গবেষক হিসেবে যোগ দেন তিনি। সেখানেই একদল মেধাবী সহকর্মীর সঙ্গে মিলে এমন এক কম্পিউটার মডেল বানানোর কাজে নামেন, যা মানুষের মতো দৃশ্যমান তথ্য শিখতে সক্ষম। 

কনভোল্যুশনাল নিউরাল নেটওয়ার্ক কী

কনভোল্যুশনাল নিউরাল নেটওয়ার্ক বা সিএনএন আসলে ডিপ লার্নিংয়ের একটি বিশেষ ধরনের মডেল। বিশেষভাবে ছবির মতো তথ্য বিশ্লেষণের জন্য এটি ডিজাইন করা হয়েছে। আবার ভুল করে সিএনএন টিভি চ্যানেল ভাববেন না যেন! তবে একই নাম বলে সম্ভবত মনে রাখাটা সহজ, তাই না?

প্রশ্ন হলো, সিএনএন ছবি, হাতের লেখা বা সংখ্যা চেনার সময় কীভাবে কাজ করে? এটি পুরো ছবিটিকে ছোট ছোট অংশে ভাগ করে প্রতিটি অংশের নির্দিষ্ট বৈশিষ্ট্য (যেমন ধারের রেখা, কোণ, গোলাকার আকৃতি ইত্যাদি) খুঁজে বের করে। ঠিক যেমন আমরা কোনো বড় ছবি দেখতে গিয়ে প্রথমে বিভিন্ন টুকরো উপাদান (লাইন, বিন্দু, আকার) দেখি, সিএনএন সেরকম ছোট বৈশিষ্ট্যগুলো শনাক্ত করতে পারে। প্রতিটি স্তরে (লেয়ার) এই নেটওয়ার্ক আরও জটিল বৈশিষ্ট্য শিখে ফেলে। প্রথমে সরল রেখা চেনা, পরে সেই রেখা দিয়ে সংখ্যার আকার তৈরি হয়েছে কি না, তা বোঝা ইত্যাদি। এভাবে স্তরে স্তরে শিখতে শিখতে শেষ পর্যন্ত পুরো ছবিতে কোন সংখ্যাটি লেখা আছে, তা নির্ণয় করতে পারে এই মডেল।

ঠিক যেমন আমরা কোনো বড় ছবি দেখতে গিয়ে প্রথমে বিভিন্ন টুকরো উপাদান (লাইন, বিন্দু, আকার) দেখি, সিএনএন সেরকম ছোট বৈশিষ্ট্যগুলো শনাক্ত করতে পারে। প্রতিটি স্তরে (লেয়ার) এই নেটওয়ার্ক আরও জটিল বৈশিষ্ট্য শিখে ফেলে। প্রথমে সরল রেখা চেনা, পরে সেই রেখা দিয়ে সংখ্যার আকার তৈরি হয়েছে কি না, তা বোঝা ইত্যাদি। এভাবে স্তরে স্তরে শিখতে শিখতে শেষ পর্যন্ত পুরো ছবিতে কোন সংখ্যাটি লেখা আছে, তা নির্ণয় করতে পারে এই মডেল

সিএনএনের এই কাঠামো মানব মস্তিষ্কের দেখার প্রক্রিয়ার অনুকরণে তৈরি। মানুষের মস্তিষ্ক এবং দৃষ্টিশক্তি যেভাবে ধাপে ধাপে বস্তু চেনে, সিএনএন সেভাবে পিক্সেলের ডেটা থেকে নিজে নিজে বিভিন্ন বৈশিষ্ট্য শেখে। তাই একে কনভোল্যুশনাল (অর্থাৎ ভাঁজ করে নেওয়া বা কনভোল্যুশন প্রক্রিয়া ব্যবহারকারী) বলা হয়। কারণ এটি ছবির ওপর ছোট ছোট চলমান ফিল্টার (মাস্কের মতো) ব্যবহার করে স্ক্যান করে। এই ফিল্টারগুলো ছবি থেকে গুরুত্বপূর্ণ বৈশিষ্ট্য বের করে আনে এবং পরে সেগুলো সংকলন করে চূড়ান্ত সিদ্ধান্তে আসে কোন ডিজিট বা বস্তুর ছবি ছিল ওটা।

সিএনএন-এর আরেকটি গুণ হলো, ছবির কোন অংশে কোনো বৈশিষ্ট্য আছে, সেটি নির্দিষ্ট জায়গায় থাকল কি না, তা নিয়ে বেশি চিন্তা না করে বৈশিষ্ট্যটির উপস্থিতি শনাক্ত করতে পারা। এই পদ্ধতিকে ওজন ভাগাভাগি বা ওয়েট শেয়ারিং বলা হয়। ফলে একটি নির্দিষ্ট সংখ্যা (ধরা যাক ৫) ছবির মাঝখানে থাকুক বা কোণায়, সিএনএন সেটি ধরতে পারে। কারণ ৫-এর আকৃতিগত বৈশিষ্ট্যগুলো যেখানেই থাকুক না কেন, একই রকম থাকে। এই বৈশিষ্ট্যের কারণে সিএনএন আগের সাধারণ ফিড-ফরওয়ার্ড নিউরাল নেটওয়ার্কের তুলনায় ছবি শনাক্তকরণে অনেক বেশি কার্যকর।

ছবি: বাঁয়ে একটি জেব্রার ছবিকে সিএনএন প্রযুক্তি ধাপে ধাপে বিশ্লেষণ করছে এবং বিভিন্ন প্রাণী হিসাবে শনাক্ত করছে (অর্থাৎ বিভিন্ন প্রাণীর বৈশিষ্ট্যের সঙ্গে মেলাচ্ছে)। সম্ভাবনাগুলোর মধ্যে এটির জেব্রা হওয়ার সম্ভাবনার হার বেশি বলে পরিশেষে ওটাকে জেব্রা হিসেবেই দেখাচ্ছে ফলাফলে।

বর্তমানে সিএনএন আর কেবল তত্ত্বে সীমাবদ্ধ নয়, আধুনিক কম্পিউটার ভিশন ও ছবি শনাক্তকরণের প্রায় সব বড় ক্ষেত্রে এটি ব্যবহৃত হচ্ছে। উদাহরণস্বরূপ বলা যায়, স্মার্টফোন বা নিরাপত্তা ক্যামেরায় মুখের ছবি থেকে ব্যক্তিকে শনাক্ত করতে এই মডেল ব্যবহৃত হচ্ছে। স্বচালিত গাড়ির ক্যামেরা সেন্সর রাস্তার পথ, সাইনবোর্ড, পথচারী ইত্যাদি চিনতে এই প্রযুক্তিই ব্যবহার করে। এমনকি চিকিৎসা ক্ষেত্রে বিভিন্ন ডায়াগনোস্টিকের ছবি বিশ্লেষণে ব্যবহৃত হচ্ছে এটি। এমআরআই বা এক্স-রের মতো মেডিক্যাল স্ক্যানে টিউমার বা অসুখের লক্ষণ খুঁজে বের করতেও ব্যবহৃত হচ্ছে সিএনএন মডেল।

লিনেট এবং হাতে লেখা সংখ্যা শনাক্তকরণ

১৯৮০-এর দশকজুড়ে কম্পিউটার দিয়ে হাতে লেখা পাঠোদ্ধারের চেষ্টা চলছিল, তবে সাফল্য ছিল খুব সীমিত। কোনো কম্পিউটারকে একটা হাতে লেখা ৭ আর ৯-এর পার্থক্য বোঝানো তখনকার নিয়মভিত্তিক প্রোগ্রামে খুব কঠিন ছিল। স্বাভাবিক, বিভিন্ন মানুষের লেখা একই সংখ্যাও দেখতে ভিন্ন ভিন্ন হয়। এই চ্যালেঞ্জ গ্রহণ করেন ইয়ান লেকুন। বেল ল্যাবসে তিনি এমন এক বিশেষ নিউরাল নেটওয়ার্ক তৈরিতে মন দেন, যা সরাসরি পিক্সেল ডেটা (স্ক্যান করা ছবির পিক্সেলের মান) থেকে শিখে নিতে পারবে ছবিতে কোন সংখ্যা লেখা আছে।

১৯৮৯ সালে লেকুন এবং তাঁর সহকর্মীরা প্রথমবারের মতো বাস্তবে একটি কনভোল্যুশনাল নিউরাল নেটওয়ার্ক মডেলকে হাতে লেখা সংখ্যার স্বয়ংক্রিয় শনাক্তকরণে সফলভাবে প্রয়োগ করেন। তাঁরা একটি সিএনএনকে ব্যাকপ্রোপাগেশন নামে বিশেষ একধরনের শেখার অ্যালগরিদম দিয়ে প্রশিক্ষণ দিয়ে এত দক্ষ করে তুলেছিলেন যে এটি যুক্তরাষ্ট্রের ডাক বিভাগের সরবরাহকৃত চিঠির খামে লেখা ডাক কোড (মূল নাম, জিপ কোড) নির্ভুলভাবে শনাক্ত করতে সক্ষম হয়। এই সিস্টেমটিই পরে লিনেট-১ (LeNet-1) নামে পরিচিত হয়ে ওঠে। বিশ্বে প্রথম সফল সিএনএনের বাস্তব ব্যবহার হিসাবে গণ্য করা হয় একে।

একই বছর লেকুন একটি গবেষণাপত্রে দেখান, সাধারণ একস্তরের নিউরাল নেটওয়ার্ক হাতে লেখা সংখ্যা শনাক্তকরণে খুব দুর্বল, কিন্তু কনভোল্যুশনাল নেটওয়ার্কের মতো বহু স্তরবিশিষ্ট এবং উপযুক্ত নিয়মকানুনযুক্ত নেটওয়ার্ক সেই একই কাজ অত্যন্ত ভালোভাবে করতে পারে। তখনকার সময়ে যে সব বিজ্ঞানীরা নিউরাল নেটওয়ার্ক নিয়ে সন্দেহ পোষণ করতেন, এই ফলাফল তাঁদের প্রমাণ করে দেখাল, সঠিক নকশা ও সীমাবদ্ধতা দিয়ে মডেল ট্রেনিং করালে দক্ষতা অনেকাংশে বৃদ্ধি পায়।

এই ডেটাসেটে হাজারো মানুষের লিখিত ০ থেকে ৯ পর্যন্ত সংখ্যার প্রায় ৬০ হাজার উদাহরণ প্রশিক্ষণের জন্য এবং ১০ হাজার উদাহরণ পরীক্ষণের জন্য রাখা হয়েছিল, যাতে বিভিন্ন মডেলের উন্নতির তুলনা করা যায়। এই ডেটাসেট আসার পর আগের ছোট মডেল লিনেট-১ আর যথেষ্ট হলো না। তাই লেকুনের দল নতুন মডেল লিনেট-৪ তৈরি করেন

এরপর ১৯৯০ সালে লেকুনের দল তাঁদের মডেলকে আরও উন্নত করে। পরীক্ষায় দেখা যায়, হাতে লেখা ডাক কোড চেনার ক্ষেত্রে মডেলের ভুলের হার মাত্র প্রায় ১% (অর্থাৎ ৯৯% সঠিক), যদিও প্রায় ৯% ক্ষেত্রে মডেল নিশ্চিত না হয়ে কোনো ফলাফল দিচ্ছিল না। বর্তমানে এটি কোনো আহামরি কাজ বলে মনে না হলেও সেই সময়ের জন্য এটি ছিল অবিশ্বাস্য এক সাফল্য। ১৯৯২-৯৩ নাগাদ প্রযুক্তিটি এত অগ্রগতি লাভ করে যে যুক্তরাষ্ট্রে ব্যাংক চেক প্রক্রিয়াকরণেও নিউরাল নেটওয়ার্ক ব্যবহার করার উদ্যোগ নেওয়া হয়।

লেকুন বেল ল্যাবসে সহকর্মী লেওন বত্তু ও ইয়োশুয়া বেঙ্গিও প্রমুখের সঙ্গে মিলে ক্রমাগত মডেলটি উন্নত করতে থাকেন। ১৯৯৪ সালে তাঁরা হাতে লেখা সংখ্যার জন্য তৈরি করেন একটি নতুন বৃহৎ ডেটাসেট, নাম এমএনআইএসটি (MNIST)। এই ডেটাসেটে হাজারো মানুষের লিখিত ০ থেকে ৯ পর্যন্ত সংখ্যার প্রায় ৬০ হাজার উদাহরণ প্রশিক্ষণের জন্য এবং ১০ হাজার উদাহরণ পরীক্ষণের জন্য রাখা হয়েছিল, যাতে বিভিন্ন মডেলের উন্নতির তুলনা করা যায়। এই ডেটাসেট আসার পর আগের ছোট মডেল লিনেট-১ আর যথেষ্ট হলো না। তাই লেকুনের দল নতুন মডেল লিনেট-৪ তৈরি করেন। পরের বছর আরও উন্নত লিনেট-৫ আর্কিটেকচার (মডেলের গঠন) উন্মোচন করেন তাঁরা। এটি সেই সময়ের প্রচলিত সব পদ্ধতিকে পেছনে ফেলে হাতে লেখা ডিজিট শনাক্তের কাজে সেরা ফল দেয়।

লিনেট-৫ শুধু গবেষণাগারে সীমাবদ্ধ থাকেনি, বাস্তবেও এর ব্যবহার শুরু হয়। ১৯৯৬ সালের দিকে এটিঅ্যান্ডটির অঙ্গপ্রতিষ্ঠান এনসিআর একটি মেশিন তৈরি করে। সেটা ব্যাংকের চেক স্ক্যান করে স্বয়ংক্রিয়ভাবে হাতে লেখা টাকার সংখ্যাটি শনাক্ত করে পড়তে পারত

লিনেট-৫ শুধু গবেষণাগারে সীমাবদ্ধ থাকেনি, বাস্তবেও এর ব্যবহার শুরু হয়। ১৯৯৬ সালের দিকে এটিঅ্যান্ডটির অঙ্গপ্রতিষ্ঠান এনসিআর একটি মেশিন তৈরি করে। সেটা ব্যাংকের চেক স্ক্যান করে স্বয়ংক্রিয়ভাবে হাতে লেখা টাকার সংখ্যাটি শনাক্ত করে পড়তে পারত। কয়েক বছরের মধ্যেই মার্কিন যুক্তরাষ্ট্রে ব্যাংকগুলোর চেক প্রক্রিয়াকরণের ১০%-এরও বেশি কাজ এমন নিউরাল নেটওয়ার্কভিত্তিক সিস্টেম দিয়ে সম্পন্ন হতে লাগল। ১৯৯৮ সালের দিকে লেকুন ও তাঁর সহকর্মীরা দুটি উদ্ভাবনী পদ্ধতির প্রদর্শনী করেন—একটি সিস্টেম অনলাইনে (রিয়েল-টাইম) হাতে লেখা অক্ষর চিনতে পারে, আরেকটি মডেল প্রতিদিন লাখ লাখ চেক স্বয়ংক্রিয়ভাবে পড়ে দিতে পারে। এটি ছিল হাতের লেখা শনাক্ত করার ক্ষেত্রে এক অভূতপূর্ব অর্জন। এই সাফল্য নবীন-প্রবীণ সব গবেষকের মাঝে সাড়া জাগিয়ে তোলে, বহু গবেষক নিউরাল নেটওয়ার্কের গবেষণায় নতুন উদ্যমে অংশ নিতে শুরু করেন।

ডিপ লার্নিং যুগে লেকুনের প্রভাব

ইয়ান লেকুনের এই প্রাথমিক সাফল্যগুলোই আসলে পরে ‘ডিপ লার্নিং’ বিপ্লবের বীজ বপন করেছিল। হাতে লেখা ডিজিট চিনতে লিনেট-এর সাফল্য প্রমাণ করল, গভীর স্তরের নিউরাল নেটওয়ার্ক বাস্তব জগতের জটিল সমস্যা সমাধানেও সক্ষম। যথেষ্ট ডেটা এবং কম্পিউটিং শক্তি পেলে এ ধরনের মডেল নিজে থেকে বৈশিষ্ট্য শেখার ক্ষমতা অর্জন করতে পারে, তাতে মানুষের হাতের তৈরি নিয়মের আর প্রয়োজন হয় না। নব্বইয়ের দশকের শেষ থেকে ২০০০ দশকের শুরুর দিকে কিছুদিনের জন্য এই ধারার গতি মন্থর হয়ে গেল। কম্পিউটারের সীমিত ক্ষমতা ও পর্যাপ্ত ডেটার অভাব তখন ছিল বড় বাধা। কিন্তু ২০১০-এর দশকে পরিস্থিতি বদলায়; বড় ডেটাসেট এবং শক্তিশালী গ্রাফিকস প্রসেসিং ইউনিট সহজলভ্য হওয়ায় সিএনএনভিত্তিক আরও গভীর নেটওয়ার্কের নতুন জয়যাত্রা শুরু হয়। (ইয়ান লেকুনের বিভিন্ন কাজ দেখা যাচ্ছে দ্যা এডেজ-এর নিচের ছবিতে।)

ছবি: ইয়ান লেকুনের আবিষ্কারগুলো
সূত্র: দ্যা এডেজ

সমসাময়িক সময়ে, ২০১০ সালে ছবি শনাক্ত করার জন্য ফেই-ফেই লির দল ইমেইজনেট নামে একটি প্রতিযোগিতার আয়োজন করেন। এ তথ্যভাণ্ডারে প্রায় ১.৫ কোটি ছবি ছিল। ছবিগুলো বিষয়বস্তুর ওপর ভিত্তি করে ২২ হাজার শ্রেণিতে ভাগ করা ছিল। ২০১০ সালে সফলতার হার ছিল মাত্র ৭০% এবং পরের বছর এই হার বেড়ে দাঁড়ায় ৭৫%। কিন্তু ইয়ান লেকুন ২০১২ সালে এই প্রতিযোগিতায় ঐতিহাসিক সাফল্য অর্জন করেন, যা কম্পিউটার ভিশন গবেষণার ধারাকে সম্পূর্ণ বদলে দেয়। এটিকে লিনেট-এ উদ্ভাবিত ধারণাগুলোর এক বৃহত্তর বিজয় বলা যায়। লেকুনের প্রবর্তিত কৌশলগুলোর ভিত্তিতে আরও গভীর ও শক্তিশালী নেটওয়ার্ক বানিয়ে আজকের কৃত্রিম বুদ্ধিমত্তার সিস্টেমগুলো ছবি থেকে মুখ চিনতে বা গাড়িকে রাস্তা চেনাতে দক্ষ হয়ে উঠেছে। (ইমেজনেট নিয়ে বিস্তারিত পড়ুন: কৃত্রিম বুদ্ধিমত্তা ছবি শনাক্ত করতে শিখল কীভাবে: পর্ব ১পর্ব ২)

আরও পড়ুন
আরও পড়ুন

ডিপ লার্নিংয়ের এই অগ্রগতির পেছনে ইয়ান লেকুনের ভূমিকা আরও দুই পথপ্রদর্শক জিওফ্রি হিন্টন ও ইয়োশুয়া বেঙ্গিওর সঙ্গে তুলনীয়। এই তিনজনকে আধুনিক কৃত্রিম বুদ্ধিমত্তার ‘গডফাদার’ বলা হয় এবং ২০১৮ সালে তাঁরা যৌথভাবে কম্পিউটার বিজ্ঞানের সর্বোচ্চ সম্মান ট্যুরিং পুরস্কার অর্জন করেন ডিপ লার্নিং পদ্ধতির বিকাশে অনন্য অবদানের জন্য। লেকুনের গবেষণা শুধু সিএনএনেই সীমাবদ্ধ ছিল না। তিনি বেল ল্যাবসে থাকাকালীন নিউরাল নেটওয়ার্কের অপ্রয়োজনীয় সংযোগ ছেঁটে ফেলার একটি পদ্ধতি উদ্ভাবন করেন, যার নাম অপটিমাল ব্রেইন ড্যামেজ। এ ছাড়া তিনি সহকর্মীদের সঙ্গে মিলে অপটিক্যাল চরিত্র শনাক্তকরণের জন্য গ্রাফ ট্রান্সফর্মার নেটওয়ার্ক পদ্ধতিও আবিষ্কার করেন। বর্তমানে ইয়ান লেকুন ফেসবুক তথা মেটার প্রধান কৃত্রিম বুদ্ধিমত্তা-বিজ্ঞানী হিসেবে দায়িত্ব পালন করছেন এবং আরও উন্নত কৃত্রিম বুদ্ধিমত্তা অ্যালগরিদম নিয়ে নিরন্তর গবেষণা চালিয়ে যাচ্ছেন।

ইয়ান লেকুনের পথচলা তরুণ শিক্ষার্থী ও উদ্ভাবকদের জন্য এক অসাধারণ অনুপ্রেরণার উদাহরণ। সনাতন ধারার বিজ্ঞানীরা নিউরাল নেটওয়ার্ক দিয়ে কম্পিউটারকে শেখানোর কথা সেই সময়ে ভাবেননি, কিন্তু লেকুনের দৃঢ় বিশ্বাস ও অধ্যবসায় সেই প্রযুক্তিকে কৃত্রিম বুদ্ধিমত্তার মূলধারায় পরিণত করেছেন। মেশিনকে হাতে লেখা সংখ্যা চিহ্নিত করতে শেখার মাধ্যমে যে যাত্রা শুরু হয়েছিল, তারই ধারাবাহিকতায় আজ আমাদের স্মার্টফোনের মুখ চিনতে পারা সফটওয়্যার, স্বচালিত গাড়ির ‘দেখা’ বা চিকিৎসা সেবা সংক্রান্ত ছবিতে রোগ নির্ণয়ে সক্ষম কৃত্রিম বুদ্ধিমত্তা—সবকিছুর পিছনে রয়েছে লেকুনের উদ্ভাবিত কনভোল্যুশনাল নেটওয়ার্কের মূ্লনীতি। লেকুনের জীবনের গল্পটি প্রমাণ করে, সাহসী চিন্তা ও কঠোর পরিশ্রম কীভাবে বিজ্ঞানের ইতিহাসে যুগান্তকারী পরিবর্তন আনতে পারে। আজকের কিশোর-কিশোরী কিংবা নবীন শিক্ষার্থীদের মধ্য থেকেই হয়তো আগামী দিনের ইয়ান লেকুন বেরিয়ে আসবেন, যাঁর কল্পনা ও উদ্ভাবন বিশ্বকে আবার নতুন কোনো প্রযুক্তির আলোয় আলোকিত করবে।

লেখক: ইঞ্জিনিয়ারিং ম্যানেজার, ওমরণ হেলথকেয়ার, সিঙ্গাপুর

(স্বাস্থ্যসেবায় কৃত্রিম বুদ্ধিমত্তার প্রয়োগ নিয়ে কাজ করেন)

 

সূত্র: ১. ইয়ান লেকুনের গবেষণা প্রবন্ধ

২. আর্টিফিসিয়াল ইন্টেলিজেন্স, মেলানিয়ে মিচেল

আরও পড়ুন