মানুষনামেশিন: CAPTCHA (ক্যাপচা) রচমকপ্রদ জন্মকথা ও বিবর্তন

November 18, 2025

317

সৌরভ কুণ্ডুঃ- ইন্টারনেট ব্যবহারের একেবারে প্রথম যুগে এক নতুন সমস্যা দেখা দেয়। আপনারা সবাই জানেন, ১৯৯০-এর শেষ দিকে ও ২০০০ সালের শুরুর দিকে ইন্টারনেটের জগৎ অতি দ্রুত প্রসারিত হচ্ছিল। কিন্তু সঙ্গে বাড়ছিল এক ভয়ংকর সমস্যা, কম্পিউটারের ভাষায় যাকে বলে – বট বা স্বয়ংক্রিয় প্রোগ্রাম, যার কারণেই এই সমস্যার উদ্ভব!

জানেন, এই বটের কাজের এক অদ্ভুত ধরণ ছিল, এরা আমার আপনার বিনা অনুমতিতেই হাজার হাজার ইমেল অ্যাকাউন্ট খুলে ফেলতে পারতো (যেমন ইয়াহু মেলে বা হটমেলে), আবার স্প্যাম বার্তা বা ভুয়ো মন্তব্যে ভরিয়েও দিত সকল ওয়েবসাইট ও বিভিন্ন ফোরাম। আবার, আশ্চর্যজনক ভাবে, স্বয়ংক্রিয়ভাবেই যেকোনো কনসার্টের টিকিটও আগেভাগে কিনে নেওয়ার ক্ষমতা রাখতো এই বট, এ ছাড়াও, বিভিন্ন ওয়েবসাইট থেকে হয় সমস্ত তথ্য চুরি করত নতুবা স্ক্র্যাপ করে দিত। এতে খুব স্বাভাবিক কারণেই ব্যবহারকারীর জীবন অতিষ্ঠ হয়ে যেত। কারণ, আমরা একজন মানুষ সহজেই যেমন অন্য একজন মানুষকে চিনতে পারি, কম্পিউটার কিন্তু তেমনটা পারে না। তাই, এই অহেতুক বিপদের হাত থেকে উদ্ধার পাওয়ার জন্য এমন এক পরীক্ষার দরকার হয়ে পড়েছিল, যা মানুষের পক্ষে আপাত সহজ, কিন্তু আবার কম্পিউটারের পক্ষে বেশ কঠিন।

এসব নিয়ে চিন্তা ভাবনা চলছিলই, বিভিন্ন পরীক্ষা নিরীক্ষাও করা হচ্ছিলো, আর ঠিক এরকমই এক ভাবনা থেকেই জন্ম নিল “রিভার্স টুরিং টেস্ট-এর ধারণা। এবং অবশেষে ঠিক ২০০০ সালে CAPTCHA-র জন্ম হল। কিভাবে ? ওই যে বললাম, বিভিন্ন পরীক্ষা–নিরীক্ষা চলছিল, ঠিক এরকমই এক প্রযুক্তি পরীক্ষার মাধ্যমে, ২০০০ সালে, কার্নেগি মেলন বিশ্ববিদ্যালয়ের (CMU) চার গবেষক লুইস ভন আহন, ম্যানুয়েল ব্লুম, নিকোলাস হপার ও জন ল্যাংফোর্ড উদ্ভাবন করলেন একটি নতুন প্রযুক্তি, তারাই নাম দিলেন ক্যাপচা (CAPTCHA)।

পরীক্ষাটা কিন্তু বেশ উদ্ভট! কিরকম? যেমন, একটা বিকৃত বা বিদঘুটে টেক্সট ইমেজ দেখিয়ে ব্যবহারকারীকে তা’ পড়ে সেটাকে টাইপ করতে বলা হতো। যিনি ব্যবহারকারী তিনি সহজেই পড়তে পারতেন, কিন্তু কম্পিউটারের তখনকার OCR (Optical Character Recognition) অ্যালগরিদম সেটি কিন্তু উদ্ধার করতে ব্যর্থ হত! এই প্রযুক্তি প্রথম ব্যবহার করতে চেয়েছিল Yahoo (ইয়াহু)!, যাতে বটগুলি আর ভুয়ো ইমেল অ্যাকাউন্ট খুলতে না পারে। বিভিন্ন কারণে তারা সমর্থ হয় নি বা বলা যেতে পারে বিষয়টা নিয়ে তারা আর বেশি দুর এগোয়নি।

উপরিউক্ত ওই চার প্রযুক্তিবিদ CAPTCHA নামের একটি পূর্ণরূপ করলেন – Completely Automated Public Turing test to tell Computers and Humans Apart। প্রসঙ্গত জানাই, এটি আবার বিখ্যাত বিজ্ঞানী অ্যালান টুরিং-এর “টুরিং টেস্ট – এর ঠিক উল্টো রূপ ছিল। টুরিং টেস্টে মানুষ যাচাই করত, কম্পিউটার মানুষকে অনুকরণ করতে পারে কিনা। কিন্তু CAPTCHAতে কম্পিউটারই উল্টে যাচাই করত, ব্যবহারকারী মানুষ না মেশিন!

আবিষ্কারের পর আসে এর বিবর্তনের পরবর্তী কিছু ধাপ। এটির বেশ কয়েকটি রকমফের ছিল, যেমন একদম শুরুর দিকে অর্থাৎ ২০০০-এর দশকে অর্থাৎ একদম শুরুতে ছিল ‘টেক্সট CAPTCHA’, যেটাতে আপনাকে বিকৃত অক্ষর ও সংখ্যা চিনে টাইপ করতে বলা হত। পরবর্তীতে অর্থাৎ মধ্য ২০০০ দশকে শুরু হল ‘ইমেজ CAPTCHA’, যেটাতে হয়ত আপনাকে “ট্রাফিক লাইট থাকা ঘরগুলো চিহ্নিত করতে”বলা হত বা এমনই কিছু ছবিভিত্তিক ধাঁধা দেওয়া হত। এরপর ২০০৭ সাল নাগাদ আসে ‘reCAPTCHA’, এবারেও কিন্তু উদ্ভাবক আবারও সেই লুইস ভন আহন। ২০০৯ সালে Google এটি (কনসেপ্টটি) কিনে নেয়। এতে, ব্যবহারকারীরা নিজের অজান্তেই, পুরনো বইয়ের শব্দ শনাক্ত করে, কম্পিউটার ডিজিটাইজেশনে সাহায্য করতেন। বিবর্তনের পরবর্তী অধ্যায়ে ২০১৪ সালে আসে ‘Invisible (অদৃশ্য) reCAPTCHA’, এতে কিন্তু কোন ধাঁধা নেই, শুধু আপনার কিছু আচরণ (যেমন মাউসের নড়াচড়া ইত্যাদি) দেখেই নির্ধারণ করা হত আপনি আদৌ মানুষ না বট। এরপরে ২০১৮ সালে আসে ‘reCAPTCHA v3’, এটি আবার সম্পূর্ণ পারিপার্শ্বিক অবস্থা দেখে কাজ করে; যেমন হয়তো ব্যবহারকারী কেবল একটি ✅ দেখে, সাথে লেখা দেখে “I’m not a robot বা আমি রোবট নই“ জাতীয় কিছু।

এই reCAPTCHA আবিষ্কার কিন্তু কম্পিউটারের জগতে বিপ্লব নিয়ে এল। কেন বা কিভাবে? আপনাদের জ্ঞাতার্থে জানাই, ২০০০-এর দশকে গুগল ও অন্যান্য আরও কিছু সংস্থা বৃহৎ ডিজিটাইজেশন প্রকল্প শুরু করেছিল। মানে কোটি কোটি পুরনো বই, সংবাদপত্র ও আর্কাইভ ইত্যাদি অনলাইনে আনার এক অসাধারণ প্রচেষ্টা শুরু করেছিল এই সংস্থাগুলি। কিন্তু সেটি করতে গিয়ে দেখতে পাওয়া গেল যে সমস্যা অনেক গুরুতর ও বেশ গভীরে: দেখা গেল পুরনো বইয়ের অক্ষরগুলো হয় ভীষণই ঝাপসা বা অত্যন্ত ফিকে, নাহয় এক অদ্ভুত ফন্টে ছাপা। ফলে OCR সফটওয়্যার মাত্র ৮০% শব্দ চিনে নিতে পারত, আর বাকি যে ২০%, তা’ থেকে যেত ভুলে ভরা এবং অদ্ভুতুড়ে। মর্মোদ্ধার করাই যেত না। এই সমস্যার চমৎকার এবং নির্ভুল এক সমাধান নিয়ে এল reCAPTCHA।

২০০৭ সালে, CMU-র ওই চারজনের একই দল reCAPTCHA-CAPTCHA ব্যবস্থাকে সদর্থক ভাবে কাজে লাগিয়ে বইয়ের টেক্সট সংশোধনের এক অসাধারণ পদ্ধতি চালু করেন। এটি কীভাবে কাজ করত? প্রথমে, পুরনো বই স্ক্যান করে OCR এ পাঠানো হতো। এখানে যে শব্দগুলো OCR চিনতে পারত না, সেগুলো পাঠানো হতো reCAPTCHA তে। এরপর ব্যবহারকারীকে দেখানো হতো দুটি শব্দ – তার মধ্যে একটি তার পরিচিত শব্দ, আর একটি হল তার অজানা একটি শব্দ যেটি পুরনো কোন বই থেকে নেওয়া। ব্যবহারকারীকে দুটোই টাইপ করতে বলা হত। এর মধ্যে যদি প্রথমটি ঠিক হয়, তবে সিস্টেম ধরে নিত যে ব্যবহারকারী হলেন একজন মানুষ। আর সেইসঙ্গে দ্বিতীয় শব্দের উত্তরটিও কিন্তু ধরে রাখা হতো। এবং একাধিক মানুষ একই রকম উত্তর দিলে সেটিকেই সঠিক বলে ধরে নেওয়া হতো। আর ঠিক এভাবেই, প্রতিদিন, নিজের নিজের কাজের তাগিদেই, কোটি কোটি CAPTCHA পূরণ করতে করতে, বহু মানুষ, অনিচ্ছাকৃতভাবে বা অজান্তে হলেও, অসংখ্য পুরনো বই ও সংবাদপত্রের ডিজিটাইজেশনের কাজে সাহায্য করেছিল। কারণ, প্রতিদিন লক্ষ কোটি মানুষকে, সারা বিশ্বে, নিজের কাজের তাগিদেই, কম্পিউটারে কাজে বসতে হত আর কাজের মধ্যে তাকে হয়ত CAPTCHA-রও সমাধান করতে হত। আর প্রায় প্রতিটি CAPTCHA-তেই থাকত দুটি করে শব্দ। দেখা গেছে, গড়ে প্রতিদিন প্রায় ১০ কোটি শব্দ এইভাবেই ডিজিটাইজড হতো। এভাবে, কিছু বছরেই মানুষ বিনামূল্যে আর সম্পূর্ণ নিজের অজ্ঞাতসারেই, সম্পূর্ণভাবে The New York Times, Google Books সহ আরও বহু সংস্থার আর্কাইভ পুনর্গঠন করতে সাহায্য করেছে।

গুগল যখন ২০০৯ সালে reCAPTCHA অধিগ্রহণ করে, তখন এর ব্যবহার কিন্তু সামগ্রিকভাবে আরও বেড়ে যায়। আর আশ্চর্যের বিষয় হল, আজকের দিনে, এটি কেবল বইই নয়, বরং Google Street View – বা রাস্তার নাম ও বাড়ির নম্বর শনাক্ত করতেও প্রভূত ব্যবহৃত হচ্ছে। অর্থাৎ, “এই রাস্তার নাম কী?”- এ জাতীয় প্রশ্নের উত্তর দিতে দিতে আমরা আসলে গুগল ম্যাপকেই নিখুঁত করছিলাম! এবং আবারও নিজের অজ্ঞাতসারেই। আরও মজার কথা, লুইস ভন আহন কিন্তু এখানেই থেমে থাকেননি, পরবর্তী কালে তিনিই তৈরি করেন Duolingo, যার নাম অনেকেই হয়ত শুনেছেন বা ব্যবহার অনেকেই হয়ত করে থাকবেন, যেখানে মানুষ নিজে ভাষা শেখার পাশাপাশি অন্যদেরও ভাষা শেখাতে সাহায্য করে। মানুষের বুদ্ধিমত্তাকে কাজে লাগিয়ে কম্পিউটারের বিভিন্ন কঠিন কঠিন সমস্যা সমাধানের এক নতুন প্রয়োগও বলা চলে একে।

দেখা গেল এই CAPTCHA কিন্তু প্রকৃতপক্ষে এক ক্লিকের মাধ্যমে কম্পিউটারের জগতে এক নীরব বিপ্লব নিয়ে এল। আপাতদৃষ্টিতে জিনিসটা যতটা সহজ বলে মনে হচ্ছে, বাস্তবে কিন্তু মোটেও তা’ নয়। কার্নেগী মেলন বিশ্ববিদ্যালয়ের ওই চার গবেষকের কত যে বিনিদ্র রজনী এর পিছনে ব্যয় হয়েছে, সেটি বলার অপেক্ষা রাখে না। পরিশেষে, এও বলা যায় যে CAPTCHA হয়তো আমাদের কাছে কম্পিউটারের মাধ্যমে, আমাদের মূল কাজে ঢোকার কেবলমাত্র এক বিরক্তিকর ধাপ (Gateway), যেমন “আমি রোবট নই” বলে টিক দেওয়া। আমাদের মনে তো হয়ই, এটা কেন করছি বা এর পিছনে কি উদ্দ্যেশ্য আছে। আসলে কিন্তু এর পেছনে লুকিয়ে আছে মানব-যন্ত্র সহযোগিতার এক বিশাল ইতিহাস। কারণ, এটি শুধুমাত্র বটগুলিকেই রুখে দেয়নি, বরং মানব মস্তিষ্কের বুদ্ধিকে, আমাদের অজান্তেই ব্যবহার করে, ডিজিটাল যুগের জ্ঞানের বিশাল এক ভাণ্ডার গড়ে তুলেছে। তাই নির্দ্বিধায় বলা যায় CAPTCHA হল মানবজাতির সেই ছোট্ট কিন্তু যুগান্তকারী এক ক্লিক, যা সভ্যতার ইতিহাসকে ডিজিটাল রূপ দিয়েছে এবং সবার অলক্ষ্যে আজও দিয়ে চলেছে।

সৌরভ কুণ্ডু (রাষ্ট্রায়ত্ত সংস্থায় কর্মরত)
তথ্য সহায়তাঃ রম্যাণী কুণ্ডু (পিএইচডি স্কলার, আইআইএম, রাঁচি)