সৌরভ কুণ্ডুঃ- ইন্টারনেট ব্যবহারের একেবারে প্রথম যুগে এক নতুন সমস্যা দেখা দেয়। আপনারা সবাই জানেন, ১৯৯০-এর শেষ দিকে ও ২০০০ সালের শুরুর দিকে ইন্টারনেটের জগৎ অতি দ্রুত প্রসারিত হচ্ছিল। কিন্তু সঙ্গে বাড়ছিল এক ভয়ংকর সমস্যা, কম্পিউটারের ভাষায় যাকে বলে – বট বা স্বয়ংক্রিয় প্রোগ্রাম, যার কারণেই এই সমস্যার উদ্ভব!
জানেন, এই বটের কাজের এক অদ্ভুত ধরণ ছিল, এরা আমার আপনার বিনা অনুমতিতেই হাজার হাজার ইমেল অ্যাকাউন্ট খুলে ফেলতে পারতো (যেমন ইয়াহু মেলে বা হটমেলে), আবার স্প্যাম বার্তা বা ভুয়ো মন্তব্যে ভরিয়েও দিত সকল ওয়েবসাইট ও বিভিন্ন ফোরাম। আবার, আশ্চর্যজনক ভাবে, স্বয়ংক্রিয়ভাবেই যেকোনো কনসার্টের টিকিটও আগেভাগে কিনে নেওয়ার ক্ষমতা রাখতো এই বট, এ ছাড়াও, বিভিন্ন ওয়েবসাইট থেকে হয় সমস্ত তথ্য চুরি করত নতুবা স্ক্র্যাপ করে দিত। এতে খুব স্বাভাবিক কারণেই ব্যবহারকারীর জীবন অতিষ্ঠ হয়ে যেত। কারণ, আমরা একজন মানুষ সহজেই যেমন অন্য একজন মানুষকে চিনতে পারি, কম্পিউটার কিন্তু তেমনটা পারে না। তাই, এই অহেতুক বিপদের হাত থেকে উদ্ধার পাওয়ার জন্য এমন এক পরীক্ষার দরকার হয়ে পড়েছিল, যা মানুষের পক্ষে আপাত সহজ, কিন্তু আবার কম্পিউটারের পক্ষে বেশ কঠিন।
এসব নিয়ে চিন্তা ভাবনা চলছিলই, বিভিন্ন পরীক্ষা নিরীক্ষাও করা হচ্ছিলো, আর ঠিক এরকমই এক ভাবনা থেকেই জন্ম নিল “রিভার্স টুরিং টেস্ট-এর ধারণা। এবং অবশেষে ঠিক ২০০০ সালে CAPTCHA-র জন্ম হল। কিভাবে ? ওই যে বললাম, বিভিন্ন পরীক্ষা–নিরীক্ষা চলছিল, ঠিক এরকমই এক প্রযুক্তি পরীক্ষার মাধ্যমে, ২০০০ সালে, কার্নেগি মেলন বিশ্ববিদ্যালয়ের (CMU) চার গবেষক লুইস ভন আহন, ম্যানুয়েল ব্লুম, নিকোলাস হপার ও জন ল্যাংফোর্ড উদ্ভাবন করলেন একটি নতুন প্রযুক্তি, তারাই নাম দিলেন ক্যাপচা (CAPTCHA)।
পরীক্ষাটা কিন্তু বেশ উদ্ভট! কিরকম? যেমন, একটা বিকৃত বা বিদঘুটে টেক্সট ইমেজ দেখিয়ে ব্যবহারকারীকে তা’ পড়ে সেটাকে টাইপ করতে বলা হতো। যিনি ব্যবহারকারী তিনি সহজেই পড়তে পারতেন, কিন্তু কম্পিউটারের তখনকার OCR (Optical Character Recognition) অ্যালগরিদম সেটি কিন্তু উদ্ধার করতে ব্যর্থ হত! এই প্রযুক্তি প্রথম ব্যবহার করতে চেয়েছিল Yahoo (ইয়াহু)!, যাতে বটগুলি আর ভুয়ো ইমেল অ্যাকাউন্ট খুলতে না পারে। বিভিন্ন কারণে তারা সমর্থ হয় নি বা বলা যেতে পারে বিষয়টা নিয়ে তারা আর বেশি দুর এগোয়নি।
উপরিউক্ত ওই চার প্রযুক্তিবিদ CAPTCHA নামের একটি পূর্ণরূপ করলেন – Completely Automated Public Turing test to tell Computers and Humans Apart। প্রসঙ্গত জানাই, এটি আবার বিখ্যাত বিজ্ঞানী অ্যালান টুরিং-এর “টুরিং টেস্ট – এর ঠিক উল্টো রূপ ছিল। টুরিং টেস্টে মানুষ যাচাই করত, কম্পিউটার মানুষকে অনুকরণ করতে পারে কিনা। কিন্তু CAPTCHAতে কম্পিউটারই উল্টে যাচাই করত, ব্যবহারকারী মানুষ না মেশিন!
আবিষ্কারের পর আসে এর বিবর্তনের পরবর্তী কিছু ধাপ। এটির বেশ কয়েকটি রকমফের ছিল, যেমন একদম শুরুর দিকে অর্থাৎ ২০০০-এর দশকে অর্থাৎ একদম শুরুতে ছিল ‘টেক্সট CAPTCHA’, যেটাতে আপনাকে বিকৃত অক্ষর ও সংখ্যা চিনে টাইপ করতে বলা হত। পরবর্তীতে অর্থাৎ মধ্য ২০০০ দশকে শুরু হল ‘ইমেজ CAPTCHA’, যেটাতে হয়ত আপনাকে “ট্রাফিক লাইট থাকা ঘরগুলো চিহ্নিত করতে”বলা হত বা এমনই কিছু ছবিভিত্তিক ধাঁধা দেওয়া হত। এরপর ২০০৭ সাল নাগাদ আসে ‘reCAPTCHA’, এবারেও কিন্তু উদ্ভাবক আবারও সেই লুইস ভন আহন। ২০০৯ সালে Google এটি (কনসেপ্টটি) কিনে নেয়। এতে, ব্যবহারকারীরা নিজের অজান্তেই, পুরনো বইয়ের শব্দ শনাক্ত করে, কম্পিউটার ডিজিটাইজেশনে সাহায্য করতেন। বিবর্তনের পরবর্তী অধ্যায়ে ২০১৪ সালে আসে ‘Invisible (অদৃশ্য) reCAPTCHA’, এতে কিন্তু কোন ধাঁধা নেই, শুধু আপনার কিছু আচরণ (যেমন মাউসের নড়াচড়া ইত্যাদি) দেখেই নির্ধারণ করা হত আপনি আদৌ মানুষ না বট। এরপরে ২০১৮ সালে আসে ‘reCAPTCHA v3’, এটি আবার সম্পূর্ণ পারিপার্শ্বিক অবস্থা দেখে কাজ করে; যেমন হয়তো ব্যবহারকারী কেবল একটি ✅ দেখে, সাথে লেখা দেখে “I’m not a robot বা আমি রোবট নই“ জাতীয় কিছু।
এই reCAPTCHA আবিষ্কার কিন্তু কম্পিউটারের জগতে বিপ্লব নিয়ে এল। কেন বা কিভাবে? আপনাদের জ্ঞাতার্থে জানাই, ২০০০-এর দশকে গুগল ও অন্যান্য আরও কিছু সংস্থা বৃহৎ ডিজিটাইজেশন প্রকল্প শুরু করেছিল। মানে কোটি কোটি পুরনো বই, সংবাদপত্র ও আর্কাইভ ইত্যাদি অনলাইনে আনার এক অসাধারণ প্রচেষ্টা শুরু করেছিল এই সংস্থাগুলি। কিন্তু সেটি করতে গিয়ে দেখতে পাওয়া গেল যে সমস্যা অনেক গুরুতর ও বেশ গভীরে: দেখা গেল পুরনো বইয়ের অক্ষরগুলো হয় ভীষণই ঝাপসা বা অত্যন্ত ফিকে, নাহয় এক অদ্ভুত ফন্টে ছাপা। ফলে OCR সফটওয়্যার মাত্র ৮০% শব্দ চিনে নিতে পারত, আর বাকি যে ২০%, তা’ থেকে যেত ভুলে ভরা এবং অদ্ভুতুড়ে। মর্মোদ্ধার করাই যেত না। এই সমস্যার চমৎকার এবং নির্ভুল এক সমাধান নিয়ে এল reCAPTCHA।
২০০৭ সালে, CMU-র ওই চারজনের একই দল reCAPTCHA-CAPTCHA ব্যবস্থাকে সদর্থক ভাবে কাজে লাগিয়ে বইয়ের টেক্সট সংশোধনের এক অসাধারণ পদ্ধতি চালু করেন। এটি কীভাবে কাজ করত? প্রথমে, পুরনো বই স্ক্যান করে OCR এ পাঠানো হতো। এখানে যে শব্দগুলো OCR চিনতে পারত না, সেগুলো পাঠানো হতো reCAPTCHA তে। এরপর ব্যবহারকারীকে দেখানো হতো দুটি শব্দ – তার মধ্যে একটি তার পরিচিত শব্দ, আর একটি হল তার অজানা একটি শব্দ যেটি পুরনো কোন বই থেকে নেওয়া। ব্যবহারকারীকে দুটোই টাইপ করতে বলা হত। এর মধ্যে যদি প্রথমটি ঠিক হয়, তবে সিস্টেম ধরে নিত যে ব্যবহারকারী হলেন একজন মানুষ। আর সেইসঙ্গে দ্বিতীয় শব্দের উত্তরটিও কিন্তু ধরে রাখা হতো। এবং একাধিক মানুষ একই রকম উত্তর দিলে সেটিকেই সঠিক বলে ধরে নেওয়া হতো। আর ঠিক এভাবেই, প্রতিদিন, নিজের নিজের কাজের তাগিদেই, কোটি কোটি CAPTCHA পূরণ করতে করতে, বহু মানুষ, অনিচ্ছাকৃতভাবে বা অজান্তে হলেও, অসংখ্য পুরনো বই ও সংবাদপত্রের ডিজিটাইজেশনের কাজে সাহায্য করেছিল। কারণ, প্রতিদিন লক্ষ কোটি মানুষকে, সারা বিশ্বে, নিজের কাজের তাগিদেই, কম্পিউটারে কাজে বসতে হত আর কাজের মধ্যে তাকে হয়ত CAPTCHA-রও সমাধান করতে হত। আর প্রায় প্রতিটি CAPTCHA-তেই থাকত দুটি করে শব্দ। দেখা গেছে, গড়ে প্রতিদিন প্রায় ১০ কোটি শব্দ এইভাবেই ডিজিটাইজড হতো। এভাবে, কিছু বছরেই মানুষ বিনামূল্যে আর সম্পূর্ণ নিজের অজ্ঞাতসারেই, সম্পূর্ণভাবে The New York Times, Google Books সহ আরও বহু সংস্থার আর্কাইভ পুনর্গঠন করতে সাহায্য করেছে।
গুগল যখন ২০০৯ সালে reCAPTCHA অধিগ্রহণ করে, তখন এর ব্যবহার কিন্তু সামগ্রিকভাবে আরও বেড়ে যায়। আর আশ্চর্যের বিষয় হল, আজকের দিনে, এটি কেবল বইই নয়, বরং Google Street View – বা রাস্তার নাম ও বাড়ির নম্বর শনাক্ত করতেও প্রভূত ব্যবহৃত হচ্ছে। অর্থাৎ, “এই রাস্তার নাম কী?”- এ জাতীয় প্রশ্নের উত্তর দিতে দিতে আমরা আসলে গুগল ম্যাপকেই নিখুঁত করছিলাম! এবং আবারও নিজের অজ্ঞাতসারেই। আরও মজার কথা, লুইস ভন আহন কিন্তু এখানেই থেমে থাকেননি, পরবর্তী কালে তিনিই তৈরি করেন Duolingo, যার নাম অনেকেই হয়ত শুনেছেন বা ব্যবহার অনেকেই হয়ত করে থাকবেন, যেখানে মানুষ নিজে ভাষা শেখার পাশাপাশি অন্যদেরও ভাষা শেখাতে সাহায্য করে। মানুষের বুদ্ধিমত্তাকে কাজে লাগিয়ে কম্পিউটারের বিভিন্ন কঠিন কঠিন সমস্যা সমাধানের এক নতুন প্রয়োগও বলা চলে একে।
দেখা গেল এই CAPTCHA কিন্তু প্রকৃতপক্ষে এক ক্লিকের মাধ্যমে কম্পিউটারের জগতে এক নীরব বিপ্লব নিয়ে এল। আপাতদৃষ্টিতে জিনিসটা যতটা সহজ বলে মনে হচ্ছে, বাস্তবে কিন্তু মোটেও তা’ নয়। কার্নেগী মেলন বিশ্ববিদ্যালয়ের ওই চার গবেষকের কত যে বিনিদ্র রজনী এর পিছনে ব্যয় হয়েছে, সেটি বলার অপেক্ষা রাখে না। পরিশেষে, এও বলা যায় যে CAPTCHA হয়তো আমাদের কাছে কম্পিউটারের মাধ্যমে, আমাদের মূল কাজে ঢোকার কেবলমাত্র এক বিরক্তিকর ধাপ (Gateway), যেমন “আমি রোবট নই” বলে টিক দেওয়া। আমাদের মনে তো হয়ই, এটা কেন করছি বা এর পিছনে কি উদ্দ্যেশ্য আছে। আসলে কিন্তু এর পেছনে লুকিয়ে আছে মানব-যন্ত্র সহযোগিতার এক বিশাল ইতিহাস। কারণ, এটি শুধুমাত্র বটগুলিকেই রুখে দেয়নি, বরং মানব মস্তিষ্কের বুদ্ধিকে, আমাদের অজান্তেই ব্যবহার করে, ডিজিটাল যুগের জ্ঞানের বিশাল এক ভাণ্ডার গড়ে তুলেছে। তাই নির্দ্বিধায় বলা যায় CAPTCHA হল মানবজাতির সেই ছোট্ট কিন্তু যুগান্তকারী এক ক্লিক, যা সভ্যতার ইতিহাসকে ডিজিটাল রূপ দিয়েছে এবং সবার অলক্ষ্যে আজও দিয়ে চলেছে।
সৌরভ কুণ্ডু (রাষ্ট্রায়ত্ত সংস্থায় কর্মরত)
তথ্য সহায়তাঃ রম্যাণী কুণ্ডু (পিএইচডি স্কলার, আইআইএম, রাঁচি)



















