ری کیپچا، کتب برقیانے کا ایک دلچسپ طریقہ

انٹرنیٹ پر آپ جب بھی کوئی نیا ای میل اکاؤنٹ یا کسی بھی طرح کا کوئی اکاؤنٹ بنانے جاتے ہیں، کیپچا (Captcha﴿ سے آپ کا واسطہ ضرور پڑتا ہے۔ یہ آڑھے ٹیڑھے حروف پر مشتمل ایک تصویر ہوتی ہے جسے پڑھ کر دیئے ہوئے باکس میں لکھنا ہوتا ہے۔ اس کا مقصد یہ معلوم کرنا ہوتا ہے کہ آیا رجسٹریشن کرانے والا انسان ہی ہے یا کوئی سافٹ ویئر بوٹ۔ کسی سافٹ ویئر بوٹ کے لئے اس تصویر میں لکھے ہوئے حروف کر پڑھنا ازحد مشکل ہے۔ لیکن انسان چند سیکنڈز میں یہ الفاظ شناخت کرسکتا ہے۔ کیپچا تصویر کو مشکل تربنانے کے لئے اس پر ٹیکسچر ﴿Texture﴿ اور لائنیں لگادیا جاتا ہے۔ اس طرح سافٹ ویئر بوٹ کے لئے آپٹیکل کریکٹر ریکگنائزر کا استعمال بھی ممکن نہیں رہتا۔ آپٹیکل کریکٹر ریکگنیشن کے عمل میں تصاویر کو ایک خصوصی الگارتھم کے ذریعے اسکین کیا جاتا ہے اور تصویر میں سے متن کو اخذ کرنے کی کوشش کی جاتی ہے۔ سادہ کیپچا کو او سی آر کے ذریعے پہچانا جاسکتا ہے۔ اسی لئے اب کیپچا کو ممکنہ حد تک پیچیدہ بنایا جاتا ہے۔

ایک اندازے کے مطابق ہر روز انٹرنیٹ پر ساٹھ لاکھ کیپچا حل کئے جاتے ہیں، یعنی لوگ کیپچا دیکھ کر ان کو پہچاننے کی کوشش کرتے ہیں۔ ایک کیپچا پہچاننے میں عام انسان اوسطاً دس سیکنڈ کا وقت صرف کرتا ہے انفرادی طور پر یہ وقت یقیناً معمولی ہے لیکن دنیا بھر میں مجموعی طور پر ہر دن ایک لاکھ پچاس ہزار گھنٹے اس کام میں خرچ ہوجاتے ہیں۔ یہ یقیناً وقت ایک ہی بہت ہی بڑی مقدار ہے جو ایک تقریباً فضول کام میں ضائع ہوجاتی ہے۔ ری کیپچا اسی ضائع ہونے والے وقت کا مثبت استعمال کرنے کا ایک طریقہ ہے۔

انسانی معلومات اور دنیا کے لئے معلومات کی سہل دستیابی کے لئے کئی پروجیکٹس کے تحت ایسی  کتب کو برقیانے یا ای بکس میں تبدیل کرنے پر کام کیا جارہا ہے جو موجودہ ترقی یافتہ دور سے پہلے لکھی گئی تھیں۔ ان کتب کو کمپیوٹر اسکینر کی مدد سے اسکین اور پھر آو سی آر کی مدد سے متن میں تبدیل کیا جاتا ہے تاکہ یہ تحریر کی شکل میں قابل تلاش ہوجائے۔ لیکن مسئلہ یہ ہے کہ او سی آر مکمل طور پر درست نہیں ہوتے۔ یہ غلطیاں کرتے ہیں۔

ری کیپچا اس عمل کو بہتر بنانے معاون ثابت ہوتا ہے۔ ہر وہ لفظ جو او سی آر نہیں پڑھ سکتا، بطور کیپچا استعمال کیا جاتا ہے اور صارف کو اسے دیکھ کر پہچاننے کا کہا جاتا ہے۔ اب سوال یہ پیدا ہوتا ہے کہ جب کیپچا لفظ خود سافٹ ویئر کے لئے ناقابل شناخت ہے تو اس بات کا اندازہ کیسے لگایا جاتا ہے کہ صارف نے درست لفظ لکھا ہے یا غلط۔ دراصل ری کیپچا میں ایک کے بجائے دو لفظ لکھے ہوتے ہیں۔ ایک لفظ وہ ہوتا ہے جس کے بارے میں سافٹ ویئر کو پتا ہوتا ہے کہ یہ کیا ہے جبکہ دوسروں اسی طرح او سی آر سے ناقابل شناخت لفظ ہوتا ہے۔ صارف ان دونوں الفاظ کو لکھتا ہے۔ اگر اس نے وہ لفظ درست لکھا ہے جو کہ سافٹ ویئر کو معلوم ہے تو اس بات کے قوی امکانات ہیں کہ دوسرا لفظ بھی اس نے ٹھیک ہی لکھا ہوگا۔ بعد میں ری کیپچا یہی لفظ چند دوسرے لوگوں کو بھی کیپچا میں شامل کرکے پہچاننے کے لئے دیتا ہے تاکہ درستگی کی تصدیق ہوسکے۔

اگر آپ کی بھی کوئی ویب سائٹ ہے یا آپ اسپیم ای میلز کی بھرمار کا شکار ہیں تو ری کیپچا استعمال کرکے آپ نہ صرف اس سے ان مسائل سے نجات حاصل کرسکتے ہیں بلکہ کتب کو برقیانے کے عمل میں اپنا حصہ بھی شامل کرسکتے ہیں۔

ملاحظہ کریں: http://recaptcha.net

آپٹیکل کریکٹر ریکگنائزراسپیماو سی آرری کیپچاکیپچا
تبصرے (2)
Add Comment
  • Moneeb Junior

    This article is very informative. Yesterday I saw your Magazine "Computing”. Magazine is also very good.

  • محمد عمران خان

    بہت عمدہ اور معلوماتی مضمون ہے۔ مزید کا انتظار رہے گا