Skip to main content

रि-क्याप्चाको रोचक पक्ष [Use reCAPTCHA - Help Digitize Books]

क्याप्चा

“क्याप्चा”को बारेमा प्राय सबैले सुनेको हुनुपर्छ, धेरैपटक क्याप्चा “टाइप” पनि गर्नु भएकोहोला ! प्राय प्रयोगकर्तालाई क्याप्चा “टाइप” गर्न गाह्रो र झन्झटिलो लाग्छ । प्रयोगकर्तालाई झन्झटिलो लागेपनि सम्भावित ‘स्पाम’ प्रतिक्रिया, अपडेट आदिबाट बच्नको लागि साइट/ब्लगमा “क्याप्चा” प्रयोग गर्ने गरिन्छ । विकीपेडियाका अनुसार क्याप्चाले प्रयोगकर्ता मानव हो कि कम्प्युटर हो भनेर बताउँछ (A CAPTCHA is a program that can tell whether its user is a human or a computer) । क्याप्चामा लेखिएको अक्षर कम्प्युटर/रोबटले बुझ्न सक्दैन, क्याप्चामा लेखिएको अक्षर मानिसले मात्र पढ्नसक्छ !

RecaptchaLogo

रिक्याप्चा

“रिक्याप्चा” पनि क्याप्चा नै हो । क्याप्चाले जस्तै “रिक्याप्चा”ले पनि स्पामरहरुबाट साइटलाई जोगाउन सहयोग गर्छ । यसका अतिरिक्त “रिक्याप्चा”को माध्यमबाट इन्टरनेटमा साधारण तर ठूलो काम भइरहेको छ । सायद धेरैलाई थाहा नहुनसक्छ, रिक्याप्चाको माध्यमबाट हामीहरु विश्वका पुराना पत्रिका तथा कितावहरुलाई “डिजिटाइज” (डिजिटल बनाउनु) गरिरहेकाछौँ ।

रिक्याप्चाले साइटलाई “स्पाम”बाट जोगाउनुको साथै बर्षौँ पुराना किताब र पत्रिकाहरुलाई इन्टरनेटमा “डिजिटाइज” गर्न सहयोग गरिरहेकोछ । सन् २००९ मा गुगलले किनेको “रिक्याप्चा” सर्भिसले हाललाई विश्वको चर्चित अखबर न्युयोर्क टाइम्सका पुराना अंकहरु र गुगल बुक्सका किताबहरुलाई “डिजिटाइज” गरिरहेकोछ । रिक्याप्चाको रोचक पक्ष यो छ कि, विश्वभरी रहेका हामी प्रयोगकर्ताहरुले नजानिकनै वा भनौँ अन्जानमै न्युयोर्क टाइम्सको वर्षौँ पुराना अंकहरुलाई र गुगलबुक्सका कितावहरुलाई डिजिटाइज गरिरहेका छौँ ।

क्याप्चामा प्राय: एउटा शब्द राखिएको हुन्छ, कुनै साइटले आफ्नै क्याप्चा बनाउँछन् त कसैले अरुको क्याप्चा सर्भिस प्रयोग गर्छन् र यो पूर्णत साइटलाई “स्पामर”हरुबाट जोगाउनको लागि राखिन्छ ! तर रिक्याप्चामा भने दुईवटा शब्द हुन्छ, जसमा एउटा शब्द पुराना पुस्तकहरु र पत्रिकाहरुलाई ‘स्क्यान” गरेर लिइएको हुन्छ, जसको प्रमुख उद्देश्य हुन्छ साइटलाई स्पामरहरुबाट जोगाउनु अनि वर्षौँ पुराना किताबहरुलाई डिजिटाइज गरेर अनलाइनमा राख्नु । र एउटा शब्द चाँही क्याप्चाले आफ्नै “डाटावेस”बाट राख्नेगर्छ ।

reCAPTCHA helps digitize books

स्क्यान गरेका किताब र पत्रिकाहरुलाई “अप्टिकल क्यारेटक्टर रिकग्निसन” (Optical Character Recognition – OCR) प्रविधिमार्फत शब्दमा परिणत गरिन्छन् ! तर सबै शब्दहरु OCR प्रविधीबाट पढ्न सकिँदैनन् अनि कम्प्युटरले पढ्न नसक्ने शब्दहरु या भनौँ त्यो शब्द जसलाई OCR प्रविधीमार्फत पढ्न सकिँदैन, ती शब्दहरुलाई तस्विरको रुपमा क्याप्चामा राखिन्छ । ओसीआर (OCR) प्रविधीमार्फत पढ्न नसकिएका शब्दहरु कम्प्युटरले स्वत थाहा पाउने भएका कारण, ती पढ्न गाह्रो भएका शब्दहरु स्वत “रिक्याप्चा”मा राखिन्छन् । सायद याद गर्नुभएको होला, फेसबुक, ट्विटर, वर्डप्रेस वा अन्य साइट जहाँ “रिक्याप्चा”को प्रयोग भएकोछ त्यहाँ देखिने शब्दहरु प्रस्ट हुँदैनन्,  कहिलेकाँही रिक्याप्चा भर्नको लागि तपाईले सोचेरै टाइप गर्नुपर्ने अवस्था पनि आउँछ।

रिक्याप्चामा किताब तथा पत्रिकाबाट राखिएको शब्दहरु, प्रयोगकर्ताले ठिकसँग भरेका छन् कि छैनन् भन्ने काम चाँही रिक्याप्चामा भएको अर्को शब्दबाट छड्के चेकजाँच गर्ने गरिन्छ । मैले माथि नै भनिसकेँ रिक्याप्चामा दुईवटा शब्द हुन्छ, एउटा शब्द आफ्नै “डाटावेस”बाट राखिएको हुन्छ भने अर्को शब्द OCR प्रविधीमार्फत पढ्न नसकिएका शब्दहरु राखिएको हुन्छ । स्क्यान गरेर शब्दहरु राखिने कारण कहिलेकाँही रिक्याप्चामा चाइनिज/जापानिज शब्दहरु देखिन्छन् र हामी “रिक्याप्चा फेल” भनेर खुब हल्लाखल्ला गर्ने गर्छौँ ।

reCAPTCHAप्रयोगकर्ताहरुले रिक्याप्चामा भएका दुईवटै शब्द भर्नुपर्ने हुन्छ । कहिलेकाँही एउटा शब्दमात्रै ठिक लेखेपनि काम बन्ने गरेको देख्नुभएको होला, यसको मुलकारण भनेको रिक्याप्चालाई पहिले नै थाहा भएको शब्द हामीले सहीसँग टाइप गरेका हुन्छौँ, तर OCR बाट निकालिएको शब्दमा रहेको “अक्षर”बारे रिक्याप्चालाई ज्ञान हुँदैन । प्रयोगकर्ताले टाइप गरेको र रिक्याप्चालाई पहिले नै थाहा भएको शब्द मिलेपछि, रिक्याप्चाले अटोमेटिक रुपमा दोश्रो शब्द पनि सही रुपमा टाइप भएको होला भन्ने अनुमान गर्छ । तर धेरै प्रयोकर्ताहरुबाट आएको जवाफलाई मात्र रिक्याप्चाले सही मान्ने गर्छ, यसको अर्थ हुन्छ एउटै शब्दलाई धेरै प्रयोगकर्ताहरुले टाइप गर्ने गर्छन्, यदि सबै प्रयोगकर्ताहरुले रिक्याप्चाले दिएको शब्दमा अर्को शब्द पनि एउटै टाइप गरेका रहेछन् भने रिक्याप्चाले “शब्द” सही रहेछ भनेर निर्क्यौल गर्छ ।

(Here's how: Each new word that cannot be read correctly by OCR is given to a user in conjunction with another word for which the answer is already known. The user is then asked to read both words. If they solve the one for which the answer is known, the system assumes their answer is correct for the new one. The system then gives the new image to a number of other people to determine, with higher confidence, whether the original answer was correct. ~ Via Google Recaptha)

रिक्याप्चाले कसरी किताब र पत्रिकाहरुलाई डिजिटाइज गर्न सहयोग गरिरहेको छ, रिक्याप्चाले कसरी यो शब्द सही हो भनेर थाहा पाउँछ, भनेर मैल माथि लेखेका कुराहरु सायद बुझ्न अप्ठ्यारो लागिरहेको होला । तल हामीले टेडको एउटा भिडियो राखेका छौँ, यसबारे अधिक जानकारी राख्न चाहनुहुन्छ भने भिडियो हेर्नुहोस् !

Luis von Ahn: Massive-scale online collaboration










Further Reading:

reCAPTCHA: Stop Spam, Read Books

reCaptcha – Wikipedia

Anti-Spam Turing Test Is Really Global Human-Powered OCR System

Spam weapon helps preserve books

Comments

  1. interesting...तर हाम्रो श्रम शोषन पो भै रा रहेछ डिजीटाइज गर्न   

    ReplyDelete
  2. Wow!!! This is an amazingly new piece of information for me. However, wikipedia definitions should be improved as "A CAPTCHA is a program that TRIES TO tell whether its user is a human or a computer". Its good to know that reCaptcha is helping digitize the books. Thanks for this awesome piece of information. Loved it.

    ReplyDelete
  3. nice.. didn't know about it.. thanks for sharing.. :) 

    ReplyDelete
  4. Really amazing story of recaptca n the Duolingo. Thanx for sharing it Aakar. n one question, is Nepali wikipedia also being built with the same technique?

    ReplyDelete
  5. रमाइलो पो रहेछ 'रि-क्याप्चा' पछाडिका कथा !

    ReplyDelete

Post a Comment

Popular posts from this blog

SLC Result 2068/2069 Published

The Office of the Controller of Examinations, Sanothimi has published the results of the SLC examination for the academic year 2068, on Wednesday evening. Out of 528,257 examines, 47.16 percent students passed the SLC this year. According to OCE, 2,47,689 regular students passed the exam under the regular, whereas 82,283 students have passed under the exempted category. We've uploaded SLC Result 2068 in .pdf format. Please download the SLC Result 2068 from the links below. Check your SLC Result 2068 Online 1) Link1: SLC Result 2068 Regular .pdf      Link2:  SLC Result 2068 Regular .pdf      Link3: SLC Result 2068 Regular .pdf   (via chakab.com)   2)   Link1:   SLC Result 2068 Exempted .pdf      Link2:   SLC Result 2068 Exempted .pdf      Link3:   SLC Result 2068 Exempted .pdf   (via chakab.com) 3) Distinction : SLC Result 2068 .txt ...

Romanized Nepali Unicode

Download and Install Nepali Unicode Romanised to write in Nepali all over the web. First of all, you have to Download and Run the Program on your computer. Then, you have to do some settings on your computer to use Nepali Unicode Romanized. You can download Nepali Unicode Romanized from the Madan Puraskar Pustakalaya website for free. Install Nepali Unicode Romanized in Windows XP: Install: Run setup file; Go to control Panel; Open Language and Regional settings; Open Regional Language Options; Go to Language Options & tick on check box (install files..... Thai, instal....east Asian...languages): Click apply-it might ask for windows CD: Insert CD or you can directly copy "i386" files too; And install all: then you have done; Click for details; Then click add a tab; A new popup will appear: Select "Sanskrit" in the first box; Select "Nepali unicode (romanized)" in second box; Click "ok"; You have successfully installed it; P...

SLC RESULT 2068/2069 (2011-2012) To publish Today

The result of the School Leaving Certificate (SLC) 2068/2069 examinations held earlier this year is going to published today (by Wednesday evening). The Office of the Controller of Examinations, Sanothimi is going through final preparations to flash SLC examination result within this evening. Altogether 528,257 examines had appeared for the exam. SLC Results 2068 will be available online as soon as the Controller of Examinations published the results.You can check SLC Results via SMS Service after Examination Controller’s Office published the results. यस वर्षको एसएलसी परीक्षा 'रिजल्ट' आज सार्वजनिक हुने करिब करिब निश्चत भएको छ। नतिजा निस्कने बित्तिकै अनलाइनमा रिजल्ट राखिनेछ । विभिन्न अनलाइन साइटहरुको साथै, एसएमएसको माध्यमबाट पनि आफ्नो रिजल्ट हेर्न सकिन्छ । एसएमएस मार्फत रिजल्ट हेर्न SLC <space> <your symbol no.> टाइप गरि 5001 मा पठाउन सकिनेछ । SLC Result 2068 Published

Download

Nepali Songs and software download: दशैँ तिहार - देउसी भैलो: Download: Mangal Dhun / मंगल धुन - सुरसुधा Download: Tihar Dhun (Deusi,Bhailo)/ तिहार धुन(देउसी भैलो)- सुरसुधा Download More Songs: Go To  Deusi/Bhailo Songs देशभक्ति गितहरु / Deshbhakti  Download Patriotic Nepali Song: नेपाली नेपाल को माया छ कि छैन / nepali nepal ko maya chha ki chhaina - Gopal Yonjan Download Patriotic Nepali Song: धेरै छ गर्नु स्वदेश को सेवा, नेपाली बन्नलाई... हैन भने नेपाली नभन, विर को छोरा नाथे मा नगन / haina vane nepali navana - Gopal Yonjan Download Patriotic Nepali Song: जहाँ छन् बुध्दका आँखा / jaha chhan buddha ka aakha - bhaktaraj acharya Download Patriotic Nepali Song: नेपालले के गर्यो मलाई, भन्न छोडिदेउ Download: रातो र चन्द्र सुर्य / raato ra chandra surya   (रचनाकार: गोपाल प्रसाद रिमाल, गायक: फत्तेमान, संगीत: अम्बर गुरुङ) Download: सयथरि बाजा एउटै ताल / saya thari baja - kutumba band (nepali dhun) Download: म मरेपनि मेरो देश बाँचिराखोस / ma marepan...

नेपाली टाइप गर्ने सजिलो तरिका

मदन पुरस्कार पुस्तकालयले  २००७  २००३-४ ताका नेपाली युनिकोड किबोर्ड लेआउट, रोमनाइज्ड र ट्रेडिसनल सार्वजनिक गर्यो । नेपाली टाइपिङ (ट्रेडिसनल) जान्दै नजान्ने (कहिले नेपाली टाइप नगरेको) मैले, मदन पुरस्कार पुस्तकालयले सार्वजनिक गरेको रोमनाइज्ड नेपाली युनिकोड किबोर्ड लेआउट कम्प्युटरमा राखेर पहिलो पटक कम्प्युटरमा नेपाली भाषामा लेखेँ । यसविचमा कम्प्युटर तथा मोबाइलको लागि धेरै किसिमका नेपाली किबोर्ड लेआउट तथा एप्सहरु आइसकेकाछन्, तर पनि इन्टरनेट प्रयोगकर्ताहरु नेपाली टाइप गर्नुपर्दा अप्ठ्यारो मान्छन् । मलाई धेरैले सोध्ने गरेको प्रश्न भनेको, "फेसबुकमा कसरी नेपाली टाइप गर्ने?" अत: यो ब्लगमा मदन पुरस्कार पुस्तकालय (मपुपु) ले निर्माण गरेको नेपाली युनिकोड किबोर्ड लेआउट बारे चर्चा गर्दैछु। प्रिती, कान्तिपुर लगायतका 'ट्रु टाइप फन्ट' (ttf) प्रयोग गरेर ट्रेडिसनल लेआउटमा नेपाली टाइप गर्ने प्रयोगकर्ताहरुले, नेपाली ट्रेडिसनल युनिकोड किबोर्ड लेआउट राखेर, इन्टरनेटमा सजिलै सँग नेपालीमा लेख्न सक्छन् । भन्नुको मतलब, तपाईलाई पहिले नै नेपाली टाइपिङ आउँछ भने टाइपिङ गर्ने तरिका उही हुन्छ, उही ...

SLC Result 2067/2068 Published : Check SLC Result 2067

The Office of the Controller of Examinations (OCE), Sanothimi, on Monday published the results of the School Leaving Certificate (SLC) 2067 examinations held last year. Under the regular category, a total of 2,20,766 students passed the exams, with pass percentage standing at 55.5, the OCE said in a press statement. Among them 1,24,305 are boys and 96,461 are girls. Of those passing the iron gate, 23,0499 achieved distinction marks; 82,619 passed in the first division; 1,09795 second division and the rest in 8241 third division. As many as 4,54,022 students had appeared in the exams conducted in March this year. Likewise, under the exempted category, 9733 students passed the exams with the pass percentage of 17.30. Combining both the categories 2,30,509 students made it through the iron gate. via ~ The Himalayan Times We have uploaded SLC Result 2067 in .txt  and .zip file format for you. Download the file and search your ‘symbol number’. Congratulations to all, who...

Subscribe to Aakar Post