recaptcha รู้ได้อย่างไรว่าคุณไม่ได้ป้อนการแปลรูปภาพปลอม [ปิด]


22

จากสิ่งที่ฉันเข้าใจ Captchas เป็นข้อความที่บิดเบือนจากการใช้ฟิลเตอร์เสียงรบกวนและอัลกอริธึมที่ผิดพลาดอื่น ๆ ดังนั้นเพื่อค้นหาว่าความสามารถในการอ่านของบุคคลนั้นเป็นของคนคุณเปรียบเทียบสิ่งที่พวกเขาตอบกับสิ่งที่คำตอบที่รู้จักคือ

ตอนนี้การอ่านบน ReCaptcha มันบอกว่าคำที่แสดงเป็นคำที่ OCR ไม่สามารถแปลได้ นอกจากนี้ยังมีการใช้ recaptcha เพื่อแปลภาพเหล่านั้น มันจะบอกได้อย่างไรว่าคุณถูกต้องในการอ่านหรือทำขึ้น?

ถ้ามันรู้ว่ามันพูดอะไรมันจะไม่ถูกนำมาใช้ในการแปลเนื้อหาใหม่ หากไม่รู้ว่าข้อความนั้นบอกว่าอย่างไรคำตอบของคุณจะตรวจสอบได้อย่างไร

ฉันเดาว่านี่อาจเป็นการวิเคราะห์ความน่าจะเป็นที่มีตัวอย่างขนาดใหญ่ก่อนที่จะตั้งค่าสถานะอะไรก็ได้ที่แปล

ไม่มีใครรู้ว่าคำตอบของเรื่องนี้อยู่ที่ไหน?


3
ที่น่าสนใจคือการเล่นตลก 4chan / ไม่ระบุชื่อในแบบสำรวจความคิดเห็นเวลา "Marble cake, the game" ซึ่งใช้ประโยชน์จากข้อบกพร่องในการตรวจสอบ crowdsourcing ของคำที่สอง
DanBeale

คำตอบ:


33

หน้าหนังสือจะถูกสแกนโดยทั่วไปแล้วเปลี่ยนเป็นข้อความโดยใช้ "Optical Character Recognition" (OCR) และป้อนไปยังเว็บในรูปแบบของภาพที่มีคำเดียวที่เป็นที่รู้จักในโปรแกรมคอมพิวเตอร์หลัง reCAPTCHA และอีกหนึ่งคำที่ไม่ใช่ ยังเป็นที่รู้จัก

จากนั้นผู้ใช้พิมพ์ทั้งสองคำออกมาและหากพวกเขาแก้คำที่รู้จักคำตอบระบบจะถือว่าคำตอบของพวกเขานั้นถูกต้องสำหรับคำใหม่ จากนั้นระบบจะให้ภาพใหม่แก่บุคคลอื่นจำนวนมากเพื่อพิจารณาด้วยความมั่นใจที่สูงขึ้นว่าคำตอบดั้งเดิมนั้นถูกต้องหรือไม่ ดังนั้นระบบจึงเป็นบริการที่ปรับปรุงตัวเองให้ดีขึ้นตามเวลา

http://www.google.com/recaptcha/learnmore


22

นี่คือเหตุผลที่ reCaptcha ให้คุณป้อนคำสองคำ มีคำหนึ่งคำที่รู้จักกันแล้วและไม่รู้จักคำใดคำหนึ่ง ไม่ว่าคุณจะผ่านหรือไม่แคปช่าจะขึ้นอยู่กับวิธีที่คุณตอบสำหรับคำที่รู้จักเท่านั้น คำตอบของคุณสำหรับคำอื่น ๆ (ไม่ทราบ) จะถูกนำไปใช้พร้อมกับคำตอบอื่น ๆ ของคำเดียวกันเพื่อเปลี่ยนเป็นคำที่รู้จักเช่นกัน


4
... ซึ่งเป็นสาเหตุที่เมื่อเวลาผ่านไปมันก็ยิ่งทำให้หงุดหงิดที่จะใช้มากขึ้นและทำให้คุณเชื่อว่าคุณเป็นคนงี่เง่า / หุ่นยนต์เมื่อคุณล้มเหลวเป็นครั้งที่ 5 ติดต่อกัน :-(
Sirex

แปลก ... ฉันไม่เคยล้มเหลวที่ฉันจำได้บางทีอาจจะโชคดี
พอล

@Sirex ฉันเคยคิดว่า แต่แล้วฉันก็รู้ว่านี่เป็นเรื่องจริงถ้าขนาดของข้อความ Corpus มีค่าคงที่หรือหดตัวเมื่อเทียบกับรายการ captcha จำนวน ความจริงก็คือข้อความคลังกำลังเพิ่มขึ้น ... คำถามคือว่าการเจริญเติบโตนั้นสอดคล้องกับการเติบโตของการใช้แคปต์ชา
Joel Coehoorn

ใช่ฉันเดา ฉันได้เห็น reCaptchas มากมายซึ่งยากมาก ที่ใดก็ตามที่คำที่รู้จักนั้นคลุมเครือ
Sirex
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.