เคล็ดลับ Javascript? scribd ทำให้มันยากที่จะได้คัดลอกและวางข้อความได้อย่างไร


19

เมื่อเร็ว ๆ นี้ฉันได้เห็นว่า scribd ทำให้ผู้ใช้ (ผู้ใช้ฟรี) สามารถเรียกดูเอกสารที่โฮสต์บนไซต์ของพวกเขาได้ยากมาก ไม่มีความสามารถในการค้นหาภายในเอกสารนับประสาความสามารถในการดาวน์โหลดเดียวกัน

การใช้จาวาสคริปต์จะโหลดหน้าเว็บตามต้องการในเบราว์เซอร์ดังนั้นคุณลักษณะ "บันทึกเป็น" ของเบราว์เซอร์ไม่ได้ช่วยอะไรมาก

เพื่อความประหลาดใจของฉันฉันเห็นว่าแม้คัดลอก / วางข้อความคัดลอกซึ่งพูดพล่อยๆไปที่คลิปบอร์ด! เพื่อตรวจสอบสิ่งผิดปกติฉันปิดจาวาสคริปต์ในเบราว์เซอร์แล้วโหลดเอกสารเดิมอีกครั้ง Voila ฉันเห็นพูดพล่อยๆ ดังนั้นดูเหมือนว่าจาวาสคริปต์จาก scribd ถอดรหัสข้อความซึ่งพูดพล่อยๆอย่างใดแล้วแสดงในเบราว์เซอร์

ตอนนี้คำถามของฉันคือแม้หลังจากเปิดใช้งานจาวาสคริปต์แล้วและข้อความถูกแสดงอย่างถูกต้องในเบราว์เซอร์ถ้าฉันไปดูวัตถุ DOM ที่ตรงกับข้อความที่ฉันเลือกฉันยังเห็นข้อความพูดพล่อยๆ

ดังนั้นตอนนี้ฉันสับสน ข้อความถูกแสดงให้ผู้ใช้เห็น แต่วัตถุ DOM ยังคงมีความหมายที่ไม่ชัดเจน ดังนั้นคำถามคือประเภทของ javascript hooks / code คือเว็บไซต์ที่ใช้เพื่อให้สามารถเก็บความหมายในวัตถุ DOM และยังคงทำให้ข้อความถอดรหัส?

มีวิธีที่ฉันสามารถเข้าถึงข้อความที่ถอดรหัสหรือไม่ ความตั้งใจของฉันคือการไม่ทำวิศวกรรมอัลกอริทึมให้ถอดรหัส แต่เพื่อค้นหาตำแหน่งที่เก็บข้อความที่ถอดรหัสแล้ว

เอกสารตัวอย่างคือ:

http://www.scribd.com/doc/143886351/OCP-Upgrade-to-Oracle-Database-12c-Student-Guide-vol-1-Exam-1Z0-060

ดูว่าเกิดอะไรขึ้นเมื่อคุณเปิด / ปิด Javascript!


มันเรียบง่าย พวกเขาสร้างโปรแกรมดู pdf javascript Mozilla ทำอะไรกับ Firefox เนื่องจากโปรแกรมดู PDF ของคุณไม่ได้ใช้เพื่อแสดงเนื้อหาพวกเขาสามารถควบคุมได้เกือบทุกแง่มุมของประสบการณ์การรับชม
Ramhound

คำตอบ:


15

ดูที่สำหรับfont-family spanพวกเขาใช้แบบอักษรที่กำหนดเอง (ในกรณีนี้ff6)

พวกเขาต้องทำเช่นนี้เพื่อให้เอกสาร PDF แสดงขึ้นอย่างถูกต้อง เช่นเดียวกับในเอกสาร PDF ไม่มีข้อกำหนดว่าข้อความในเอกสารจะต้องใช้ชุดอักขระมาตรฐาน มันต้องใช้เพียงหนึ่งที่มีรหัสที่แมปสัญลักษณ์ในตัวอักษรที่ฝังตัว


10

หากคุณดูข้อความที่แสดงเทียบกับ "พูดพล่อยๆ" คุณจะเห็นว่าตัวอักษรบางตัวเหมือนกันในขณะที่ตัวอักษรบางตัวถูกแทนที่ ตัวอย่างเช่น "Mltmrprfsm Jblbemr" คือ "Enterprise Manager" มีข้อความเพียงพอคุณควรสร้างตารางการแปลด่วนได้ เรารู้แล้วว่าMแปลเป็นE , L -> N , T , RและPชัดเจน, F -> Rเป็นต้นเมื่อเวลาผ่านไปงานนักสืบและทักษะการเขียนโปรแกรมระดับปานกลางเราสามารถแปลเอกสารทั้งหมดได้

แน่นอนไม่มีการรับประกันว่าเอกสารถัดไปจะใช้แบบff6อักษรเดียวกับที่Dan D. พูดถึงดังนั้นการคว้าแบบอักษรนั้นเพื่อใช้ในท้องถิ่นควรเป็นขั้นตอนต่อไปของคุณหากคุณต้องการบันทึกข้อความไว้ในภายหลัง


0

คุณสามารถลองจับภาพหน้าจอโดยใช้เครื่องมือครอบตัดของเบราว์เซอร์แล้วใช้ไซต์ ocr ออนไลน์ที่พร้อมใช้งานใด ๆ เพื่อแปลงเป็นข้อความ นั่นควรจะแยกคุณออก

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.