นิพจน์ปกติสามารถใช้ใน URL ขณะเรียกดูได้หรือไม่


0

ฉันรับรู้ถึงGoogle Dorksที่ใช้ตัวดำเนินการขั้นสูงเพื่อค้นหาคำหลักบนเว็บและ Google Dorks ไม่ได้เป็น Regex แต่อย่างใด

ฉันพยายามใส่อักขระตัวแทนใน URL เป็นส่วนใหญ่เพื่อให้ได้ภาพในเว็บไซต์ต่างๆที่ไม่ได้ผล ส่วนใหญ่แสดงรหัสข้อผิดพลาด HTTP ต่างๆยกเว้น 2-3 ที่เปลี่ยนเส้นทางไปยังหน้าอื่น ๆ ภายในเว็บไซต์

ตัวอย่างบางส่วนที่ไม่ได้ผล:

  • กำลังค้นหา PDF ได้404 : Page Not Found

ค้นหา PDF

  • กำลังค้นหารูปภาพ ได้500 : Internal Server Error

ค้นหารูปภาพ regex

  • ค้นหาหน้า HTML ทั้งหมดในเว็บไซต์ หน้าผิดพลาด

ค้นหาหน้า HTML

  • Youtube แปลงอักขระเป็นอักขระฐานสิบหกที่ปลอดภัย

ค้นหา Youtube

ตัวอย่างที่ใช้งานได้ (ไม่ทราบวิธี):

คำถามที่ติดแท็ก Windows

คำถามที่ติดแท็ก Linux

ดูQuestion Taggedส่วนทางด้านขวาของหน้าเพื่อดูการค้นหาคำทั้งหมดlin*

ฉันขอโทษหากคำถามมีรายละเอียดมากเกินไป แต่ฉันคิดว่ามันเหมาะสมที่จะยกตัวอย่าง ดังนั้นที่นี่ฉันสรุปคำถามของฉัน:

  1. นิพจน์ทั่วไปสามารถใช้ใน URL ใด ๆ ในขณะเรียกดูได้หรือไม่

  2. ถ้าเป็นเช่นนั้นกฎหรือวิธีการใช้มีอะไรบ้าง

  3. นอกจากนี้ส่วนการใช้งานภายใต้หน้า Wikipedia สำหรับนิพจน์ทั่วไปอ้างอิงสิ่งนี้

    ในขณะที่ regex จะเป็นประโยชน์ในเครื่องมือค้นหาทางอินเทอร์เน็ตการประมวลผลข้อมูลเหล่านั้นในฐานข้อมูลทั้งหมดอาจใช้ทรัพยากรคอมพิวเตอร์มากเกินไปขึ้นอยู่กับความซับซ้อนและการออกแบบของ regex แม้ว่าในหลายกรณีผู้ดูแลระบบสามารถเรียกใช้แบบสอบถามที่ใช้ regex ภายในเครื่องมือค้นหาส่วนใหญ่ไม่ให้การสนับสนุน regex แก่สาธารณะ ข้อยกเว้นที่น่าสังเกต: การค้นหารหัสของ Google, Exalead การค้นหารหัส Google ปิดตัวลงเมื่อเดือนมกราคม 2555 [39] มันใช้ดัชนี Trigram เพื่อเพิ่มความเร็วในการสืบค้น [40]

    ดังนั้นมันเหมือนกับว่าเราสามารถทำ Regex Search บนเสิร์ชเอ็นจิ้น แต่ไม่ใช่ในเว็บเพจได้หรือไม่?


ในขณะที่คุณทำตัวอย่างที่ดีของคำถามคำถามของคุณยังคงสับสน โดยทั่วไป URL เป็นเพียงสตริงและวิธีการแยกวิเคราะห์ในด้านการรับมันขึ้นอยู่กับวิธีจัดการในด้านการรับดังนั้นคำตอบในกรณีส่วนใหญ่ - ไม่ หากคำถามเฉพาะของคุณเกี่ยวกับวิธีใช้ตัวดัดแปลงในเครื่องมือค้นหาเฉพาะ - เป็นเรื่องที่แตกต่างและ AFAIK google ไม่รองรับ regex ฟีเจอร์เต็มรูปแบบ
อเล็กซ์

คำตอบ:


1

โดยทั่วไปแล้วไม่มี (เช่นไวด์การ์ดและนิพจน์ทั่วไปจะไม่เหมือนกัน)

แต่ละเว็บไซต์จะตัดสินใจเองโดยสมบูรณ์ว่าควรตีความเส้นทางและข้อความค้นหาอย่างไร พา ธ อาจสอดคล้องกับไฟล์จริงหรืออาจแมปไปยังแหล่งข้อมูลนามธรรมเช่น "คำถาม" หรือ "โพสต์" (เช่น SuperUser ไม่มีโฟลเดอร์ชื่อquestionsเต็มไปด้วยโฟลเดอร์ย่อยที่มีหมายเลข - เส้นทางจะบอกให้ทราบถึงสิ่งที่ตอบสนองต่อการสร้าง)

นอกจากนี้ยังหมายความว่าแต่ละเว็บไซต์จะตัดสินใจว่าจะรองรับไวด์การ์ด (หรือการแสดงผลปกติหรือวิธีการกรองอื่น ๆ ) หรือไม่ โดยปกติแล้วการเพิ่มคุณสมบัตินี้จะต้องมีการเขียนโปรแกรมเพิ่มเติมในเว็บไซต์

ตามที่คุณค้นพบผู้ใช้ขั้นสูงใช้สัญลักษณ์แทนสำหรับการเรียกดูแท็กซึ่งเป็นประโยชน์ในการค้นหาคำถามที่เกี่ยวข้องกับ Windows ทั้งหมด (และอาจใช้งานง่ายกว่าแท็กแบบลำดับชั้น)

ตัวอย่างเช่น ID วิดีโอของ YouTube นั้นสุ่มอย่างสมบูรณ์ดังนั้นจึงไม่มีประโยชน์ใด ๆ ในการพยายามแสดงรายการวิดีโอทั้งหมดที่มี ID เริ่มต้นด้วยRgK...หรือนำหน้าอื่น ๆ ดังนั้น YouTube จึงไม่ได้ใช้

เว็บเซิร์ฟเวอร์ "ธรรมดา" ซึ่งเพิ่งให้บริการไฟล์. html ธรรมดาสามารถใช้คุณสมบัตินี้เนื่องจากพวกเขามักจะมีรายชื่อไดเรกทอรีอัตโนมัติอยู่แล้ว อย่างไรก็ตามเจ้าของเว็บไซต์จำนวนมากไม่ต้องการสิ่งนี้ - พวกเขาอาจมีหน้าเว็บที่ "ไม่แสดง" ซึ่งเป็นที่รู้จักของบางคนเท่านั้น

(มีคุณสมบัติที่คล้ายกันใน Apache httpd ซึ่งช่วยให้คุณรับรายชื่อไดเรกทอรีแบบเต็มแม้ว่าจะมีไฟล์ index.html อยู่ แต่จะต้องปิดการใช้งานตามค่าเริ่มต้นเพราะหลาย ๆ คนใช้ index.html เป็นวิธีที่เชื่อถือได้จริง เพื่อปิดการใช้งานรายชื่อเหล่านั้น)


คำตอบของคุณครอบคลุมสถานการณ์ตัวอย่างของฉันและฉันต้องการทราบความแตกต่างระหว่าง Regex และ WildCards
C0deDaedalus

ฉันสงสัยว่าคุณจะได้รับรู้ว่าSuperUser ไม่จริงได้โฟลเดอร์ที่เรียกว่าquestions ? คุณใช้dirbเครื่องมือ
C0deDaedalus

@ C0deDaedalus ค้นหาไฟล์. htaccess และเปลี่ยนเส้นทาง มันจะแสดงให้คุณเห็นว่าคุณสามารถเปลี่ยนเส้นทางอะไรก็ได้ตามรูปแบบที่แตกต่างกัน ฉันเชื่อว่า regex บางประเภทสามารถใช้ใน. htaccess ได้
LPChip
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.