ฉันมีไดเรกทอรีย่อยที่ฉันต้องการซ่อนจากซอฟต์แวร์รวบรวมข้อมูลเว็บของเครื่องมือค้นหา
วิธีหนึ่งในการทำเช่นนี้คือการใช้robots.txt
ในไดเรกทอรีรากของเซิร์ฟเวอร์ (วิธีมาตรฐาน) อย่างไรก็ตามทุกคนที่รู้จัก URL ของเว็บไซต์และมีความรู้พื้นฐานเกี่ยวกับเว็บสามารถเข้าถึงเนื้อหา robots.txt และสามารถสังเกตเห็นไดเรกทอรีที่ไม่อนุญาต
ฉันคิดวิธีที่จะหลีกเลี่ยงปัญหานี้ แต่ฉันไม่แน่ใจว่าจะทำงานได้หรือไม่
อนุญาตX
เป็นชื่อของไดเรกทอรีย่อยที่ฉันต้องการแยกออก วิธีหนึ่งในการหยุดการทำดัชนีเว็บโปรแกรมรวบรวมข้อมูลX
ไดเรกทอรีและในเวลาเดียวกันเพื่อให้ใครบางคนระบุX
ไดเรกทอรีจากรูตได้ยากขึ้นrobots.txt
คือการเพิ่มลงrobots.txt
ในX
ไดเรกทอรีแทนที่จะเป็นไดเรกทอรีหลัก
ถ้าฉันทำตามวิธีนี้ฉันมีคำถามต่อไปนี้:
- โปรแกรมรวบรวมข้อมูลเว็บจะค้นหา
robots.txt
ในไดเรกทอรีย่อยหรือไม่ (เนื่องจากมีrobots.txt
อยู่แล้วและอยู่ในไดเรกทอรีรากด้วย) ถ้า
robots.txt
อยู่ในX
ไดเร็กทอรีย่อยฉันควรใช้พา ธ สัมพัทธ์หรือพา ธ สัมบูรณ์หรือไม่:User-agent: * Disallow: /X/
หรือ
User-agent: * Disallow: /