เพื่อป้องกันไฟล์ PDF ของคุณ (หรือไฟล์ที่ไม่ใช่ HTML) จากการแสดงในผลการค้นหาวิธีเดียวคือใช้X-Robots-Tag
ส่วนหัวการตอบกลับHTTP เช่น:
X-Robots-Tag: noindex
คุณสามารถทำได้โดยการเพิ่มตัวอย่างต่อไปนี้ในไฟล์ root .htaccess ของเว็บไซต์หรือไฟล์ httpd.conf:
<Files ~ "\.pdf$">
Header set X-Robots-Tag "noindex, nofollow"
</Files>
โปรดทราบว่าสำหรับการทำงานด้านบนคุณต้องสามารถแก้ไขส่วนหัว HTTP ของไฟล์ที่เป็นปัญหาได้ ดังนั้นคุณอาจจะไม่สามารถที่จะทำเช่นนี้เช่นบนหน้า GitHub
โปรดทราบว่าrobots.txtไม่ได้ป้องกันไม่ให้หน้าเว็บของคุณปรากฏในผลการค้นหา
มันจะหยุดบอทจากการรวบรวมข้อมูลหน้าของคุณ แต่ถ้าบุคคลที่สามเชื่อมโยงไปยังไฟล์ PDF ของคุณจากเว็บไซต์ของพวกเขาหน้าของคุณจะยังคงอยู่ในรายการ
หากคุณหยุดบอทไม่ให้รวบรวมข้อมูลหน้าเว็บของคุณโดยใช้robots.txtก็จะไม่มีโอกาสเห็นX-Robots-Tag: noindex
แท็กตอบ ดังนั้นห้ามใช้หน้าเว็บในrobots.txtหากคุณใช้X-Robots-Tag
ส่วนหัว ข้อมูลเพิ่มเติมสามารถพบได้บนGoogle Developers: หุ่นยนต์ Meta Tag