Robots.txt: ฉันต้องไม่อนุญาตหน้าเว็บที่ไม่ได้เชื่อมโยงกับที่อื่นหรือไม่?


12

มีบางหน้าในเว็บไซต์ของฉันที่ฉันต้องการให้ผู้ใช้สามารถเข้าชมได้ก็ต่อเมื่อฉันให้ URL แก่เขา / เธอ

หากฉันไม่อนุญาตให้มีหน้าเว็บเดียวในหน้าrobots.txtพวกเขาจะมองเห็นได้โดยใครก็ตามที่เข้าไปดู

คำถามของฉันคือ: ถ้าฉันไม่เชื่อมโยงพวกเขาจากที่ใดก็ได้หรืออย่างน้อยจากหน้าเว็บที่จัดทำดัชนีใด ๆ พวกเขาจะยังคงเข้าถึงโปรแกรมรวบรวมข้อมูลได้หรือไม่?

คำตอบ:


11

คุณไม่ต้องการให้หน้าเว็บปรากฏใน SERP เลย ...

อย่าไม่อนุญาตใน robots.txt เพิ่มเมตาแท็ก noindex (หรือส่วนหัว X-Robots-Tag HTTP) ให้กับหน้าเว็บของคุณแทน

ตามที่ j0k แนะนำคุณอาจพบหน้าเว็บของคุณได้ รายงานสถิติรายชื่อไดเรกทอรี ฯลฯ ...

การไม่อนุญาตใน robots.txt จะป้องกันไม่ให้มีการรวบรวมข้อมูลหน้า แต่ก็ยังสามารถจัดทำดัชนีและอาจปรากฏเป็นลิงค์ URL อย่างเดียวใน SERP สิ่งที่ต้องการ:

ลิงก์ URL ใน Google SERPs เท่านั้น

เมตาแท็ก noindex ป้องกันไม่ให้หน้าปรากฏใน SERPs แต่ Google จะต้องสามารถรวบรวมข้อมูลหน้าเพื่อดูเมตาแท็ก noindex ดังนั้นจึงไม่สามารถไม่อนุญาตใน robots.txt!

หากมีสิ่งใดในหน้าเว็บที่ต้องไม่เปิดเผยต่อสาธารณะหน้านั้นจะต้องมีการรับรองความถูกต้องบางอย่าง


สิ่งหนึ่งที่ต้องจำไว้ก็คือถ้านี่เป็นสิ่งที่เป็นความลับจริงๆแล้ว "ซ่อน" ด้วย URL นั้นเป็นวิธีปฏิบัติที่ไม่ดีโดยไม่คำนึงถึงวิธีการที่คุณเลือก การใช้การพิสูจน์ตัวตนที่ถูกต้องเป็นสิ่งสำคัญในกรณีเช่นนี้
John Mueller

1
นอกจากนี้ปุ่มโซเชียลมีเดีย (ไลค์ / แชร์ / + 1 / บุ๊กมาร์กต่างๆ) ยังดึงเนื้อหาและอาจแสดง URL ชื่อและตัวอย่างในแบบสาธารณะแม้ว่า URL นั้นจะมี noindex อยู่ก็ตาม (หรือไม่ได้รับอนุญาตจากหุ่นยนต์ .txt) วิธีเดียวที่จะป้องกันไม่ให้ใช้การพิสูจน์ตัวตน
John Mueller

2

ฉันคิดว่าคุณมีซอฟต์แวร์รวบรวมข้อมูลที่ดีที่อ่าน robots.txt และปฏิบัติตามคำสั่ง และอีกอันที่ไม่ทำตามคำสั่ง

และคุณวางแผนจะให้ URL นี้อย่างไร ทางอีเมลโดยใช้ Facebook หรือ Twitter? บริการเหล่านี้รวบรวมข้อมูลข้อมูลที่คุณส่ง Gmail แยกอีเมลที่คุณได้รับเพื่อให้โฆษณา ดังนั้น URL ของคุณจะถูกตระเวน

บางคนใช้ Google Toolbar (หรือแถบเครื่องมืออื่นจากเครื่องมือค้นหา) มีตัวเลือก (ตรวจสอบโดยค่าเริ่มต้นถ้าฉันจำได้ดี) ที่อนุญาตให้แถบเครื่องมือส่ง URL ทั้งหมดที่คุณเยี่ยมชมไปยัง Google นี่เป็นอีกวิธีหนึ่งที่ Google จะได้เห็นเว็บที่ซ่อนอยู่ ดังนั้นแม้ว่าคุณจะบอกให้บุคคลนั้นไม่แบ่งปัน URL ก็ตามเขา / เธอก็จะ (โดยใช้แถบเครื่องมือ)

ฉันคิดว่าเราสามารถพบความเป็นไปได้อื่น ๆ อีกมากมาย

ดังนั้นคุณอาจเพิ่มไปยัง robots.txt แต่ยังมีเมตาเพิ่มเติมเช่น noindex, nofollow, ฯลฯ

แก้ไข:

คำแนะนำของ w3d เกี่ยวกับ robots.txt นั้นดูดีสำหรับฉัน ดังนั้นอย่าเพิ่มลงใน robots.txt และให้เมตาแท็ก propre


ฉันกำลังเชื่อมโยงพวกเขาผ่านอีเมล ใช่ฉันกำลังวางแผนที่จะให้เมตาที่เหมาะสม ดังนั้นข้อเสนอแนะของคุณคือการเพิ่มลงในโรบอตหรือไม่? ขอบคุณ
martjno

ฉันอยากจะแนะนำให้เพิ่มไปยัง robots.txt แต่ข้อเสนอแนะของ w3d ทำให้ฉันเปลี่ยนใจ อย่าเพิ่ม แต่ให้เมตาแท็กที่เหมาะสม
j0k

0

นอกเหนือจากความคิดเห็นข้างต้นแล้วฉันจะแนะนำให้ใช้การรับรองความถูกต้อง HTACCESS เป็นอย่างน้อยเช่นกันคุณสามารถมอบชื่อผู้ใช้ / รหัสผ่านแบบผสมให้กับบุคคลในช่วงระยะเวลาที่ได้รับสิทธิ์ของพวกเขาเพื่อดูหน้าเว็บ

หากมีสิ่งใดที่มีปัญหาความเป็นส่วนตัวคุณต้องพิจารณาสคริปต์ควบคุมการเข้าสู่ระบบที่เหมาะสม

หน้าเว็บที่ไม่มีการป้องกัน (ไม่ว่าคุณจะคิดว่าซ่อนไว้ดีแค่ไหนก็ตาม) ก็จะทำให้มันกลายเป็นความบ้าคลั่ง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.