หากฉันไม่ต้องการตั้งค่าลักษณะพิเศษใด ๆ จะเป็นไรไหมถ้าฉันไม่อยากมีไฟล์ robots.txt


29

หากฉันไม่ต้องการตั้งค่าลักษณะพิเศษใด ๆ จะเป็นไรไหมถ้าฉันไม่อยากมีไฟล์ robots.txt

หรือขาดหนึ่งอาจเป็นอันตรายได้?

คำตอบ:


30

การขาดไฟล์ robots.txt จะไม่เป็นอันตราย จากเว็บไซต์ robotstxt.org :

เพื่อให้หุ่นยนต์ทั้งหมดเข้าถึงได้อย่างสมบูรณ์

ตัวแทนผู้ใช้: *
ไม่อนุญาต:

(หรือเพียงแค่สร้างไฟล์ "/robots.txt" ที่ว่างเปล่าหรือไม่ใช้เลย)

อย่างไรก็ตามแม้ว่าคุณจะไม่ได้ระบุอะไรในไฟล์ robots.txt ของคุณก็เป็นวิธีที่ดีในการแจ้งเครื่องมือค้นหาของสถานที่ตั้งของ XML ของคุณแผนผังไซต์ คุณสามารถทำได้โดยเพิ่มบรรทัดที่ด้านบนของไฟล์ robots.txt ที่มีลักษณะดังนี้:

แผนผังไซต์: http://www.example.com/sitemap-host1.xml

คุณควรทราบด้วยว่าการไม่มีมันจะสร้างรายการจำนวน 404 รายการในบันทึกการใช้เว็บของคุณ


1 - สรุปที่ดีแม้ว่าฉันต้องการจริงๆเน้นสิ่งที่ Kinopiko ได้อย่างถูกต้องเครียดอยู่แล้ว : เพียงแค่สร้างพื้นฐานที่สุดหรือแม้กระทั่งหนึ่งที่ว่างเปล่าเพื่อหลีกเลี่ยงการเหล่านั้นและ 404 (ขึ้นอยู่กับเว็บไซต์ของคุณจัดการหน้า 404) ที่อาจเกิดขึ้นค่อนข้างบางจราจร / แบนด์วิดธ์ , เนื่องจากเครื่องมือค้นหาจะใช้การควบคุมแคช HTTPที่เหมาะสมเพื่อข้ามการดาวน์โหลดไฟล์อีกครั้งหากไม่มีการเปลี่ยนแปลงไม่ว่าจะว่างเปล่าหรือไม่
Steffen Opel

ทำเครื่องหมายว่าเป็นวิกิโปรดแก้ไขตามที่เห็นสมควร
JasonBirch

21

หากคุณไม่มี "robots.txt" บันทึกข้อผิดพลาดของคุณจะได้รับไฟล์จำนวน 404 ไฟล์ซึ่งอาจเป็นเรื่องที่น่ารำคาญเหมือนกับว่าคุณไม่มี favicon


1
เป็นจุดที่ดี ..
Jeff Atwood

1
+1 - ฉันต้องการเพิ่มว่าคุณไม่เพียง แต่ช่วยตัวเองจากไฟล์บันทึกที่มีขนาดใหญ่และมีเสียงดัง แต่สามารถ (ขึ้นอยู่กับไซต์ของคุณในการจัดการหน้า 404) หลีกเลี่ยงการรับส่งข้อมูล / แบนด์วิดท์ที่ค่อนข้างมากเช่นกัน มีขนาดใหญ่กว่าที่เรียบง่ายrobots.txtไฟล์ซึ่งนอกจากจะมีการดาวน์โหลดเนื่องจากมักจะน้อยไปยังเครื่องมือที่เหมาะสมที่จะใช้ค้นหาควบคุมแคช HTTP
Steffen Opel

6

ฉันคิดว่ามันจะมีที่จะตกลงเป็นอย่างอื่นเพาะปลูกขนาดใหญ่ของเว็บจะยกเลิกการจัดทำดัชนีโดยแมงมุมเว็บ

ไม่robots.txtเหมือนกับ "อนุญาตให้สร้างดัชนีโดยทุกคน" robots.txtเกือบจะเป็นคำจำกัดความ


2

การไม่มีไฟล์ robots.txt จะปล่อยให้โปรแกรมรวบรวมข้อมูลตัดสินใจได้ว่าจะทำอะไรได้บ้างและไม่สามารถทำได้ เนื่องจากใช้เวลาเพียงไม่กี่วินาทีในการหลีกเลี่ยงความคลุมเครือใด ๆ ทำไมไม่สร้างเพียงสิ่งเดียวที่ทำให้ตัวแทนทั้งหมดเข้าถึงทุกสิ่งได้


0

เนื่องจากrobots.txtมีที่อยู่ของแผนผังเว็บไซต์ของคุณการไม่มีที่อยู่อาจเป็นอันตรายได้


แผนผังไซต์มีประโยชน์สำหรับเว็บไซต์บางประเภทเท่านั้น IMO
Jeff Atwood

ฉันเคยเห็นซอฟต์แวร์รวบรวมข้อมูล (โดยเฉพาะ google) มองหา /sitemap.xml หรือ /sitemap.gz หากไม่มี robots.txt
Tim Post

คุณไม่จำเป็นต้องมีแผนผังเว็บไซต์ใน robots.txt คุณสามารถส่งไปยัง Google / Yahoo / Bing ได้ แน่นอนว่าไม่ใช่ "อาจเป็นอันตราย"
DisgruntledGoat

0

ทั้งนี้ขึ้นอยู่กับเนื้อหาของคุณไม่ควรมีปัญหาหากไม่มีไฟล์โรบ็อตตราบใดที่คุณต้องการให้มีทุกหน้าในเว็บไซต์ของคุณจัดทำดัชนีโดยเครื่องมือค้นหา

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.