ไดเรกทอรีที่รู้จักกันดีคืออะไรและฉันควรตั้งค่าอย่างไร


14

ในข้อผิดพลาดในการรวบรวมข้อมูลเครื่องมือของผู้ดูแลเว็บฉันมีบางสถานที่ที่ปฏิเสธการเข้าถึง:

.well-known/apple-app-site-association
.well-known/assetlinks.json
.well-known/.com

ฉันดูที่RFC 5785แต่ฉันไม่เข้าใจจริงๆ จริง ๆ แล้วฉันพยายามที่จะติดตามเอกสาร RFC จำนวนมากดูเหมือนว่าพวกเขาจะเต็มไปด้วยคำศัพท์ที่ไม่สามารถอธิบายและคลุมเครือได้จำนวนมาก

วัตถุประสงค์ของไดเรกทอรีนี้และไฟล์ทั้งสามนี้คืออะไร? เนื้อหาของพวกเขาควรเป็นอย่างไร ฉันควรกังวลเกี่ยวกับเรื่องนี้หรือไม่? ฉันควรบล็อกไดเรกทอรีใน robots.txt หรือไม่

นี่เป็นครั้งแรกที่ฉันเคยเจอไดเรกทอรีนี้ฉันไม่เชื่อว่ามันมีอยู่และฉันไม่ได้พยายามเติมมัน (ซึ่งอาจเป็นเหตุผลว่าทำไมมันถึงถูกปฏิเสธ) ฉันยังไม่รู้ลิงค์ใด ๆ ไปยังไดเรกทอรีนี้จากเว็บไซต์ของฉัน


1
ตำแหน่งที่ถูกปฏิเสธมักเป็นผลมาจากทรัพยากรที่ถูกบล็อกทั้งในไฟล์ robots.txt หรือ htaccess ของคุณ โปรดแก้ไขคำถามของคุณและรวมเนื้อหาของไฟล์เหล่านี้นอกจากนี้ ... ไม่มี.well-known/อยู่จริง?
Simon Hayter

4
จริง ๆ แล้วฉันพยายามที่จะติดตามเอกสาร RFC จำนวนมากดูเหมือนว่าพวกเขาจะเต็มไปด้วยคำศัพท์ที่ไม่สามารถอธิบายและคลุมเครือได้จำนวนมาก คุณไม่ได้อยู่คนเดียว! ไชโย !!
Closnoc

1
หากฉันยังไม่ได้ข้าม.well-known/ควรเป็นไดเรกทอรีที่ซ่อนอยู่และไม่สามารถใช้ได้กับการร้องขอภายนอกอย่างไรก็ตามมีองค์ประกอบองค์ประกอบด้านรหัสของเซิร์ฟเวอร์เช่นโปรแกรม CGI, Java และสิ่งที่คล้ายกัน
Closnoc

2
เป็นไปได้ว่าจะเลือกลิงก์จากหน้าอื่น มันเป็นความพยายามของ URI ขยะฉันจะไม่กังวลถ้าคุณมีทรัพยากรที่นั่นและมีคนรู้จักพวกเขา
L Martin

คำตอบ:


12

RFC 5785 สามารถถอดความได้:

ถ้าคุณสร้าง URL ใหม่ ๆ เช่นrobots.txtหรือfavicon.icoที่คาดว่าจะเป็นที่สถานที่หนึ่งในทุกเว็บไซต์คุณต่อจากนี้ไปจะทำเช่นการเริ่มต้น URL /.well-known/ที่มี

นอกจากนี้คุณจะต้องลงทะเบียน URL ดังกล่าวทั้งหมดด้วย IETF เพื่อให้มีรายการส่วนกลางขนาดใหญ่ของ URL ทั้งหมดเหล่านี้

รีจิสตรีดูเหมือนจะอยู่ที่นี่: https://www.iana.org/assignments/well-known-uris/well-known-uris.xhtml คุณสามารถดูรีจิสตรีได้ด้วยการตัดสินใจว่า URL ใด ๆ ที่ร้องขอนั้นมีวัตถุประสงค์ที่ จะช่วยเว็บไซต์ของคุณและสร้างเอกสารหากมีประโยชน์

จาก URL ที่คุณพูดถึงในคำถามของคุณassetlinks.jsonมีการลงทะเบียนอย่างถูกต้องเท่านั้น

โดยทั่วไปแล้วไม่มีเหตุผลในการสร้างเอกสารเพียงเพราะ Google รายงานว่าเป็น 404 Google คาดว่าจะได้รับข้อผิดพลาด 404 ในเว็บไซต์ พวกเขายังพิจารณาว่าเป็นสัญญาณของเว็บไซต์ที่มีสุขภาพดีที่ URL ที่ไม่มีเอกสารจะแสดงสถานะที่ถูกต้อง (404)


1
โอเคดังนั้นเพื่อให้เป็นไปตามหลักการแล้ว robots.txt ของฉันควรจะถูกย้ายไปยังสถานที่สาธารณะที่สามารถเข้าถึงได้www.mysite.com/.well-known/robots.txtแทนที่จะอยู่ที่www.mysite.com/robots.txt? แต่ในที่สุดมันก็ไม่สำคัญหรอกเหรอ?
Arth

7
robots.txtไม่ฉันจะไม่ย้าย URL นั้นถูกสร้างขึ้นมาอย่างดีก่อนหน้านี้คำสั่งที่รู้จักกันดีและฉันคาดหวังว่า URL นั้นจะยังคงเป็นแบบปู่อยู่ในตำแหน่งปกติ
Stephen Ostermiller

เยี่ยมมากมันสมเหตุสมผลแล้วขอบคุณสำหรับความช่วยเหลือ! หากคุณสามารถถอดความทั้งหมด RFCs อื่น ๆ มากเกินไปที่ต้องการจะบวม :)
Arth
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.