ฉันใช้ไฟล์ robots.txt ต่อไปนี้สำหรับเว็บไซต์: เป้าหมายคืออนุญาตให้ Googlebot และ bingbot เข้าถึงเว็บไซต์ยกเว้นหน้าเว็บ/bedven/bedrijf/*
และบล็อกบอทอื่น ๆ จากการรวบรวมข้อมูลเว็บไซต์
User-agent: googlebot
Disallow: /bedven/bedrijf/*
Crawl-delay: 10
User-agent: google
Disallow: /bedven/bedrijf/*
Crawl-delay: 10
User-agent: bingbot
Disallow: /bedven/bedrijf/*
Crawl-delay: 10
User-agent: bing
Disallow: /bedven/bedrijf/*
Crawl-delay: 10
User-agent: *
Disallow: /
กฎข้อสุดท้ายUser-agent: * Disallow: /
ไม่อนุญาตให้บอททั้งหมดรวบรวมข้อมูลทุกหน้าในไซต์หรือไม่
robots.txt
นะ
robots.txt
มาหรืออย่างน้อยก็Disallow: /
กฎ หากเว็บไซต์ส่วนบุคคลของคุณกำลังถูกกระแทกเนื่องจากโปรแกรมเมอร์ bot ไม่เคยคิดว่าเซิร์ฟเวอร์อาจเป็น Raspberry Pi ที่ปลายผิดของการเชื่อมต่อ 256 kbit การยกเว้นแบบนี้มีประโยชน์