ฉันจะหยุดข้อผิดพลาด Soft 404 จากการซ้อนทับสำหรับหน้า“ ไม่มีผลลัพธ์” ได้อย่างไร


9

เมื่อเร็ว ๆ นี้ฉันสังเกตเห็นว่าฉันมีรายการข้อผิดพลาด Soft 404 ที่เพิ่มขึ้นใน Google Webmaster Tools พวกเขาทั้งหมดสำหรับหน้าผลการค้นหาที่สร้างขึ้นแบบไดนามิกที่รายงาน "ไม่พบที่ตรงกัน"

ฉันทำเข้าใจสิ่งที่ Google หมายถึงซอฟท์ 404และทำไมพวกเขามีการรายงานมันสำหรับหน้าเว็บเหล่านี้ ดังนั้นฉันเพิ่มลง<meta name="robots" content="noindex">ในหน้าเหล่านี้

อย่างไรก็ตาม Google ยังคงรายงานข้อผิดพลาดSoft 404ใหม่สำหรับหน้าเว็บที่ใช้เมตาแท็กnoindex

เหตุใด Google จึงรายงานข้อผิดพลาดใด ๆสำหรับหน้าที่ฉันบอกพวกเขาว่าไม่ให้จัดทำดัชนี

ปัญหาคือว่าด้วยข้อผิดพลาดที่ไม่พึงประสงค์เหล่านี้ฉันไม่สามารถดูว่ามีปัญหาจริงที่ต้องแก้ไข

บางคนบอกว่าหน้าเหล่านี้ควรส่งคืนรหัสสถานะ 404 แต่นั่นเป็นเพียงแค่เลื่อนปัญหาไปที่แท็บข้อผิดพลาด 404 นอกจากนี้ Google จะส่งคืนรหัสสถานะ 200 เนื่องจากไม่มีหน้าผลลัพธ์

ฉันไม่ต้องการปิดกั้นการเข้าถึงด้วย robots.txt เพราะฉันต้องการลิงค์ในหน้าเหล่านี้และฉันต้องการให้ Google เห็นเมตาแท็กnoindex นอกจากนี้ยังไม่มีรูปแบบที่ฉันสามารถใช้เพื่อบล็อกสิ่งเหล่านี้

Google พบ URL เหล่านี้ตั้งแต่แรกเพราะเนื้อหาเคยมีอยู่ แต่ถูกลบไปแล้ว ฉันไม่สามารถส่งคืนรหัสสถานะ 410 ได้เนื่องจากรหัส PHP ของฉันไม่มีทางรู้เหตุผลว่าทำไมไม่พบผลลัพธ์

มีอะไรที่ฉันสามารถทำได้เพื่อทำให้ง่ายขึ้นในการดูปัญหาที่แท้จริง


Google ค้นหา URL การค้นหาเหล่านั้นอย่างไร คุณกำลังเชื่อมโยงพวกเขาจากที่อื่นหรือไม่?
DisgruntledGoat

ดูคำถามติดตามผล: webmasters.stackexchange.com/q/55624/33777
toxalot

@DisgruntledGoat ฉันเห็นแล้วในเว็บไซต์ของฉันหลายแห่ง Googlebot ได้รับความสามารถในการทำการค้นหา ฉันก็ไม่แน่ใจเหมือนกันว่ามันเป็นปัญหาจริงหรือเปล่า แต่ฉันไม่เคยมีความสามารถในการหาแหล่งที่มาของพวกเขาอีกค้นหาแปลก
Alexis Wilke

คำตอบ:


7

คุณควรป้องกันไม่ให้ Google รวบรวมข้อมูลหน้าค้นหาไซต์ Google ไม่ได้ต้องการที่จะรวบรวมข้อมูลการค้นหาเว็บไซต์ของคุณที่ทั้งหมด นี่คือโพสต์บล็อกของ Google Matt Cutts เกี่ยวกับปัญหา: ผลการค้นหาในผลการค้นหาโดย Matt Cutts บน 10 มีนาคม 2007 ขณะนี้ Google ได้ลงโทษเว็บไซต์ที่อนุญาตให้รวบรวมข้อมูลผลการค้นหาและปรากฏใน SERP ของ Google โดยให้ Googlebot รวบรวมข้อมูลหน้าผลการค้นหาของคุณคุณจะเสี่ยงทั้งหมดของการเข้าชมแนะนำ Google ของคุณ เคล็ดลับอย่างหนึ่งที่ผู้วิจารณ์ของ Google ใช้คือการค้นหาคำที่เป็นสแปมเช่น "ไวอากร้า" ในเว็บไซต์ของคุณ เมื่อพวกเขาเห็นหน้าเว็บที่รวบรวมข้อมูลได้เป็นผลลัพธ์ (แม้ว่าจะระบุว่า "ไม่พบผลลัพธ์สำหรับไวอากร้า") พวกเขาจะใช้บทลงโทษด้วยตนเองกับเว็บไซต์ของคุณเป็นเว็บไซต์สแปม

robots.txtคุณควรใส่ค้นหาเว็บไซต์ของคุณเป็น เพียงตรวจสอบให้แน่ใจว่า Googlebot ยังคงสามารถรวบรวมข้อมูลหน้าเนื้อหาของคุณได้ จากนั้นคุณจะหยุดรับรายงานข้อผิดพลาด soft 404 ใหม่


ข้อผิดพลาด 404 จำนวนมาก (แม้แต่ข้อผิดพลาด 404 ที่อ่อนนุ่ม) ไม่ส่งผลเสียต่อการจัดอันดับเว็บไซต์ของคุณ Google รายงานข้อผิดพลาดในหน้าใด ๆ ที่พวกเขาสามารถค้นหาและรวบรวมข้อมูลไม่ว่าคุณต้องการให้มีการจัดทำดัชนีหรือไม่และแม้แต่คุณลิงก์ไปยังหน้านั้น พวกเขาทำเช่นนี้เพราะรายงานข้อผิดพลาดเป็นเพียงเพื่อประโยชน์ของคุณและพวกเขารู้สึกว่าคุณควรได้รับการแจ้งอย่างเต็มที่

นี่คือสิ่งที่John Mueller พูดถึงเกี่ยวกับเรื่องนี้ของ Google :

  1. ข้อผิดพลาด 404 ใน URL ที่ไม่ถูกต้องจะไม่เป็นอันตรายต่อการจัดทำดัชนีหรือการจัดอันดับเว็บไซต์ของคุณ แต่อย่างใด ไม่สำคัญว่าจะมี 100 หรือ 10 ล้านพวกเขาจะไม่เป็นอันตรายต่อการจัดอันดับเว็บไซต์ของคุณ http://googlewebmastercentral.blogspot.ch/2011/05/do-404s-hurt-my-site.html
  2. ในบางกรณีข้อผิดพลาดในการรวบรวมข้อมูลอาจมาจากปัญหาโครงสร้างที่ถูกกฎหมายภายในเว็บไซต์หรือ CMS ของคุณ คุณบอกได้อย่างไร ตรวจสอบที่มาของข้อผิดพลาดในการรวบรวมข้อมูลอีกครั้ง หากมีลิงค์เสียในเว็บไซต์ของคุณใน HTML คงที่ของหน้าเว็บของคุณนั่นก็คุ้มค่าที่จะแก้ไขเสมอ (ขอบคุณ + Martino Mosna)
  3. สิ่งที่เกี่ยวกับ URL ขี้ขลาดที่ "แตกชัดเจน" เมื่ออัลกอริทึมของเราชอบไซต์ของคุณพวกเขาอาจพยายามค้นหาเนื้อหาที่ยอดเยี่ยมเพิ่มเติมบนไซต์ตัวอย่างเช่นโดยพยายามค้นหา URL ใหม่ใน JavaScript หากเราลองใช้“ URL” เหล่านั้นและค้นหา 404 นั่นเป็นสิ่งที่ยอดเยี่ยมและคาดหวัง เราแค่ไม่อยากพลาดทุกสิ่งสำคัญ (แทรก meme ของ Googlebot ที่แนบมามากเกินไปที่นี่) http://support.google.com/webmasters/bin/answer.py?answer=1154698
  4. คุณไม่จำเป็นต้องแก้ไขข้อผิดพลาดในการรวบรวมข้อมูลในเครื่องมือของผู้ดูแลเว็บ คุณลักษณะ "ทำเครื่องหมายว่าตายตัว" มีไว้เพื่อช่วยคุณเท่านั้นหากคุณต้องการติดตามความคืบหน้าของคุณที่นั่น มันไม่เปลี่ยนแปลงอะไรในระบบค้นหาบนเว็บของเราดังนั้นคุณสามารถเพิกเฉยได้หากคุณไม่ต้องการ http://support.google.com/webmasters/bin/answer.py?answer=2467403
  5. เราแสดงรายการข้อผิดพลาดในการรวบรวมข้อมูลในเครื่องมือของผู้ดูแลเว็บตามลำดับความสำคัญซึ่งขึ้นอยู่กับหลายปัจจัย หากหน้าแรกของข้อผิดพลาดในการรวบรวมข้อมูลไม่เกี่ยวข้องอย่างชัดเจนคุณอาจไม่พบข้อผิดพลาดการรวบรวมข้อมูลที่สำคัญในหน้าต่อไป http://googlewebmastercentral.blogspot.ch/2012/03/crawl-errors-next-generation.html
  6. ไม่จำเป็นต้อง“ แก้ไข” ข้อผิดพลาดในการรวบรวมข้อมูลในเว็บไซต์ของคุณ การค้นหา 404 นั้นเป็นเรื่องปกติและคาดว่าจะเป็นเว็บไซต์ที่มีการกำหนดค่าที่ดี หากคุณมี URL ใหม่ที่เทียบเท่าการเปลี่ยนเส้นทางไปยัง URL นั้นถือเป็นแนวปฏิบัติที่ดี มิฉะนั้นคุณไม่ควรสร้างเนื้อหาปลอมคุณไม่ควรเปลี่ยนเส้นทางไปยังหน้าแรกของคุณคุณไม่ควร robots.txt ไม่อนุญาต URL เหล่านี้ - สิ่งเหล่านี้ทำให้เรายากที่จะรับรู้โครงสร้างของเว็บไซต์และดำเนินการอย่างถูกต้อง เราเรียกข้อผิดพลาด“ soft 404” เหล่านี้ http://support.google.com/webmasters/bin/answer.py?answer=181708
  7. ชัดเจน - หากข้อผิดพลาดในการรวบรวมข้อมูลแสดงขึ้นสำหรับ URL ที่คุณสนใจบางที URL ในไฟล์ Sitemap ของคุณนั่นคือสิ่งที่คุณควรดำเนินการทันที หาก Googlebot ไม่สามารถรวบรวมข้อมูล URL สำคัญของคุณพวกเขาอาจหลุดจากผลการค้นหาของเราและผู้ใช้อาจไม่สามารถเข้าถึงได้

ไม่ใช่ 'เคล็ดลับ' ที่จะป้องกันไม่ให้มีการทำดัชนีหน้าการค้นหา ไม่มีอะไรน่าผิดหวังไปกว่าการค้นหาคำศัพท์บน Google และรับรายการการค้นหามากกว่าผลลัพธ์ที่แท้จริง ดังนั้น Google จึงลงโทษพฤติกรรมนี้ เมื่อคุณคิดจากมุมมองของผู้ใช้จะเห็นได้อย่างชัดเจนว่าผลการค้นหาชั่วคราวไม่ควรทำดัชนี แต่หน้าเนื้อหาเอง นี่คือเหตุผลที่คุณควรใช้บางสิ่งบางอย่างเช่นแผนผังเว็บไซต์สำหรับดัชนีและใช้หน้าการค้นหาแบบไดนามิกเป็นทางลัดสำหรับผู้ใช้เท่านั้น
JamesRyan

แล้วทำไม Google จึงจัดทำดัชนีหน้าเหลืองให้ผลลัพธ์ที่เหมือนกัน
toxalot

ฉันไม่คิดว่า Google ต้องการจัดทำดัชนีเว็บไซต์สมุดหน้าเหลืองส่วนใหญ่อย่างน้อยก็ไม่ทำให้เว็บไซต์ดังกล่าวโดดเด่นในผลการค้นหา superpages.com มีสำนักงานใหญ่ตั้งอยู่บนถนนจากฉัน ไม่กี่ปีที่ผ่านมา Google ได้จัดอันดับมันค่อนข้างทั่วทั้งกระดาน ทันใดนั้นฉันก็สัมภาษณ์นักพัฒนาของพวกเขาที่เราออกไปหางานใหม่
Stephen Ostermiller

2
@StephenOstermiller คุณมีการอ้างอิงถึงที่ Google กล่าวว่าพวกเขาลงโทษไซต์ที่อนุญาตให้รวบรวมข้อมูลหน้าการค้นหาหรือไม่ ฉันไม่พบอะไรเกี่ยวกับเรื่องนี้
alexp

1
เกี่ยวกับไวอากร้ามันไม่ดีสำหรับฉัน ไซต์ของฉันติดตามการฟ้องร้องและมีการถกเถียงทางกฎหมายกับสิทธิบัตรที่เกี่ยวข้องกับไวอากร้ามากมาย พวกเขาป้องกันไม่ให้ผลบวกผิดเหล่านี้ได้อย่างไร
speedplane
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.