Google ลงโทษแท็ก <lastmod> ที่อัปเดตทุกวันในแผนผังไซต์หรือไม่หากข้อมูลไม่อัพเดททุกวัน


10

ฉันมีแผนผังไซต์ที่สร้างขึ้นทุกวันพร้อมลิงก์จำนวนมากไปยังหน้าผลิตภัณฑ์ ผลิตภัณฑ์เหล่านี้นำเข้าทุกวันจากแหล่งข้อมูลอื่น เนื่องจากการอัปเดตประกอบด้วยการทิ้งข้อมูลผลิตภัณฑ์ปัจจุบันทั้งหมดและแทนที่ด้วยข้อมูลที่นำเข้าใหม่วันที่แก้ไขล่าสุดจะข้ามไปหนึ่งวันเสมอ นอกจากนี้ยังใช้ในแผนผังไซต์ แม้สำหรับผลิตภัณฑ์ที่ไม่ได้เปลี่ยน หน้าผลิตภัณฑ์ทั้งหมดแกล้งทำเป็นว่าได้รับการปรับปรุง

Google จะลงโทษเว็บไซต์ที่อ้างว่ามีการเปลี่ยนแปลงหน้าเว็บในแต่ละวันหรือไม่?

โซลูชันของฉันจะเปลี่ยนรายการก็ต่อเมื่อข้อมูลผลิตภัณฑ์ที่นำเข้าใหม่แตกต่างจากข้อมูลก่อนหน้า ฉันแค่ต้องการทำให้แน่ใจว่านี่เป็นการอัพเกรดที่มีประโยชน์ในขณะที่ฉันสามารถใช้เวลากับการปรับปรุงอื่น ๆ ได้

คำตอบ:


5

ฉันไม่เคยได้ยินอะไรเกี่ยวกับบทลงโทษเนื่องจากสิ่งนี้ ที่แย่ที่สุดที่คุณเสียเวลาไปกับแมงมุม แต่นั่นเป็นส่วนหนึ่งของสาเหตุที่เรามีคอมพิวเตอร์ตั้งแต่แรก: ทำสิ่งที่น่าเบื่อซ้ำซาก แต่ถึงกระนั้นคุณควรจะแก้ไขปัญหา

นี้...

โซลูชันของฉันจะเปลี่ยนรายการก็ต่อเมื่อข้อมูลผลิตภัณฑ์ที่นำเข้าใหม่แตกต่างจากข้อมูลก่อนหน้า

... คือสิ่งที่คุณควรทำตั้งแต่แรกโดยไม่คำนึงถึงข้อควรพิจารณาภายนอกเช่นแผนผังไซต์ ฯลฯ หากเนื้อหาของคุณไม่แตกต่างกัน (และฉันจะรวมถึงการลบและแทนที่ด้วยข้อมูลที่เหมือนกันในคำอธิบายนั้น) ดังนั้นlastmodวันที่ของคุณไม่สามารถแก้ไขได้ ที่นี่คุณกำลังสูญเสียทรัพยากรของคุณเอง คุณยังไม่ได้บอกว่ามีผลิตภัณฑ์กี่ชิ้นที่เกี่ยวข้อง แต่จะมีจุดที่กระบวนการนี้จะช้าและมีราคาแพง


ฉันเห็นด้วยอย่างยิ่ง อย่างไรก็ตามฉันเชื่อถือได้กับ บริษัท อื่นที่ให้ข้อมูล พวกเขามักจะส่งทุกผลิตภัณฑ์ (+200) ในการส่งออกข้อมูลของพวกเขา ดังนั้นการอัพเดตล็อตจึงดูเหมือนเป็นทางออกที่ดีที่สุดเมื่อไม่กี่ปีที่ผ่านมา ลูกค้าของฉันไม่มีงบประมาณในการแก้ไขปัญหานี้อย่างเหมาะสม อดีต / การนำเข้าเหล่านี้เกิดขึ้นในเวลากลางคืนดังนั้นแหล่งข้อมูลที่ใช้งานเพิ่มเติมจึงไม่ใช่ปัญหาใหญ่ในขณะนี้
Elicit

@ แก้ไขหากคุณยังมีปัญหานี้เพียงแค่เก็บการส่งออกข้อมูลจากวันก่อนในรูปแบบดั้งเดิมที่แยกวิเคราะห์ได้และทำการเปรียบเทียบสไตล์ git diff เพื่อดูว่าผลิตภัณฑ์มีการเปลี่ยนแปลงอย่างไร แม้ว่าจะดี แต่คุณไม่ต้องการให้พวกเขาส่งผลิตภัณฑ์ที่เปลี่ยนแปลงไปให้คุณเท่านั้น คุณควรจะคิดออกเอง
เพนกวินที่ไม่เปิดเผยตัว

3

ฉันไม่เคยชอบความคิดที่จะอัปเดต<lastmod>ทุกวันเพราะมันไม่ใช่แค่ผิดมันเป็นเครื่องมือค้นหาที่ทำให้เข้าใจผิด

ในโพสต์บน SO , Gary Illyes ของ Google เขียนว่า:

แท็ก Lastmod เป็นตัวเลือกใน sitmaps และในกรณีส่วนใหญ่มันถูกละเว้นโดยเครื่องมือค้นหาเพราะเว็บมาสเตอร์ทำงานได้อย่างน่ากลัวทำให้มันแม่นยำ

ฉันมักจะสนับสนุนการใช้<lastmod>อย่างถูกต้องหรือไม่เลย การปล่อยทิ้งไว้ (รวมถึง<changefreq>& <priority>) ทำให้ไฟล์มีขนาดเล็กลงและเร็วขึ้นสำหรับเครื่องมือค้นหาให้อ่านเช่นกัน


2

ไม่ Google จะใช้lastmodเป็นคำใบ้ (เช่นเดียวกับค่าแผนผังไซต์ทั้งหมด) แต่หากตัดสินใจว่าเนื้อหาของคุณไม่ได้รับการอัปเดตทุกวันก็จะไม่สนใจและจะกลับมาที่หน้าเว็บตามกำหนดเวลาของตัวเอง


2

ฉันไม่ได้ทำงานกับ Google และไม่สามารถบอกได้ว่าสิ่งที่พวกเขาทำจริง ๆ แต่วิธีที่เหมาะสมสำหรับพวกเขาในการรักษา<lastmod>เวลาจะเป็นคำแนะนำที่จะไม่เสียเวลาในการรวบรวมข้อมูลหน้าเว็บที่ไม่มีการเปลี่ยนแปลง

ดังนั้นหากคุณรายงานหน้าเว็บทั้งหมดที่มีการเปลี่ยนแปลงทุกวัน Googlebot จะทำการรวบรวมข้อมูลหน้าเว็บของคุณทุกหน้าจอตามลำดับที่มันรู้สึกมากกว่าที่จะจดจ่อกับหน้าเว็บที่เปลี่ยนไป ผลก็คือคุณไม่ได้รายงานการแก้ไขครั้งล่าสุดเลย

เหตุผลหลักในการระบุ<lastmod>เวลาที่ถูกต้องคือการเปลี่ยนแปลงเว็บไซต์ของคุณให้ปรากฏเร็วขึ้นในดัชนีของ Google หากคุณมีหลายร้อยหน้าในเว็บไซต์ของคุณอาจต้องใช้เวลาสักครู่ก่อนที่ Google จะรวบรวมข้อมูลทั้งหมดและค้นหาการเปลี่ยนแปลงใด ๆ อย่างไรก็ตามหากคุณบอกกับ Googlebot ว่าหน้าใดมีการเปลี่ยนแปลงเมื่อเร็ว ๆ นี้หน้านั้นสามารถรวบรวมข้อมูลหน้าเว็บเหล่านั้นก่อนและหลีกเลี่ยงการเสียเวลาไปกับที่เหลือ

แน่นอนคุณสามารถเพิ่มอัตราการรวบรวมข้อมูลของ Googlebotในเครื่องมือของผู้ดูแลเว็บแทนและหวังว่าจะดีที่สุด แต่จริงๆแล้วมันไม่ควรจะยากเกินไปที่จะทำให้สคริปต์การอัพเดทของคุณคงไว้ซึ่งการประทับเวลา ตัวอย่างเช่นฉันสมมติว่าคุณกำลังทำสิ่งนี้:

for each product do:
    write new page content into product page file;
end do;

ถ้าเป็นเช่นนั้นเพียงเปลี่ยนเป็นแบบนี้แทน:

for each product do:
    read old page content from product page file into string A;
    write new page content into string B;
    if A is not equal to B then:
        write string B into product page file;
    end if;
end do;

2

ไม่มันจะไม่สนใจข้อมูลที่คุณให้เมื่อมันไม่ถูกต้อง ในกรณีนี้โปรแกรมรวบรวมข้อมูลเว็บจะคิดออกด้วยตนเองว่าควรรวบรวมข้อมูลหน้าเว็บของคุณบ่อยเพียงใด


ลิงก์เสีย ...
Victor Schröder

1

Google จะไม่ลงโทษคุณในเรื่องนี้ เพื่อที่จะได้รับการลงโทษคุณต้องสวมหมวกสีดำบนตูดของ Google ดังนั้นไม่ต้องกังวลกับเรื่องนั้น Google จะทราบได้เร็วพอหากเนื้อหาของคุณมีการเปลี่ยนแปลง (นั่นคือสิ่งที่พวกเขาได้ทำงานในช่วงไม่กี่ปีที่ผ่านมา) และใช้คุณสมบัติ Lastmod เป็นคำใบ้


1

ฉันแนะนำให้คุณอ่านแนวทางปฏิบัติที่ดีที่สุดสำหรับ XML sitemaps & RSS / Atom feeds

เวลาแก้ไขล่าสุด

ระบุเวลาแก้ไขล่าสุดสำหรับแต่ละ URL ใน XML sitemap และ RSS / Atom feed เวลาแก้ไขครั้งล่าสุดควรเป็นครั้งสุดท้ายที่เนื้อหาของหน้าเว็บเปลี่ยนไปอย่างมีความหมาย หากหมายถึงการเปลี่ยนแปลงที่จะมองเห็นได้ในผลการค้นหาเวลาแก้ไขล่าสุดควรเป็นเวลาของการเปลี่ยนแปลงนี้

XML sitemap uses  <lastmod>
RSS uses <pubDate>
Atom uses <updated>

ตรวจสอบให้แน่ใจว่าตั้งหรืออัปเดตเวลาแก้ไขล่าสุดอย่างถูกต้อง:

Specify the time in the correct format: W3C Datetime for XML sitemaps, RFC3339 for Atom and RFC822 for RSS.
Only update modification time when the content changed meaningfully.
Don’t set the last modification time to the current time whenever the sitemap or feed is served.

ขอบคุณสำหรับการอัพเดท หวังว่าผู้ลงคะแนนเสียงจะเห็นและลงคะแนนกลับ
John Conde
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.