ฉันสงสัยอย่างมากว่าวันที่เผยแพร่ของโพสต์หรือบทความนั้นอิงจาก<lastmod>
รายการในแผนผังไซต์ XML (ตามที่คนอื่นแนะนำ) หรือส่วนหัว HTTP Last-Modified HTTP สำหรับเรื่องนั้น Sitemap XML เป็นคำแนะนำเท่านั้นไม่ใช่ที่มีสิทธิ์ วันที่แก้ไขล่าสุดของเอกสารอาจไม่เหมือนกับวันที่เผยแพร่ (ต้นฉบับ) ของบทความ และตามที่ฉันพูดถึงในความคิดเห็นของฉันที่ด้านบนของหน้าวันที่แก้ไขล่าสุดของเอกสารอาจมีความสำคัญสำหรับแคชและอาจกำหนดอัตราการรวบรวมข้อมูล ส่วนหัว HTTP Last-Modified ของหน้าเว็บที่สร้างขึ้นแบบไดนามิกมักจะใกล้เคียงกับวันที่ / เวลาจริง (เช่นเดียวกับบล็อก WordPress)
ฟีด RSS / Atom ในอีกทางหนึ่งจะมีข้อมูลที่ไม่ซ้ำกันนี้ และแน่นอนในเว็บไซต์ Wordpress ที่ไม่รวมวันที่เผยแพร่ในเนื้อหาวันที่เผยแพร่ยังคงปรากฏในผลการค้นหาของ Google และเท่าที่ฉันบอกได้นี่ตรงกับวันที่ในฟีด RSS
แก้ไข # 1:อย่างไรก็ตามฟีด RSS ไม่จำเป็นต้องมีทุกหน้า ในกรณีส่วนใหญ่ควรมีเฉพาะหน้าเว็บล่าสุดหรือหน้าล่าสุด แต่ไม่มีเหตุผลที่ Google ควรลืมสิ่งที่อ่านไปแล้วและการให้เนื้อหาของหน้านั้นไม่ได้เปลี่ยนไปดังนั้นวันที่แก้ไขครั้งล่าสุดก็ไม่ควร
หากไม่มีฟีด RSS ฉันคิดว่า Google ฉลาดพอที่จะวิเคราะห์เนื้อหาของหน้า โดยเฉพาะอย่างยิ่งถ้าวันที่มีการทำเครื่องหมายขึ้น 'ความหมาย' ด้วยความช่วยเหลือของไมโครฟอร์แมต เป็นไปได้อย่างสมบูรณ์แบบที่ Google จะเห็นสิ่งต่อไปนี้เป็นวันที่เผยแพร่อย่างเป็นทางการสำหรับบทความที่มีอยู่ภายใน:
<abbr class="published" title="2010-08-27T15:45:00-0700">
Friday, August 27th, 2010
</abbr>
Google แน่นอนจะอ่านไมโครฟอร์แมต - hCard, hReview เป็นต้น
เพื่อเพิ่มฉันไม่คิดว่า Google จะระบุวันที่เผยแพร่เว้นแต่จะสามารถค้นหาสิ่งที่มีสิทธิ์ที่จะแนะนำสิ่งนี้ มันจะไม่อนุมาน 'วันที่เผยแพร่' ในข้อมูลการเก็งกำไรเนื่องจาก 'วันที่เผยแพร่' ที่ไม่ถูกต้องจะไม่มีประโยชน์กับใครเลยและ Google จะต้องติดใจเรื่องนี้มาก!
และสำหรับบันทึก (ถ้า @Tom กำลังแนะนำเป็นอย่างอื่น :) ฉันคิดว่าโพสต์ / บทความควรมีวันที่เผยแพร่อย่างชัดเจน หลายคนทำไม่ได้และสิ่งนี้อาจสร้างความผิดหวังให้กับผู้อ่านโดยเฉพาะเมื่อทำการค้นคว้าปัญหาเทคโนโลยีและคุณพบว่าการอ่านบทความครึ่งทางนั้นล้าสมัย!
แก้ไข # 2:ฉันได้พบกับความรำคาญที่คล้ายกันซึ่งรายละเอียด @mmdanziger ในคำตอบของเขา ในเว็บไซต์เก่าของฉันฉันมีข้อความของแบบฟอร์ม "ไซต์ปรับปรุงล่าสุดวันอาทิตย์ที่ 17 มิถุนายน 2012" (ไม่ได้ทำเครื่องหมายด้วยวิธีพิเศษใด ๆ ) ที่ด้านบนสุดของทุกหน้า (เขียนไปยังหน้าด้วย JavaScript !!) Google ได้รับวันที่เดียวกันนี้และปรากฏขึ้นพร้อมกับหลาย ๆ หน้า (แต่ไม่ใช่ทั้งหมด) ที่ปรากฏใน SERPS - นี่ไม่ใช่วันที่เผยแพร่ของหน้าแน่นอน ดูเหมือนว่า Google จะทำการทิ้งหน้าสำหรับสตริงของแบบฟอร์ม "อัปเดตล่าสุด ( datestring )" (มีการประมวลผล JavaScript !!) ไซต์นี้ไม่มีฟีด RSS ไซต์มีไฟล์ Sitemap.xml แต่วันที่นั้นแตกต่างกัน
ฉันได้สังเกตเห็นพฤติกรรมที่คล้ายกันในเว็บไซต์อื่น ๆ ด้วย