Google จำวันเผยแพร่ของโพสต์ได้อย่างไร


17

เมื่อฉันค้นหาบางอย่างใน Google บางครั้งฉันก็เห็นวันที่ประกาศของโพสต์ / บทความด้านล่าง ฉันได้ค้นหาบทความของฉันเองที่ฉันมีในเว็บไซต์ที่ใช้ Wordpress ของฉันและ Google ก็จำวันที่เผยแพร่ได้

เมื่อฉันเปิดแหล่งที่มาของเว็บไซต์ฉันไม่เห็นแท็กพิเศษหรือสิ่งใด ๆ ที่ระบุวันที่เผยแพร่ มันเขียนใน div ปกติโดยไม่มีแท็กพิเศษที่จะบอก SE ว่าเป็นวันที่เผยแพร่

ดังนั้นมันจึงเป็น hardcoded ใน Google สถานที่ที่แน่นอนของ Wordpress ที่เผยแพร่วันที่ในต้นไม้ DOM หรือฉันหายไปบางอย่าง?

ฉันกำลังสร้างเว็บไซต์ใหม่ด้วย CMS ของตัวเองและฉันพยายามค้นหาวิธีใช้การจดจำวันที่เผยแพร่


2
คุณพลาดอะไรไปอย่างแน่นอน: คุณดูที่ HTML เท่านั้น แต่ยังมีส่วนหัว HTTP ที่บอกว่าเมื่อมีการแก้ไขหน้า พวกเขากำลังรายงานอะไรสำหรับลิงก์ของบทความของคุณ ฉันเดาว่า Google จะใช้สิ่งนั้นร่วมกับบันทึกของตัวเองว่ามีการเปลี่ยนแปลงหน้าเว็บมากน้อยแค่ไหน แต่ฉันไม่มีหลักฐานที่แท้จริงดังนั้นจึงเป็นความคิดเห็นมากกว่าคำตอบ
Peter Taylor

ใช่ของฉันคือความพยายาม "หยาบ" ฉันจะดูองค์ประกอบที่ไม่ใช่ HTML / ส่วนหัวและแผนผังเว็บไซต์ตามที่คนอื่นแนะนำ
Can Poyrazoğlu

@Peter ไม่ต้องสงสัยเลยว่าส่วนหัว HTTP (โดยเฉพาะอย่างยิ่งส่วนหัว Last-Modified) เป็นตัวชี้วัดที่ SEs ใช้ อย่างไรก็ตามฉันสงสัยว่ามันมีบทบาทอย่างมากในการพิจารณา "วันที่เผยแพร่" ของบทความ - อย่างน้อยก็ไม่ใช่สิ่งที่ Google จะแสดงเป็นวันที่เผยแพร่ (SE อื่น ๆ ดูเหมือนจะไม่แสดง 'วันที่เผยแพร่'?) วันที่เผยแพร่ของบทความอาจไม่ใช่วันที่แก้ไขเอกสารครั้งล่าสุด หน้าเว็บส่วนใหญ่ในเว็บไซต์แบบไดนามิก (แม้สำหรับโพสต์ WordPress) ดูเหมือนจะกลับมาใกล้กับวันที่ / เวลาปัจจุบัน IMO ส่วนหัว Last-Modified จะใช้สำหรับการแคชเป็นหลัก
MrWhite

ฉันคิดว่ามันมีบางอย่างเกี่ยวกับ sitemap ..
สามารถPoyrazoğlu

stackoverflow.com/questions/204010/ HTTP ที่แก้ไขล่าสุดหรือข้อมูลเมตา HTML กึ่งมาตรฐานบางส่วน: stackoverflow.com/questions/4575967/…เป็นความเป็นไปได้อื่น ๆ แต่ฉันไม่แน่ใจว่า Google ใช้จริงหรือไม่
Ciro Santilli 新疆改造中心法轮功六四事件

คำตอบ:


4

คุณควรผ่าน xml sitemap หรือ RSS feed เพื่อสร้างดัชนีข้อมูลการเผยแพร่ของคุณผ่านเครื่องมือค้นหาสำคัญ ๆ เช่น Google, Yahoo, & MSN สร้างแผนผังเว็บไซต์ XML สำหรับเว็บไซต์ของคุณและส่งในเครื่องมือเว็บมาสเตอร์เพื่อจัดทำดัชนี


7

ฉันเพิ่งพบปัญหาว่าหน้าหลักทั้งหมดของฉันแสดงว่าได้รับการอัปเดตเมื่อ 4 ปีที่แล้วแม้ว่า Google จะรู้ว่าไม่เป็นความจริงเพราะหน้าเว็บได้รับการจัดทำดัชนีสำหรับความยาวนั้นและเปลี่ยนไปอย่างมากในแต่ละเดือน หลังจากงงงวยแล้วก็รำคาญจริง ๆ แล้วก็งงอีกครั้งในที่สุดฉันก็พบปัญหา ข้อกำหนดทางกฎหมายของเรามีการแสดงใน div ที่ซ่อนอยู่ด้วย "อัปเดตล่าสุด: 30 ตุลาคม 2007" และ div ถูกโหลดในเกือบทุกหน้าของเรา (เพราะมันปรากฏขึ้นเมื่อลงทะเบียน) ฉันได้ลบมันและตอนนี้ฉันคิดว่าวันที่จะหายไปหรือได้รับการแก้ไขให้เหมาะสมกว่า

เรื่องเตือนและหลักฐานอีกหนึ่งชิ้นที่พวกเขาตรวจสอบความหมายของเว็บไซต์มากกว่ารายละเอียดทางเทคนิคหรือประวัติการทำดัชนีของพวกเขาเอง


คุณรวมวันที่แก้ไขล่าสุดของหน้าเว็บของคุณไว้ที่อื่นบนหน้าเว็บหรือฟีด RSS หรือแผนผังไซต์ XML หรือไม่
MrWhite

ฉันทำไม่ได้เพราะเว็บไซต์ไม่ใช่เว็บไซต์ข่าวและฉันไม่ต้องการเน้นย้ำ เป็นการดีที่จะไม่มีวันที่สำหรับหน้าแรกของฉัน นอกจากนี้ฉันคิดว่าพวกเขาอาจใช้เวลาครั้งสุดท้ายกับเกลือเม็ดใหญ่ - ฉันรู้ว่าฉันจะถ้าพวกเขา
mmdanziger

7

ฉันสงสัยอย่างมากว่าวันที่เผยแพร่ของโพสต์หรือบทความนั้นอิงจาก<lastmod>รายการในแผนผังไซต์ XML (ตามที่คนอื่นแนะนำ) หรือส่วนหัว HTTP Last-Modified HTTP สำหรับเรื่องนั้น Sitemap XML เป็นคำแนะนำเท่านั้นไม่ใช่ที่มีสิทธิ์ วันที่แก้ไขล่าสุดของเอกสารอาจไม่เหมือนกับวันที่เผยแพร่ (ต้นฉบับ) ของบทความ และตามที่ฉันพูดถึงในความคิดเห็นของฉันที่ด้านบนของหน้าวันที่แก้ไขล่าสุดของเอกสารอาจมีความสำคัญสำหรับแคชและอาจกำหนดอัตราการรวบรวมข้อมูล ส่วนหัว HTTP Last-Modified ของหน้าเว็บที่สร้างขึ้นแบบไดนามิกมักจะใกล้เคียงกับวันที่ / เวลาจริง (เช่นเดียวกับบล็อก WordPress)

ฟีด RSS / Atom ในอีกทางหนึ่งจะมีข้อมูลที่ไม่ซ้ำกันนี้ และแน่นอนในเว็บไซต์ Wordpress ที่ไม่รวมวันที่เผยแพร่ในเนื้อหาวันที่เผยแพร่ยังคงปรากฏในผลการค้นหาของ Google และเท่าที่ฉันบอกได้นี่ตรงกับวันที่ในฟีด RSS

แก้ไข # 1:อย่างไรก็ตามฟีด RSS ไม่จำเป็นต้องมีทุกหน้า ในกรณีส่วนใหญ่ควรมีเฉพาะหน้าเว็บล่าสุดหรือหน้าล่าสุด แต่ไม่มีเหตุผลที่ Google ควรลืมสิ่งที่อ่านไปแล้วและการให้เนื้อหาของหน้านั้นไม่ได้เปลี่ยนไปดังนั้นวันที่แก้ไขครั้งล่าสุดก็ไม่ควร

หากไม่มีฟีด RSS ฉันคิดว่า Google ฉลาดพอที่จะวิเคราะห์เนื้อหาของหน้า โดยเฉพาะอย่างยิ่งถ้าวันที่มีการทำเครื่องหมายขึ้น 'ความหมาย' ด้วยความช่วยเหลือของไมโครฟอร์แมต เป็นไปได้อย่างสมบูรณ์แบบที่ Google จะเห็นสิ่งต่อไปนี้เป็นวันที่เผยแพร่อย่างเป็นทางการสำหรับบทความที่มีอยู่ภายใน:

<abbr class="published" title="2010-08-27T15:45:00-0700">
Friday, August 27th, 2010
</abbr>

Google แน่นอนจะอ่านไมโครฟอร์แมต - hCard, hReview เป็นต้น

เพื่อเพิ่มฉันไม่คิดว่า Google จะระบุวันที่เผยแพร่เว้นแต่จะสามารถค้นหาสิ่งที่มีสิทธิ์ที่จะแนะนำสิ่งนี้ มันจะไม่อนุมาน 'วันที่เผยแพร่' ในข้อมูลการเก็งกำไรเนื่องจาก 'วันที่เผยแพร่' ที่ไม่ถูกต้องจะไม่มีประโยชน์กับใครเลยและ Google จะต้องติดใจเรื่องนี้มาก!

และสำหรับบันทึก (ถ้า @Tom กำลังแนะนำเป็นอย่างอื่น :) ฉันคิดว่าโพสต์ / บทความควรมีวันที่เผยแพร่อย่างชัดเจน หลายคนทำไม่ได้และสิ่งนี้อาจสร้างความผิดหวังให้กับผู้อ่านโดยเฉพาะเมื่อทำการค้นคว้าปัญหาเทคโนโลยีและคุณพบว่าการอ่านบทความครึ่งทางนั้นล้าสมัย!

แก้ไข # 2:ฉันได้พบกับความรำคาญที่คล้ายกันซึ่งรายละเอียด @mmdanziger ในคำตอบของเขา ในเว็บไซต์เก่าของฉันฉันมีข้อความของแบบฟอร์ม "ไซต์ปรับปรุงล่าสุดวันอาทิตย์ที่ 17 มิถุนายน 2012" (ไม่ได้ทำเครื่องหมายด้วยวิธีพิเศษใด ๆ ) ที่ด้านบนสุดของทุกหน้า (เขียนไปยังหน้าด้วย JavaScript !!) Google ได้รับวันที่เดียวกันนี้และปรากฏขึ้นพร้อมกับหลาย ๆ หน้า (แต่ไม่ใช่ทั้งหมด) ที่ปรากฏใน SERPS - นี่ไม่ใช่วันที่เผยแพร่ของหน้าแน่นอน ดูเหมือนว่า Google จะทำการทิ้งหน้าสำหรับสตริงของแบบฟอร์ม "อัปเดตล่าสุด ( datestring )" (มีการประมวลผล JavaScript !!) ไซต์นี้ไม่มีฟีด RSS ไซต์มีไฟล์ Sitemap.xml แต่วันที่นั้นแตกต่างกัน

ฉันได้สังเกตเห็นพฤติกรรมที่คล้ายกันในเว็บไซต์อื่น ๆ ด้วย


มันจำวันที่ที่ถูกต้องได้อย่างไร <div class="footer"> <div class="links"> April 24, 2011 | <a href=...นี่คือสถานที่เดียวที่อ้างถึงวันที่เผยแพร่ของโพสต์ของฉันและ Google พบและแสดงอย่างถูกต้องในผลการค้นหา
Can Poyrazoğlu

มีอะไรพิเศษในสมอเรือที่ตามมาไหม จากนั้นอีกครั้งมันอาจจะไม่ คุณมีฟีด RSS (เชื่อมโยงกับในแท็ก META ของเอกสาร) หรือไม่
MrWhite

ฉันกำลังหาคำตอบ "Google กำหนดวันที่ได้อย่างไร" แต่สังเกตเห็นสิ่งเดียวกัน! Google พยายามค้นหาสตริงของเวลาในหน้าเว็บแทนที่จะเป็นส่วนหัวที่แก้ไขล่าสุดหรือ Sitemap.xml <lastmod>! ขอบคุณที่ยืนยันความคิดของฉัน!
evilReiko

5

ผมคิดว่า Google จะใช้แผนผังเว็บไซต์และฟีด RSS ที่จะรับรู้วันที่เผยแพร่ .. คุณสามารถ impliment คุณลักษณะนี้ใน CMS ของคุณโดยการสร้างแผนที่เว็บไซต์ XML ตามมาตรฐาน

<lastmod>2011-08-18</lastmod>

2

อ้างอิงจาก Jonh Mueller ที่ Google:

เราใช้สัญญาณที่หลากหลายเพื่อกำหนดวันที่ที่จะแสดงหรือถ้ามันเหมาะสมที่จะแสดงให้เห็นเลย มันไม่ได้เชื่อมโยงกับคุณลักษณะเฉพาะอย่างใดอย่างหนึ่ง

John Mueller - Twitter

อย่างไรก็ตามฉันคิดว่าเป็นไปได้มากว่า Google จะค้นหาวันที่บนหน้าเว็บในสถานที่ต่อไปนี้:

  • ในสายตาธรรมดาในหน้าโดยใช้การเรียนรู้ของเครื่อง
  • ข้อมูลที่มีโครงสร้างของ Schema.org โดยเฉพาะอย่างยิ่งหากข้อมูลสามารถพบได้ในสายตาธรรมดาบนหน้า

1

ฉันคิดว่ามันดูวันที่ใด ๆ บนหน้าเว็บอย่างชาญฉลาดและเมื่อมั่นใจว่าเป็นวันที่ที่เกี่ยวข้องก็จะใช้

บางครั้งมันก็ยากเล็กน้อยเพราะฉันคิดว่ามันอาจส่งผลเสียต่อความสามารถในการคลิกของ SERP ฉันคิดว่ามันอาจมีผลกระทบเชิงบวกชั่วคราวหากเป็นบทความ / โพสต์เมื่อเร็ว ๆ นี้ แต่ฉันค่อนข้างแน่ใจว่าเว็บไซต์ของฉันจะดีขึ้น (ผู้ค้นหาของ Google อาจไม่ดีกว่าถ้าไม่มี!)

ไม่มีตัวเลือกในการควบคุมผ่านทาง Google ด้วยวิธีของคุณเองเท่านั้น คุณสามารถ:

  • แทนที่วันที่ด้วยภาพที่สร้างขึ้นแบบไดนามิกในความพยายามที่จะหยุดการค้นพบของ Google แต่สิ่งนี้สามารถนำไปสู่ปัญหาอื่น ๆ เช่นการจัดตำแหน่งภาพ / การแสดง / การเข้าถึงแบบอักษรที่สอดคล้องกัน ฯลฯ
  • ตัดวันที่ทั้งหมดออกจากหน้าเว็บ (สิ่งนี้อาจทำให้ผู้เข้าชม / ผู้ใช้ผิดหวังเมื่อพวกเขาต้องการค้นพบอายุของแหล่งข้อมูลหากคุณมีข้อมูลที่เกี่ยวข้อง)

ด้วยเหตุผลเหล่านี้ฉันจะไม่สนใจมัน


ฉันไม่ได้พยายามลบวันที่ :) ฉันพยายามเพิ่มคุณลักษณะวันที่ในเว็บไซต์ใหม่ที่ฉันกำลังสร้าง ..
Can Poyrazoğlu
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.