ฉันจะหาได้อย่างไรเมื่อ Google ได้รับการจัดทำดัชนี URL ครั้งแรก


16

ฉันจะทราบได้อย่างไรว่าเมื่อใดที่ Google ได้รับการจัดทำดัชนี URL เป็นครั้งแรก ฉันต้องการโซลูชันที่ใช้ได้แม้กับ URL ของคู่แข่งที่ฉันไม่ได้เป็นเจ้าของ


1
เป็นไปได้มากที่คำตอบคือ "ไม่" Google อาจไม่ได้จัดเก็บข้อมูลนี้ (เนื่องจากไม่มีเหตุผลใดที่พวกเขาต้องการ) หรือแม้ว่าพวกเขาจะทำพวกเขาอาจไม่เปิดเผยต่อบุคคลที่สาม
Ilmari Karonen

1
เช่นเดียวกับคนอื่น ๆ ที่กล่าวถึงคุณไม่สามารถรับข้อมูลนี้ได้ หากคุณมีการเข้าถึงบันทึกเซิร์ฟเวอร์คุณสามารถดูได้เมื่อมีการรวบรวมข้อมูลครั้งแรก แต่ก็ไม่ได้หมายความว่าจะได้รับการจัดทำดัชนี
John Mueller

คำตอบ:


15

หากต้องการทราบอายุของ URL คุณสามารถไปที่ลิงค์นี้โดยแทนที่www.example.comด้วย URL ที่คุณต้องการ:

https://www.google.com/search?tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000&q=site%3Ahttp%3A%2F%2Fwww.example.com&safe=active&gws_rd=ssl

ตัวอย่างเช่นนี่คือผลลัพธ์จาก Google สำหรับเว็บไซต์ Meta ของ Stack Overflow : ป้อนคำอธิบายรูปภาพที่นี่

ไม่อย่างนั้นเครื่อง Waybackก็เป็นคำตอบที่ดี แต่ก็แม่นยำน้อยลงจากประสบการณ์ของฉัน


3
คุณลักษณะของ Google มีให้ในภาษาอังกฤษด้วยหรือไม่ คุณเชื่อมโยงกับเวอร์ชันภาษาฝรั่งเศส
Stephen Ostermiller

1
@StephenOstermiller เพียงแค่เปลี่ยน TLD จากไป.fr .com
MDMoore313

2
@Zistoloen +1 สำหรับคำตอบของคุณ แต่ฉันมีข้อสงสัยในแบบสอบถามของคุณ อย่างที่คุณบอกว่าฉันค้นหา www.stackexchange.comโดยใช้แบบสอบถามตัวอย่างของคุณ แต่มันไม่แสดงผลลัพธ์ใด ๆ ฉันค้นหาโดยการลบwwwในเวลานี้มันแสดงผลสำหรับวันDec 1, 2014ที่ซึ่งเป็นวันที่ล่าสุดที่ไม่สามารถอายุของ URL ได้ ฉันค้นหาไม่ถูกต้องหรือไม่ หรือหายไปอะไร
Sathiya Kumar

2
ฉันได้ "ขโมย" คำตอบนี้และเพิ่มลงในคำตอบของฉันพร้อมคำอธิบายที่ดีกว่า นี่เป็นเคล็ดลับที่ยอดเยี่ยมอย่าง Zistoloen
Stephen Ostermiller

6
@Stephen & Zistoloen: นั่นไม่ใช่วันที่หน้าเว็บถูกสร้างดัชนีครั้งแรกโดย Google จากการทดสอบบางอย่างวันที่ที่แสดงด้วยวิธีนี้ดูเหมือนว่าจะถูกดึงออกมาจากเนื้อหาของหน้าเว็บ (หาก Google คิดว่ามันเห็นบางสิ่งที่ดูเหมือนวันที่ "เผยแพร่เมื่อ" หรือ "แก้ไขล่าสุดเมื่อ") หรือหากไม่มีเช่นนั้น พบวันที่ในเนื้อหาตามวันที่ที่ Google ตรวจพบการเปลี่ยนแปลง (เป็นกอบเป็นกำ) ในหน้านั้น แน่นอนถ้าหน้าไม่เคยเปลี่ยนหลังจากตีพิมพ์ครั้งแรกอาจเกิดขึ้นเหมือนกับวันที่เผยแพร่ แต่ไม่มีการรับประกันใด ๆ
Ilmari Karonen

8

Zistoloenพบวิธีให้ Google แสดงวันที่เมื่อมีการจัดทำดัชนีเนื้อหาของหน้าเว็บเป็นครั้งแรก ฉันกำลังเพิ่มเข้าไปในคำตอบของฉันเช่นกันเพราะฉันคิดว่าฉันสามารถอธิบายได้ชัดเจนยิ่งขึ้น

  1. ค้นหาสิ่งที่แสดงหน้าเว็บที่คุณต้องการให้เป็นผลลัพธ์ของ Google
  2. ใช้ "เครื่องมือค้นหา"
  3. เลือก "ช่วงที่กำหนดเอง ... " จากรายการแบบเลื่อนลง "ทุกเวลา"
  4. ใส่ช่วงวันที่ที่มีขนาดใหญ่เช่น 1/1/1900 ถึง 1/1/2020

Google จะแสดงวันที่พบเนื้อหาที่อยู่บนหน้าในผลการค้นหา

การจัดทำดัชนีครั้งแรก

หากหน้านั้นได้รับการอัปเดตด้วยเนื้อหาใหม่ Google จะอัปเดตวันที่นี้ด้วย ดังนั้นจึงเป็นวันที่ "จัดทำดัชนีเนื้อหานี้ครั้งแรก" มากกว่าวันที่จัดทำดัชนี URL นี้ครั้งแรก


แคช Google สำหรับหน้าจะแสดงเมื่อหน้านั้นได้รับการจัดทำดัชนีครั้งล่าสุด คุณจะเห็นได้ว่าหน้าแรกของ Exchange Exchangeได้รับการสร้างดัชนีล่าสุดวันนี้:

ป้อนคำอธิบายรูปภาพที่นี่


อีกตัวเลือกหนึ่งคือการใช้เครื่อง Wayback อินเทอร์เน็ตของหน่วยเก็บถาวร นั่นแสดงให้คุณเห็นว่าหน้าตาเป็นอย่างไรในอดีต คุณสามารถทราบได้เมื่อหน้าถูกตีพิมพ์ครั้งแรก ทั้ง Google และการรวบรวมข้อมูลทางอินเทอร์เน็ตและใช้หน้าหลังจากที่เผยแพร่ครั้งแรก


1
ตัวเลือกแรกของคุณจะให้ผลลัพธ์ที่แน่นอนสำหรับ URL ทั้งหมดหรือไม่ ผมค้นหาbing.comเป็นเหมือนที่คุณอธิบาย bing.comแต่ไม่ได้รับวันแรกของการจัดทำดัชนีของ ขออภัยถ้าฉันผิด
Sathiya Kumar

1
ดูเหมือนว่าจะถูกต้องตราบใดที่เนื้อหาในหน้าไม่เปลี่ยนแปลง Google อาจรีเซ็ตวันที่นี้หากหน้าเว็บได้รับการยกเครื่อง หน้าแรกของฉันถูกระบุว่าเป็น 1 กุมภาพันธ์ 2002 แม้ว่าหน้าภายในจะถูกระบุว่าเป็น 1 กุมภาพันธ์ 2001 หน้าแรกได้รับการออกแบบใหม่ในช่วงเวลานั้นในขณะที่หน้าภายในไม่ได้เปลี่ยนไปมากตั้งแต่ 2544
สตีเฟ่น Ostermiller

@SatiyaKumar Bing.com ให้วันที่ 19 มี.ค. 2014สำหรับฉันโดยใช้วิธีนี้ โปรดทราบว่าสิ่งใดก็ตามที่ไม่ได้จัดทำดัชนีโดย google (ผ่าน robots.txt หรืออื่น ๆ ) จะไม่แสดงผลอย่างชัดเจน
Thebluefish เมื่อ

4

อาจไม่มีจะเป็นวิธีการใด ๆ เพื่อหาเมื่อหน้าเว็บโดยพลการได้รับการจัดทำดัชนีครั้งแรกโดย Google - แน่นอนผมไม่ทราบวิธีที่จะทำเช่นใด เป็นไปได้ว่า Google ไม่ได้จัดเก็บข้อมูลนั้นเนื่องจากไม่มีเหตุผลที่แท้จริงว่าทำไมพวกเขาต้องการ นอกจากนี้แม้ว่าพวกเขาจะเก็บข้อมูลเหล่านี้พวกเขาไม่มีเหตุผลพิเศษที่จะทำให้มันเป็นอิสระให้กับบุคคลที่สาม

(หากเป็นหน้าของคุณเองและคุณสามารถเข้าถึงบันทึกการเข้าถึงเว็บเซิร์ฟเวอร์เก่าของคุณได้อย่างง่ายดาย - เพียงแค่ค้นหาบันทึกการเข้าชมครั้งแรกจาก Googlebot ไปยังหน้านั้น แต่ไม่เช่นนั้นอาจไม่มีวิธีที่จะบอกได้อย่างแน่นอน)


ไม่ว่าในกรณีใดวิธีการที่ Zistoloen และ Stephen Ostermiller อธิบายไว้ในคำตอบของพวกเขานั้นโดยทั่วไปจะไม่เปิดเผยวันที่ที่ Google ได้จัดทำดัชนี URL รายการแรก ค่อนข้างจะแสดงวันที่ Google คิดว่าเนื้อหาที่ URL เผยแพร่หรืออัปเดตล่าสุดและมักขึ้นอยู่กับความพยายามที่น่าเชื่อถือของ Google ในการ "ดมกลิ่น" วันที่จากเนื้อหาของหน้าเว็บเอง

ในวิดีโอนี้ Matt Cutts ของ Google สัมผัสกับวิธีการเลือกวันที่เหล่านี้อย่างย่อ เพื่อความสะดวกฉันได้คัดลอกวิดีโอที่เกี่ยวข้อง (ประมาณ 2:09 - 2:22) ด้านล่าง:

"... บ่อยครั้งที่คุณจะเห็นวันที่เราอนุมานหรือเมื่อเราเห็นครั้งแรกเมื่อใดก็ตามที่เรารวบรวมข้อมูลหน้านั้นหรือถ้าเราสามารถหาที่ใดที่หนึ่งบนหน้าและเราสามารถแยกวันที่คุณ ' จะเห็นว่าในตอนเริ่มต้นของตัวอย่าง "

สำหรับหน้าต่างๆเช่นบล็อกโพสต์หน้าวิกิหรือคำถามการแลกเปลี่ยนสแต็คที่เว็บไซต์ที่ใช้งานซอฟต์แวร์รายงานวันที่สร้าง / แก้ไขที่ถูกต้องบนหน้าตัวเองโดยอัตโนมัติวันที่ที่รายงานโดย Google นั้นน่าจะตรงกับมัน สำหรับหน้าประเภทอื่นแม้ว่าการดมกลิ่นวันที่ของ Google จะต้องทำงานหนักขึ้นและไม่ได้ทำให้ถูกต้องเสมอไป (สิ่งที่ "ถูกต้อง" อาจหมายถึงในบริบทนี้)

โดยเฉพาะอย่างยิ่งวันที่เหล่านี้ไม่มีประโยชน์ในการพิจารณาว่าหน้ามีการจัดทำดัชนีนานแค่ไหนด้วยเหตุผลสองประการ:

  • หากหน้าหนึ่งถูกแก้ไขเมื่อเร็ว ๆ นี้และวันที่แก้ไขจะปรากฏเด่นชัดบนหน้าเว็บ Google อาจเลือกหน้าเว็บนั้นเป็น "วันที่" ของหน้าเว็บแม้ว่าการแก้ไขจะเป็นเรื่องเล็กน้อยก็ตาม

    ตัวอย่างเช่นหน้า wiki ที่ค่อนข้างเก่า (ซึ่งเป็นที่เก็บถาวรแรกที่จัดทำดัชนีเป็นครั้งแรกในปี 2003 ) ปัจจุบันถูกเผยแพร่โดย Google ตั้งแต่วันที่ 10 พฤศจิกายน 2014 ซึ่งเป็นวันที่มีการแก้ไขล่าสุดดังที่แสดงที่ด้านล่างของหน้า การเปลี่ยนแปลงที่เกิดขึ้นในวันนั้น? เพียงลบลิงค์เดียวจากด้านล่างของหน้า

  • ตรงกันข้าม Google ดูเหมือนว่าจะมีความสุขที่จะยอมรับเก่ามาก "วันที่เผยแพร่" หากพบพวกเขาในหน้า - แม้กระทั่งผู้ที่ลงวันที่ก่อนการเปิดตัวของเวิลด์ไวด์เว็บ

    ตัวอย่างเช่นหน้านี้ของการแข่งขันการเขียนโปรแกรมแบบเก่านั้นลงวันที่โดย Google จนถึงวันที่ 15 กันยายน 1986 ซึ่งจริงๆแล้วคือวันที่ของเหตุการณ์ที่อธิบายไว้ในหน้านั้น ในทำนองเดียวกันหน้านี้ที่จัดทำเอกสารการประท้วงของนักเรียนในปี 1970เป็นวันที่ Google ถึง 10 พฤษภาคม 1970 (วันที่หนึ่งในเอกสารที่สแกนบนหน้า) และยิ่งกว่านั้นหน้าคู่มือ Linux นี้ลงวันที่ Google ถึง 4 พฤศจิกายน , 1989 (วันที่ตัวอย่างแบบสุ่มที่ใช้ในหน้า)

    คุณสามารถพบตัวอย่างมากมายดังกล่าวมากขึ้นโดยใช้วันที่กำหนดเองช่วงการค้นหาอธิบายโดยสตีเฟ่นและ Zistoloen แต่การตั้งค่าปลายบนของช่วงที่จะพูด, 6 สิงหาคม 1991


ในคำตอบของคุณคุณคัดค้านคำตอบของ Stephen และ Zistoloen เป็นส่วนใหญ่ แต่ฉันไม่พบคำตอบที่เหมาะสมสำหรับคำถามของ OP "ฉันจะค้นหาได้อย่างไรเมื่อ URL ถูกทำดัชนีโดย Google เป็นครั้งแรก" ในคำตอบของคุณ !!
Sathiya Kumar

อาจไม่มีจะเป็นคำตอบใด ๆ อื่น ๆ ที่ "คุณไม่สามารถ" หรือ "ไม่มีใครรู้ว่าวิธีการ" แต่คุณพูดถูกต้องให้ฉันแก้ไขคำตอบของฉัน
Ilmari Karonen

@llmariKaronen +1 สำหรับการแก้ไขและเพิ่มคำตอบสำหรับคำถามที่แท้จริงของ OP
Sathiya Kumar
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.