ฉันจะทราบได้อย่างไรว่าเมื่อใดที่ Google ได้รับการจัดทำดัชนี URL เป็นครั้งแรก ฉันต้องการโซลูชันที่ใช้ได้แม้กับ URL ของคู่แข่งที่ฉันไม่ได้เป็นเจ้าของ
ฉันจะทราบได้อย่างไรว่าเมื่อใดที่ Google ได้รับการจัดทำดัชนี URL เป็นครั้งแรก ฉันต้องการโซลูชันที่ใช้ได้แม้กับ URL ของคู่แข่งที่ฉันไม่ได้เป็นเจ้าของ
คำตอบ:
หากต้องการทราบอายุของ URL คุณสามารถไปที่ลิงค์นี้โดยแทนที่www.example.com
ด้วย URL ที่คุณต้องการ:
https://www.google.com/search?tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000&q=site%3Ahttp%3A%2F%2Fwww.example.com&safe=active&gws_rd=ssl
ตัวอย่างเช่นนี่คือผลลัพธ์จาก Google สำหรับเว็บไซต์ Meta ของ Stack Overflow :
ไม่อย่างนั้นเครื่อง Waybackก็เป็นคำตอบที่ดี แต่ก็แม่นยำน้อยลงจากประสบการณ์ของฉัน
.fr
.com
www
ในเวลานี้มันแสดงผลสำหรับวันDec 1, 2014
ที่ซึ่งเป็นวันที่ล่าสุดที่ไม่สามารถอายุของ URL ได้ ฉันค้นหาไม่ถูกต้องหรือไม่ หรือหายไปอะไร
Zistoloenพบวิธีให้ Google แสดงวันที่เมื่อมีการจัดทำดัชนีเนื้อหาของหน้าเว็บเป็นครั้งแรก ฉันกำลังเพิ่มเข้าไปในคำตอบของฉันเช่นกันเพราะฉันคิดว่าฉันสามารถอธิบายได้ชัดเจนยิ่งขึ้น
Google จะแสดงวันที่พบเนื้อหาที่อยู่บนหน้าในผลการค้นหา
หากหน้านั้นได้รับการอัปเดตด้วยเนื้อหาใหม่ Google จะอัปเดตวันที่นี้ด้วย ดังนั้นจึงเป็นวันที่ "จัดทำดัชนีเนื้อหานี้ครั้งแรก" มากกว่าวันที่จัดทำดัชนี URL นี้ครั้งแรก
แคช Google สำหรับหน้าจะแสดงเมื่อหน้านั้นได้รับการจัดทำดัชนีครั้งล่าสุด คุณจะเห็นได้ว่าหน้าแรกของ Exchange Exchangeได้รับการสร้างดัชนีล่าสุดวันนี้:
อีกตัวเลือกหนึ่งคือการใช้เครื่อง Wayback อินเทอร์เน็ตของหน่วยเก็บถาวร นั่นแสดงให้คุณเห็นว่าหน้าตาเป็นอย่างไรในอดีต คุณสามารถทราบได้เมื่อหน้าถูกตีพิมพ์ครั้งแรก ทั้ง Google และการรวบรวมข้อมูลทางอินเทอร์เน็ตและใช้หน้าหลังจากที่เผยแพร่ครั้งแรก
bing.com
แต่ไม่ได้รับวันแรกของการจัดทำดัชนีของ ขออภัยถ้าฉันผิด
อาจไม่มีจะเป็นวิธีการใด ๆ เพื่อหาเมื่อหน้าเว็บโดยพลการได้รับการจัดทำดัชนีครั้งแรกโดย Google - แน่นอนผมไม่ทราบวิธีที่จะทำเช่นใด เป็นไปได้ว่า Google ไม่ได้จัดเก็บข้อมูลนั้นเนื่องจากไม่มีเหตุผลที่แท้จริงว่าทำไมพวกเขาต้องการ นอกจากนี้แม้ว่าพวกเขาจะเก็บข้อมูลเหล่านี้พวกเขาไม่มีเหตุผลพิเศษที่จะทำให้มันเป็นอิสระให้กับบุคคลที่สาม
(หากเป็นหน้าของคุณเองและคุณสามารถเข้าถึงบันทึกการเข้าถึงเว็บเซิร์ฟเวอร์เก่าของคุณได้อย่างง่ายดาย - เพียงแค่ค้นหาบันทึกการเข้าชมครั้งแรกจาก Googlebot ไปยังหน้านั้น แต่ไม่เช่นนั้นอาจไม่มีวิธีที่จะบอกได้อย่างแน่นอน)
ไม่ว่าในกรณีใดวิธีการที่ Zistoloen และ Stephen Ostermiller อธิบายไว้ในคำตอบของพวกเขานั้นโดยทั่วไปจะไม่เปิดเผยวันที่ที่ Google ได้จัดทำดัชนี URL รายการแรก ค่อนข้างจะแสดงวันที่ Google คิดว่าเนื้อหาที่ URL เผยแพร่หรืออัปเดตล่าสุดและมักขึ้นอยู่กับความพยายามที่น่าเชื่อถือของ Google ในการ "ดมกลิ่น" วันที่จากเนื้อหาของหน้าเว็บเอง
ในวิดีโอนี้ Matt Cutts ของ Google สัมผัสกับวิธีการเลือกวันที่เหล่านี้อย่างย่อ เพื่อความสะดวกฉันได้คัดลอกวิดีโอที่เกี่ยวข้อง (ประมาณ 2:09 - 2:22) ด้านล่าง:
"... บ่อยครั้งที่คุณจะเห็นวันที่เราอนุมานหรือเมื่อเราเห็นครั้งแรกเมื่อใดก็ตามที่เรารวบรวมข้อมูลหน้านั้นหรือถ้าเราสามารถหาที่ใดที่หนึ่งบนหน้าและเราสามารถแยกวันที่คุณ ' จะเห็นว่าในตอนเริ่มต้นของตัวอย่าง "
สำหรับหน้าต่างๆเช่นบล็อกโพสต์หน้าวิกิหรือคำถามการแลกเปลี่ยนสแต็คที่เว็บไซต์ที่ใช้งานซอฟต์แวร์รายงานวันที่สร้าง / แก้ไขที่ถูกต้องบนหน้าตัวเองโดยอัตโนมัติวันที่ที่รายงานโดย Google นั้นน่าจะตรงกับมัน สำหรับหน้าประเภทอื่นแม้ว่าการดมกลิ่นวันที่ของ Google จะต้องทำงานหนักขึ้นและไม่ได้ทำให้ถูกต้องเสมอไป (สิ่งที่ "ถูกต้อง" อาจหมายถึงในบริบทนี้)
โดยเฉพาะอย่างยิ่งวันที่เหล่านี้ไม่มีประโยชน์ในการพิจารณาว่าหน้ามีการจัดทำดัชนีนานแค่ไหนด้วยเหตุผลสองประการ:
หากหน้าหนึ่งถูกแก้ไขเมื่อเร็ว ๆ นี้และวันที่แก้ไขจะปรากฏเด่นชัดบนหน้าเว็บ Google อาจเลือกหน้าเว็บนั้นเป็น "วันที่" ของหน้าเว็บแม้ว่าการแก้ไขจะเป็นเรื่องเล็กน้อยก็ตาม
ตัวอย่างเช่นหน้า wiki ที่ค่อนข้างเก่า (ซึ่งเป็นที่เก็บถาวรแรกที่จัดทำดัชนีเป็นครั้งแรกในปี 2003 ) ปัจจุบันถูกเผยแพร่โดย Google ตั้งแต่วันที่ 10 พฤศจิกายน 2014 ซึ่งเป็นวันที่มีการแก้ไขล่าสุดดังที่แสดงที่ด้านล่างของหน้า การเปลี่ยนแปลงที่เกิดขึ้นในวันนั้น? เพียงลบลิงค์เดียวจากด้านล่างของหน้า
ตรงกันข้าม Google ดูเหมือนว่าจะมีความสุขที่จะยอมรับเก่ามาก "วันที่เผยแพร่" หากพบพวกเขาในหน้า - แม้กระทั่งผู้ที่ลงวันที่ก่อนการเปิดตัวของเวิลด์ไวด์เว็บ
ตัวอย่างเช่นหน้านี้ของการแข่งขันการเขียนโปรแกรมแบบเก่านั้นลงวันที่โดย Google จนถึงวันที่ 15 กันยายน 1986 ซึ่งจริงๆแล้วคือวันที่ของเหตุการณ์ที่อธิบายไว้ในหน้านั้น ในทำนองเดียวกันหน้านี้ที่จัดทำเอกสารการประท้วงของนักเรียนในปี 1970เป็นวันที่ Google ถึง 10 พฤษภาคม 1970 (วันที่หนึ่งในเอกสารที่สแกนบนหน้า) และยิ่งกว่านั้นหน้าคู่มือ Linux นี้ลงวันที่ Google ถึง 4 พฤศจิกายน , 1989 (วันที่ตัวอย่างแบบสุ่มที่ใช้ในหน้า)
คุณสามารถพบตัวอย่างมากมายดังกล่าวมากขึ้นโดยใช้วันที่กำหนดเองช่วงการค้นหาอธิบายโดยสตีเฟ่นและ Zistoloen แต่การตั้งค่าปลายบนของช่วงที่จะพูด, 6 สิงหาคม 1991