ทำไมในหน้าแรก Google บอกว่ามีผลลัพธ์นับพัน แต่ในหน้าสุดท้ายมีน้อยกว่าหนึ่งร้อย


11

ทำไมในหน้าแรก Google บอกว่ามีผลลัพธ์นับพัน แต่ในหน้าสุดท้ายมีน้อยกว่าหนึ่งร้อย

นั่นเป็นGoogle Search แบบเรียกซ้ำที่ควรอธิบายด้วยตนเอง ต้องใช้เวลาพอสมควรในการปรับแต่งประโยคและพยายามหาตัวเลขที่สอดคล้องกันอย่างแม่นยำเหตุผลที่ฉันเปลี่ยนเป็น " หลายร้อย " แทน! : P

หากคุณใช้ Google มานานพอคุณจะสะดุดกับสถานการณ์เช่นนี้หลายครั้ง เมื่อใดก็ตามที่มันแสดงน้อยกว่า 10 หน้ามันค่อนข้างง่ายที่จะดู ประเด็นคือ: จำนวนผลลัพธ์ในหน้าใด ๆ ยกเว้นอันสุดท้ายดูเหมือนว่าจะแย่มาก

แม้กระทั่งสิ่งที่แปลกกว่านั้นบางครั้งการประมาณแบบสุ่มก็จะดีขึ้นมากและเกือบจะเหมือนกันทุกหน้ากว่าที่ปรากฏในหน้าสุดท้าย - หน้าเดียวที่ถูกต้องเสมอ

ดังนั้นทุกคนรู้ว่าทำไม


1
ตอนนี้ในหน้าแรกสำหรับการค้นหานั้นระบุว่าผลลัพธ์ 3200 แต่ในหน้าสุดท้ายมันบอกว่า 75 (สำหรับคนที่สนใจในการอัปเดต)
dkuntz2

@Duntuntz เป็น 2990 และ 65 สำหรับฉัน (ในขณะที่ฉันลงชื่อเข้าใช้) ในขณะที่ถ้าฉันออกจากระบบ (ซึ่งเป็นวิธีที่ฉันทำในครั้งแรก) จะกลายเป็น 3120 และ 77 บางทีในภายหลังฉันจะเปลี่ยนคำถามเล็กน้อยและสร้าง ตั้งค่าเคียวรีแบบเรียกซ้ำที่สอดคล้องกันมากขึ้น - แต่ทุกคนสามารถทำได้เช่นกัน! : P
cregox

Google แปลก
dkuntz2

ฉันมักจะบอกว่า 208 ผลลัพธ์ในหน้าสุดท้ายไม่ว่าจะเป็น 4 หน้าของผลการค้นหาหรือ 22 มันก็มักจะพูดว่า 208
mchid

ดูเพิ่มเติมsearchengineland.com/ …
1110101001

คำตอบ:


6

ฉันไม่ทราบคำตอบที่แน่นอน - อาจไม่มีใครรู้นอก Google แต่ฉันมีจุดข้อมูลสองจุดซึ่งอาจมีประโยชน์

ที่แรกก็คือXKCD ใช้เวลาในการแก้ไขปัญหา:

ดังนั้นดูเหมือนว่าจะมีปริมาณผลลัพธ์ที่เกินกว่าเกณฑ์ที่ Google ระบุไว้อย่างชัดเจนว่า "ทำให้ผิดพลาด" และส่งตัวเลขขนาดใหญ่ออกมา ฉันคิดว่านี่อาจเป็นเพราะความไร้ความสามารถมากกว่าการหลอกลวงโดยเจตนา ฉันแน่ใจว่ามันยากที่จะสร้างหน้าอย่างรวดเร็วจากหลาย ๆ แหล่งและอาจเป็นการค้นหาที่มีผลลัพธ์จำนวนมากที่พวกเขาไม่มีเวลาที่จะซิงค์ทั้งหมด ดังนั้นพวกเขาจึงเหลวไหลตัวเลข ความจริงที่ว่าสิ่งนี้ทำให้ดูเหมือนว่าพวกเขามีผลลัพธ์มากกว่าที่พวกเขาคิดว่าเป็นเพียงโบนัสที่ไม่ได้ตั้งใจ

จุดข้อมูลที่สองนั้นมาจากศาสตราจารย์ด้านวิทยาศาสตร์คอมพิวเตอร์ที่ฉันมีความอยากรู้อยากเห็นเกี่ยวกับปัญหานี้และรบกวนเพื่อนบางคนที่ Google เกี่ยวกับเรื่องนี้ พวกเขาบอกเขาว่าบางครั้งมันมีราคาแพงมากที่จะทราบว่ามีผลลัพธ์จำนวนเท่าใดที่ถูกส่งคืนจากการค้นหาดังนั้นพวกเขาจึงคาดเดาได้ดีที่สุดและส่งกลับหน้าแรกของผลการค้นหาซึ่งเป็นสิ่งที่คนส่วนใหญ่สนใจ เฉพาะเมื่อคุณเริ่มเจาะลึกลงไปในหน้าต่างๆ Google จะไม่ใส่ใจในการคำนวณหน้าที่เหลือทั้งหมด

ดังนั้นสิ่งเหล่านี้ไม่ใช่คำตอบที่ชัดเจน แต่หวังว่าพวกเขาจะมีประโยชน์ในการอธิบายปัญหาที่อาจทำให้เกิดความไม่ถูกต้องของ Google

แก้ไข:

คำตอบของ Sathya ในหน้านี้มีคำตอบจากKB Webmaster ของ Google

เมื่อคุณทำการค้นหาผลลัพธ์มักจะแสดงพร้อมข้อมูล: ผลลัพธ์ 1 - 10 จากประมาณ XXXX

การคำนวณจำนวนผลการค้นหาทั้งหมดของ Google เป็นการประมาณการ เราเข้าใจว่ารูป ballpark นั้นมีค่าและโดยการประมาณการมากกว่าบัญชีที่แน่นอนเราสามารถส่งคืนผลการค้นหาที่มีคุณภาพได้เร็ว

นอกจากนี้เมื่อคุณคลิกที่หน้าถัดไปของผลการค้นหาจำนวนผลการค้นหาทั้งหมดสามารถเปลี่ยนแปลงได้ ในกรณีนี้เราทราบว่าผลลัพธ์แบบสอบถามบางรายการซ้ำกันและยุบรายการซ้ำเหล่านั้นเพื่อให้คุณสามารถค้นหาผลลัพธ์ที่ต้องการได้ง่ายขึ้น การยุบรายการซ้ำจะลดจำนวนผลลัพธ์โดยประมาณรวมถึงจำนวนหน้าผลลัพธ์โดยรวม


ในขณะที่ฉันรัก XKCD และคุณครูที่รักในอดีตสิ่งที่คุณกำลังบอกฉันคือฉันอาจจะถามคำถามนี้ใน stackoverflow.com: P
cregox

ฉันไม่คิดว่าทุกคนที่อยู่ในสแต็คโอเวอร์โฟลว์จะมีคำตอบที่ชัดเจนหากคุณต้องการทราบจริงๆคุณควรถาม Google ฉันสามารถถ่ายทอดคำตอบจากคนที่ถาม Google เมื่อไม่กี่เดือนที่ผ่านมา
dsolimano

ไม่ต้องการคำตอบที่ชัดเจนเพียงคำเดียวที่มีคำอธิบายที่ลึกกว่านั้นสมเหตุสมผลดีกว่า อย่าเข้าใจฉันผิดคุณมีเหตุผล แต่พูดว่า "เพราะมันยาก" แม้ว่ามันจะมีสิทธิ์และมีเหตุผลก็ตาม อืม ... อาจจะเป็น skeptics.se: o
cregox

การแก้ไขที่ดีตอนนี้เป็นการจัดหาที่ดี! แม้ว่ามันจะยังพูดว่า "เพราะมันยาก" ซึ่งหมายความว่าฉันยังคงหวังรายละเอียดเพิ่มเติม : P
cregox

7

- ไม่มีหมายเลขที่เป็นเพียงการประมาณ

เมื่อคุณทำการค้นหาผลลัพธ์มักจะแสดงพร้อมข้อมูล: ผลลัพธ์ 1 - 10 จากประมาณ XXXX

การคำนวณจำนวนผลการค้นหาทั้งหมดของ Google เป็นการประมาณการ เราเข้าใจว่ารูป ballpark นั้นมีค่าและโดยการประมาณการมากกว่าบัญชีที่แน่นอนเราสามารถส่งคืนผลการค้นหาที่มีคุณภาพได้เร็ว

นอกจากนี้เมื่อคุณคลิกที่หน้าถัดไปของผลการค้นหาจำนวนผลการค้นหาทั้งหมดสามารถเปลี่ยนแปลงได้ ในกรณีนี้เราทราบว่าผลลัพธ์แบบสอบถามบางรายการซ้ำกันและยุบรายการซ้ำเหล่านั้นเพื่อให้คุณสามารถค้นหาผลลัพธ์ที่ต้องการได้ง่ายขึ้น การยุบรายการซ้ำจะลดจำนวนผลลัพธ์โดยประมาณรวมถึงจำนวนหน้าผลลัพธ์โดยรวม


ฉันคิดว่านี่ไม่ใช่พฤติกรรมที่ดีหากพวกเขา จำกัด จำนวนผลลัพธ์ให้มากขึ้นหรือน้อยลง 1,000 เท่านั้น ในกรณีที่ผู้ใช้ต้องการมากขึ้นพวกเขาควรจะแสดงมากขึ้น ในมุมมองของฉันคำหลักทั่วไปบางคำควรส่งคืนผลลัพธ์การค้นหาจำนวนมากจริง ๆ (เช่นดอกไม้หนังสือ ... ) และฉันคิดว่ามีรูปภาพที่แตกต่างกันมากมายปรากฏอยู่บนอินเทอร์เน็ต!

@ user11656 คุณกำลังสมมติว่า Google Image Search ทำงานในลักษณะเดียวกับการค้นหาในแอปมาตรฐานที่คุณอาจใช้ โดยทั่วไปสิ่งต่าง ๆ จะทำงานแตกต่างกันมากในระดับนั้น อาจไม่มีคำตอบเดียวสำหรับ "ภาพทั้งหมดที่ตรงกับดอกไม้" เป็นเซิร์ฟเวอร์ในออสเตรเลียอาจมีภาพที่เพิ่งอัปโหลดซึ่งยังไม่ได้เผยแพร่ไปยังเซิร์ฟเวอร์ในสหรัฐอเมริกา จากนั้นคุณต้องจัดการกับสิ่งต่าง ๆ เช่นวิธีการนำเสนอรายการที่ซ้ำกันและวิธีการทำสิ่งเหล่านั้นในทุก ๆ ล้านภาพสำหรับผู้ใช้นับล้านทันที มันเป็นเรื่องยากและคุณต้องประนีประนอมกับสถาปัตยกรรม
George Mauer

3

นับผลของ Google เป็นตัวชี้วัดความหมาย นอกเหนือจากการยุบซ้ำคุณยังมีปัญหาวิธีการนับจะถูกคำนวณในสถานที่แรกด้วยการคูณความถี่และความจริงที่ว่า Google กำหนดจำนวนสูงสุดที่กำหนดจำนวนผลลัพธ์สูงสุดที่จะกลับมา


2

คำตอบข้างต้นไม่ถูกต้อง

ค่าประมาณของ Google จะต้องใกล้เคียงกับจำนวนผลลัพธ์จริงมากกว่าที่กำหนดไว้

ตัวอย่างนี้สามารถแสดงให้เห็นได้โดยง่าย เลือกคำที่ค่อนข้างบ่อยเช่น "รัสเซีย" หรือ "ไมเคิล" ในความเป็นจริงจะต้องมีเว็บไซต์เป็นพันบนเว็บไซต์ที่มีคำเหล่านั้นอยู่บนเว็บไซต์ของพวกเขา แต่ผลลัพธ์ของ Google อาจให้คุณเพียงแค่บอกว่า 700

ความจริงไม่ใช่ว่า Google ให้การประเมินค่ามากเกินไป แต่ตอนนี้ Google ได้ จำกัด จำนวนผลลัพธ์ที่จะให้คุณอย่างมากมาย มันขัดผลอย่างรุนแรงต่อความเสียหายที่สำคัญของเราในฐานะบุคคล มันโชคร้ายเพราะฉันต้องการอ่านเว็บไซต์หลายพันแห่งที่มีเงื่อนไขของฉันในบางกรณี

ฉันรู้สิ่งนี้เพราะฉันใช้ Google มาเป็นเวลานานบางทีอาจจะนาน 10-15 ปีและสังเกตว่าตามกฎทั่วไปผลลัพธ์ของคำศัพท์นั้นสั้นลงไม่นานแม้ว่าจำนวนไซต์ที่มีเงื่อนไขเดียวกันโดยทั่วไปจะต้อง เพิ่มขึ้นในเวลาที่ฉันใช้ Google

ในอดีตที่ผ่านมาหลายปีที่ผ่านมาฉันอาจได้ผลลัพธ์ 1,000 คำสำหรับบางคำ แต่ตอนนี้ฉันได้รับ 500 ผลลัพธ์สำหรับคำเดียวกันกับที่ฉันได้รับผลลัพธ์ 1,000 รายการ


2
โปรดทราบว่า "ด้านบน" ไม่มีคำตอบในบริบทเนื่องจากสามารถจัดเรียงได้หลายวิธี แม้ว่าคุณจะถือว่าการเรียงลำดับเริ่มต้นด้วย "โหวต" ตำแหน่งของพวกเขาจะเปลี่ยนไปเมื่อมีการเพิ่มคะแนนขึ้นและลง
เบียร์

น่าสนใจมาก! รัสเซียจะช่วยให้ฉันตอนนี้เพียง 322 ผลและมันก็แสดงให้เห็นเพียงในหน้า 34 ที่ผ่านมามาก ถึงแล้วมันจะบอกว่าผลลัพธ์ 799,000 000! ในขณะที่นี่เป็นข้อมูลเชิงลึกที่ดี แต่ก็ดูเหมือนจะไม่ถูกต้อง ฉันไม่คิดว่าการประมาณการแรกนั้นถูกต้องเช่นกันและความตั้งใจจะนำเฉพาะผลลัพธ์ที่แสดงไม่ใช่ "จำนวนที่คิดว่ามีอยู่บนเว็บ" ดังนั้นหน้าสุดท้ายจึงแก้ไข
cregox

1

ปัญหาเกี่ยวกับเครื่องมือค้นหาของ Google (รูปภาพ) คือมีจุดมุ่งหมายเพื่อความเกี่ยวข้องโดยการลดความแปรปรวน ประการแรกสิ่งสำคัญคือต้องเข้าใจวิธีการทำงาน ภาพที่อัปโหลดไปยังอินเทอร์เน็ตจะต้องมีการจัดทำดัชนีด้วยสองวิธี:

  • ขึ้นอยู่กับความคิดริเริ่ม (ภาพจะได้รับการวิเคราะห์โดย "สมาร์ทบ็อต" ขึ้นอยู่กับสีขนาดรูปแบบการจดจำรูปร่างประเภท ฯลฯ )
  • ขึ้นอยู่กับความคล้ายคลึงกัน (ภาพจะได้รับการวิเคราะห์โดย "smart bot2" และการอ้างอิงโยงกับรูปภาพที่มีอยู่แล้วในฐานข้อมูลและติดแท็กเพิ่มเติมด้วยป้ายกำกับหมวดหมู่หนึ่งหรือสองรายการ: "รูปภาพตรงกัน" และ "รูปภาพคล้ายกับ ... ")

หลังจากจัดทำดัชนีภาพจะสืบทอด "คำหลัก" อันเป็นผลมาจากการจดจำเพื่อหลีกเลี่ยงการแสดงผลลัพธ์นอกหัวข้อไปยังผู้ใช้ปลายทาง สิ่งสำคัญคือคำหลักแต่ละคำเป็นวลีแบบสแตนด์อโลนที่มีค่าที่กำหนดเป็น% ตามความแข็งแกร่งของความเกี่ยวข้อง (นั่นคือสาเหตุที่การจัดกลุ่มคำเพิ่มเติมในช่องค้นหาส่งผลให้ผลลัพธ์น้อยลงและเมื่อคุณค้นหารูปภาพด้วยการอัพโหลดหรือป้อน URL, Google จะกำหนด "เดา" ด้วยคำหลักอันดับต้น ๆ เท่านั้นซึ่งหมายความว่าการค้นหาจะไม่แสดงรูปภาพทั้งหมดให้คุณเพียงเพราะการค้นหาไม่ได้ออกแบบมาให้ทำ)

ดังนั้นเมื่อสิ้นสุดวันที่คุณทำการค้นหารูปภาพและภายใต้ช่องค้นหาคุณจะเห็นจำนวนมหาศาลที่บอกว่า "25,270,000,000 ผลลัพธ์ (0.55 วินาที)" ส่วนใหญ่มักเป็นหมายเลขปลอมเพราะคุณจะไม่ได้รับอีกต่อไป มากกว่า 200 (สูงสุด 500 แต่หลังจากผู้ใช้ร้องขอ) ผลลัพธ์ที่ถูกกรองเพื่อแยกออก:

  • รายการที่ซ้ำกันภายนอก (หากภาพเดียวกันคือ 2+ ครั้งในหน้าเว็บไซต์เดียวกัน)
  • ข้อมูลซ้ำที่เกี่ยวข้อง (แสดงเฉพาะ "ผลลัพธ์ที่ดีที่สุด" - ดูภาพด้านล่าง)
  • ภาพที่มีปัญหากับกฎหมาย (ดูภาพด้านล่าง)
  • ภาพที่ละเมิด DMCA (ดูภาพด้านล่าง)
  • ภาพที่มาจากสแปม, มัลแวร์, แหล่งฟิชชิ่ง
  • ภาพที่ถูกซ่อน (หากผู้ใช้ไม่ปิดใช้งานการค้นหาปลอดภัย)
  • ภาพที่ขึ้นบัญชีดำโดย Google ( บทความ )
  • ภาพที่มี AR แตกต่างกัน (โดยทั่วไปภาพทั้งหมดที่มีอัตราส่วนภาพแตกต่างจากการอ้างอิงการค้นหาภาพเช่นคุณสามารถพลาดผลลัพธ์ที่ต้องการทั้งหมดหากคุณค้นหาด้วยภาพที่คุณเลือก - สมมติว่ามีอัตราส่วนแปลก 9: 7 - ในขณะที่ภาพทั้งหมดจัดทำดัชนี Google อยู่ในอัตราส่วน 3: 4 - ซึ่งอาจเป็นข้อเสียที่ใหญ่ที่สุดของเครื่องมือค้นหานี้เพราะมันจะเป็นไปตามอัตราส่วนภาพเป็นเกณฑ์แรกเสมอ)
  • และอีกมากมาย

ในการสรุป: ผลการค้นหาของรูปภาพจะไม่เกี่ยวข้องกับการใช้งาน บางครั้งคุณจะได้ผลลัพธ์สุดท้ายที่คุณต้องการด้วยวลีค้นหา "gate poster" ไม่เช่นนั้นอาจเป็น "gate cover", "gate bluray", "gate dvd", "gate 2015" หรือแม้แต่ "自衛隊彼の地斯斯く戦えり "- คุณไม่สามารถรับผลลัพธ์ภาพ" ALL "ได้เนื่องจากไม่มีสิ่งใดที่เป็น" ALL "นั่นคือสาเหตุที่มีความจำเป็นที่จะต้องเล่นกับมันเพื่อไปที่นั่น และยังเกี่ยวข้องกับการพูดถึงว่ามีเสิร์ชเอ็นจิ้นรูปภาพอื่น ๆ ที่สามารถทำงานได้แตกต่างกันมากขึ้นเพราะทำงานบนมาตรฐานและเกณฑ์ที่ต่างกัน ไม่ใช่และไม่เคยเป็น "Google" เท่านั้น ... >> https://www.yandex.com/images/

ส่วนขยายที่โดดเด่น:


การทำเครื่องหมายสิ่งเหล่านี้ซ้ำซ้อนจะมีประโยชน์มากกว่าการโพสต์คำตอบในแต่ละคำถาม
jonsca

0

ที่ด้านบนสุดจะบอกว่าหน้า 70 จาก 7000 ผลลัพธ์ (ตัวอย่าง) มันจะให้หมายเลขหน้าและจำนวนผลลัพธ์ ไม่มีผลลัพธ์ 70 รายการ แต่มี 70 หน้า หวังว่านี่จะช่วยได้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.