คุณไม่พบสิ่งใดใน Google [ปิด]


18

Google อ้างว่ามีความยุติธรรมและอยู่ในความสนใจของ บริษัท (เกือบตลอดเวลา) ที่จะขัดจังหวะอินเทอร์เน็ตทุกอย่างที่แมงมุมสามารถเข้าถึงได้ ฉันอยากจะรู้:

  • Google ไม่สามารถแสดงเนื้อหาประเภทใด (ที่สาธารณชนเข้าถึงได้)
  • มีเนื้อหาบางประเภทที่ Google ไม่สามารถเรียกคืนได้หรือไม่

การอ้างอิงโดยเฉพาะเอกสารของ Google นั้นยอดเยี่ยมโดยเฉพาะ


ขณะนี้สหภาพยุโรปได้ออกกฎหมาย "ถูกลืม" มีไม่มากที่เราจะไม่สามารถหาได้อีกต่อไป นี่คือบางสิ่งที่ถูก "ลืม"
samthebrand

คำตอบ:


21

แนวคิดบางประการเกี่ยวกับประเภทของสิ่งต่าง ๆ :

  1. เนื้อหาไม่ได้รับอนุญาตอย่างชัดเจนจากrobots.txtไฟล์ของโดเมนจะถูกแยกออกจากดัชนีของ Google
  2. เว็บไซต์ที่ไม่ได้เชื่อมโยงจากเว็บไซต์อื่น ๆ ที่ Google รู้จักอยู่แล้ว นั่นคืออาจมีเว็บไซต์จำนวนมากที่ไม่ได้รับการเชื่อมโยงจากหน้ามองเห็นเว็บไซต์เหล่านั้นไม่เคยไปพบได้โดยแมงมุม Google จนกว่าพวกเขากำลังส่งด้วยตนเองกับ Google ผ่านของผู้ดูแลเว็บ
  3. เว็บไซต์ที่อยู่หลังฟอร์มของเว็บที่คุณต้องกรอก
  4. ภาพสำมะโน เนื่องจากเนื้อหานั้นเป็นรูปภาพที่มักจะจัดทำดัชนีด้วยตนเองจึงมักพบในเว็บไซต์ที่ต้องจ่ายเงินเช่น ancestry.com

เรียนรู้เพิ่มเติมเกี่ยวกับDeep Web


2
จุดที่ 2 มันไม่เป็นความจริง คุณสามารถส่งเว็บไซต์ไปยัง Google ผ่านทางเครื่องมือของผู้ดูแลเว็บและจะได้รับการจัดทำดัชนีแม้ว่าจะไม่ได้เชื่อมโยงจากเว็บไซต์อื่น
อเล็กซ์

นั่นเป็นความจริง. การชี้แจงที่ดี
amh

3
จริงๆแล้วฉันจะไม่เห็นด้วยกับประเด็นที่สอง ฉันมีเว็บเซิร์ฟเวอร์ทดสอบบนพีซีของฉันและมีการทำดัชนี ฉันพบสิ่งนี้โดยการตรวจสอบบันทึกการเข้าถึง
บากู

2
ฉันได้ลงทะเบียนโดเมนใหม่แล้วเริ่มพัฒนาพวกเขาและพบว่า Googlebot รวบรวมข้อมูลพวกเขาเพียงไม่กี่วันต่อมา ฉันคิดว่ามันน่าขนลุกจนฉันรู้ว่าฉันอาจไม่ใช่คนแรกที่เป็นเจ้าของโดเมนนี้ :) พวกเขาไม่เปิดเผยรายละเอียดเฉพาะ แต่ฉันแน่ใจว่าพวกเขาติดตามโดเมนที่ผู้คนคิดว่าสำคัญพอที่จะลงทะเบียนและที่ อย่างน้อยก็มีคนมาเยี่ยมบ้างในบางครั้งอย่างน้อยก็ในบางช่วงเวลา
ทิมโพสต์

6

นอกเหนือจาก Twitter แล้ว Google ไม่ทำดัชนีTumblrทั้งหมดที่ดี โพสต์บล็อกบน Tumblr นั้นง่ายต่อการค้นหาโดยใช้การค้นหา Tumblr นอกจากนี้ทุกอย่างในGoogle Sitesไม่ได้จัดทำดัชนี (หรือแทบจะไม่) หากคุณเริ่มไซต์ Google รับโดเมนของคุณเอง

บล็อกขนาดเล็กที่ไม่ได้รับการอัปเดตเป็นประจำมักถูกเททิ้งจากผลการค้นหา พลัสสิ่งที่พวกเขาคิดว่าเป็นsplog


5

เนื้อหา Twitter ส่วนใหญ่ไม่ได้จัดทำดัชนีโดย Google แม้ว่าจะเป็นข้อมูลสาธารณะก็ตาม เคยมีให้กับ Google แล้ว แต่ก็ไม่เป็นเช่นนั้นอีกต่อไปตั้งแต่ข้อตกลงหมดอายุ

แหล่ง


ในขณะที่เป็นจริงคำถามถามว่า "เนื้อหาที่มีคุณภาพสูง" ไม่สามารถใช้ได้ใน Google Twitter ส่วนใหญ่จะไม่ผ่านเกณฑ์นั้น :) ฉันเห็นทวีตแปลก ๆ ปรากฏขึ้นในการค้นหาของ Google
HappyTimeGopher

4

ขึ้นอยู่กับประเทศที่คุณอยู่ ในประเทศเยอรมนีจะไม่แสดงเว็บไซต์หลายพันแห่งที่รัฐบาลคิดว่าไม่ดีสำหรับคุณและรายการจะเพิ่มขึ้นหลายพันรายการทุกปี

Google เป็นเครื่องมือในการเซ็นเซอร์อินเทอร์เน็ต หากคุณต้องการอินเทอร์เน็ตฟรีให้ใช้ บริษัท ที่ไม่ร้ายเช่นDuckDuckGoหรือ บริษัท อื่น


4

คุณไม่สามารถค้นหาคำหลักที่มีอักขระพิเศษในการค้นหาโดย Google :

โดยทั่วไปเครื่องหมายวรรคตอนจะถูกละเว้นซึ่งรวมถึง @ # $% ^ & * () = + [] \ และอักขระพิเศษอื่น ๆ

สิ่งนี้น่ารำคาญเป็นพิเศษเมื่อ Google ใช้รหัส


3

Google ลบผลการค้นหาที่ถือว่าเป็นการละเมิดสิทธิ์ในทรัพย์สินทางปัญญาหลังจาก DMCA ทำการส่งคืนและคำขอที่คล้ายกัน ดูฟอร์มคำขอลบผลการค้นหาของ Google (อาจมี URL เพิ่มเติม btw)


1

เว็บไซต์ที่มีเนื้อหามากมายที่ Google ไม่มีเวลา (หรือความชอบ) ในการจัดทำดัชนีทั้งหมด

เว็บไซต์ที่ไม่มีแผนที่เว็บไซต์ที่รวบรวมข้อมูลได้และกำหนดให้ Google ต้องระบุคำค้นหาเพื่อเข้าถึงผลลัพธ์ที่มีในเว็บไซต์อาจไม่ได้รับการจัดทำดัชนีอย่างสมบูรณ์

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.