การระบุสาเหตุของการเข้าชมที่เกิดขึ้นในพื้นที่ที่ไม่ได้มาจากคนทั่วไปนั้นต้องใช้ความอดทนและงานนักสืบ แต่ขั้นตอนพื้นฐานคือ:
ค้นหาว่ามาจากไหนโดยใช้เครื่องมือที่มีให้คุณ (ดูด้านล่าง)
ตรวจสอบว่าเป็นอันตรายหรือไม่โดยการวิเคราะห์แหล่งที่มาของคำขอความถี่ส่วนหัวของตัวเองและผลกระทบต่อเครือข่ายและเซิร์ฟเวอร์ของคุณ
ตัดสินใจว่าจะปิดกั้นใน Google Analytics เพียงอย่างเดียวเพื่อป้องกันไม่ให้ปรากฏในสถิติของคุณ (โดยใช้ตัวกรอง Google Analytics) เพื่อบล็อกที่เซิร์ฟเวอร์เพื่อป้องกันไม่ให้มันเข้าถึงเว็บไซต์ของคุณในอนาคต (ใช้ไฟร์วอลล์หรือบริการเช่นCloudflare ) หรือไม่สนใจเลย
ฉันจะไม่ให้รายละเอียดเกี่ยวกับผลกระทบด้านความปลอดภัยที่นี่เพราะคุณดูเหมือนจะกังวลมากขึ้นเกี่ยวกับผลกระทบที่มีต่อข้อมูลการวิเคราะห์ของคุณ นี่คือข้อสังเกตบางประการเกี่ยวกับกรณีนี้โดยมีตัวชี้บางตัวระบุแหล่งที่เป็นไปได้และกรองปริมาณการใช้งานที่ไม่ต้องการใน Google Analytics:
มันอาจไม่ใช่ Pingdom
Spikes ของ Google Analytics ไม่น่าจะมาจาก Pingdom ด้วยเหตุผลสองประการ:
การตรวจสอบ HTTP ของ Pingdom ไม่แยกวิเคราะห์ JavaScriptดังนั้นจึงไม่เรียกใช้สคริปต์ Google Analytics แบบฝัง (ฉันตรวจสอบสิ่งนี้อีกครั้งกับทีมสนับสนุนของ Pingdom เมื่อวานนี้เพราะฉันใช้ Pingdom ด้วยและก็อยากรู้อยากเห็นนี่เป็นคำพูดโดยตรงจากอีเมลสนับสนุนของพวกเขา: "เนื่องจากการตรวจสอบ HTTP ของเราไม่ทำงานรหัส JavaScript ใด ๆ Google Analytics จะไม่มี บันทึกการเข้าชมของเราที่ดำเนินการโดยเซิร์ฟเวอร์โพรบของเราไปยังเว็บไซต์ของคุณ " )
ปัจจุบัน Pingdom ไม่มีเซิร์ฟเวอร์ในเอดินบะระ พวกเขาแสดงรายการเซิร์ฟเวอร์ Probe ทั้งหมดพร้อมที่อยู่ IP และตำแหน่งบนหน้าในแผงควบคุมของคุณ (ลิงก์ชื่อ "เซิร์ฟเวอร์ Probe" ที่ด้านล่างขวาของหน้าผู้ดูแลระบบ Pingdom ทั้งหมดเมื่อคุณลงชื่อเข้าใช้) มีเพียงสอง บริษัท ที่จดทะเบียนในสหราชอาณาจักรเท่านั้นที่อยู่ในแมนเชสเตอร์และลอนดอน
แต่คุณไม่ต้องใช้คำพูดของฉันมัน หากเดือยแหลมกำลังดำเนินการอยู่และคุณต้องการยืนยันว่า Pingdom ไม่ใช่สาเหตุของการเข้าชมอย่างฉับพลันและเดือยอัตราตีกลับคุณสามารถ:
หยุด Pingdom ที่ร้องขอไปยังไซต์ของคุณชั่วคราวและดูว่าการโจมตีจากพื้นที่เหล่านั้นหายไปหรือไม่ (ฉันสงสัยว่ามันจะไม่สร้างความแตกต่าง)
- หรือ -
ตั้งค่าหน้าเว็บที่example.com/pingdom/any-url-you-like
ชี้ Pingdom คำขอของคุณไปยังหน้านั้นแทนที่จะเป็นหน้าแรกของคุณและยกเว้น/pingdom/
ไดเรกทอรีย่อยจากผลลัพธ์ Google Analytics ของคุณโดย (a) ลบรหัสติดตาม Analytics บนหน้านั้นหรือ (b) โดยใช้ตัวกรองเพื่อยกเว้น หน้าใน Google Analytics หากคุณไม่สามารถลบรหัสติดตามแบบละหน้า (เช่นหากคุณใช้ CMS ที่มีรหัสในทุกหน้าและคุณไม่มีสิทธิ์ในการเปลี่ยนแปลงพฤติกรรมนี้มากพอ)
วิธีกรองคำขอด้วย Google Analytics
นี้เป็นสิ่งจำเป็นเฉพาะในกรณีที่คุณสงสัยว่า Pingdom ไม่แยก JavaScript และมีข้อบ่งชี้ว่ามันไม่ไม่มี แต่กรองการเข้าชมจาก Pingdom เช่นนี้เป็นวิธีหนึ่งในการตรวจสอบว่าคุณต้องการที่จะสร้างความมั่นใจให้ตัวเอง นอกจากนี้ยังมีประโยชน์ในการเรียนรู้วิธีการทำเช่นนี้เพื่อให้คุณสามารถกรองการเข้าชมประเภทอื่น ๆ ในอนาคตหากคุณต้องการ:
ลงชื่อเข้าใช้ Google Analytics และคลิกลิงก์ "ผู้ดูแลระบบ" (ด้านบนขวาถัดจาก "ความช่วยเหลือ")
คลิกชื่อโดเมนหรือชื่อไซต์สำหรับโปรไฟล์ที่คุณต้องการกรอง (เช่นexample.com
)
คลิกแท็บ "ตัวกรอง"
คลิก "+ ตัวกรองใหม่"
ตั้งชื่อตัวกรองแล้วเลือก "ตัวกรองที่กำหนดไว้ล่วงหน้า"
เลือก "ยกเว้น ... ทราฟฟิกไปยังไดเรกทอรีย่อย ... ที่เท่ากับ" จากช่องรายการแบบเลื่อนลง
พิมพ์/pingdom/
ลงในฟิลด์ไดเรกทอรีย่อยและปล่อยให้ "Case Sensitive" ตั้งค่าเป็น "ไม่"
นี่ควรเป็นผลลัพธ์เมื่อคุณทำเสร็จ:
บันทึกการตั้งค่าเหล่านี้จากนั้นทำการตรวจสอบ Pingdom ของคุณexample.com/pingdom/any-page-or-url-that-exists
อีกครั้งและ Google Analytics จะกรองการเข้าชมไปยัง URL นั้น (คุณจะยังได้รับรายงานสถานะการออนไลน์ของเซิร์ฟเวอร์พื้นฐานด้วยวิธีนี้แม้ว่า Pingdom จะไม่ชี้ไปที่หน้าแรกของคุณอีกต่อไป)
หากไม่ใช่ Pingdom เพลงฮิตเหล่านั้นมาจากไหน
คุณสามารถลองค้นหาได้หลายวิธี:
1. ดูว่าเครือข่ายใดที่ส่งการรับส่งข้อมูลที่ตีกลับมากที่สุด หากต้องการทำเช่นนั้นกับ Google Analytics ให้ดูที่ส่วนการรายงานมาตรฐานสำหรับเว็บไซต์ของคุณจากนั้นเลือกผู้ชม> เทคโนโลยี> เครือข่ายจากด้านซ้ายมือ สุดท้ายด้วยการเลือกโหมดแผนภูมิวงกลม (ค่าเริ่มต้น) ให้เลือก "บริจาคเป็นผลรวม ... ตีกลับ" จากรายการแบบเลื่อนลงทางด้านขวา:
คุณจะเห็นรายการของ ISP หรือผู้ให้บริการเครือข่ายที่ผู้ใช้มีส่วนร่วมกับอัตราการตีกลับของคุณ บางครั้งสิ่งนี้จะเป็น ISP ที่เฉพาะเจาะจงขนาดเล็กที่คุณสามารถติดตามไปยังพื้นที่หนึ่งหรือธุรกิจ ด้วยชื่อของผู้ให้บริการเครือข่ายที่ส่งปริมาณการรับส่งข้อมูลที่ใหญ่คุณสามารถเลือกที่จะกรองเครือข่ายนั้นจาก Google Analytics ตามที่อธิบายไว้ข้างต้น แต่กรองตามเครือข่ายแทนที่จะเป็นโดเมนย่อย
ในบางครั้งผู้ให้บริการอินเทอร์เน็ตชั้นนำที่ระบุไว้จะเป็นผู้ให้บริการในประเทศขนาดใหญ่ที่อาจมีลูกค้าหลายล้านรายและคุณจะไม่ใช่ผู้ชาญฉลาด ณ จุดนั้น Google Analytics ไม่สามารถช่วยให้คุณเจาะลึกและกำหนดว่าลูกค้าของผู้ให้บริการรายใดที่ส่งปริมาณการเข้าชมที่ถูกตีกลับซ้ำ (เนื่องจาก Analytics ไม่มีข้อมูลที่อยู่ IP หรือข้อมูลอื่น ๆ ที่ระบุ) ในการรับข้อมูลประเภทนั้นคุณสามารถใช้ผู้ให้บริการสถิติอีกรายที่บันทึกที่อยู่ IP (เช่นClicky ) หรือคุณสามารถวิเคราะห์บันทึกเซิร์ฟเวอร์ของคุณซึ่งบันทึกการเข้าถึงด้วยที่อยู่ IP:
2. ตรวจสอบบันทึกการเข้าถึงเว็บเซิร์ฟเวอร์ของคุณเพื่อสำรวจการเข้าชมจากโปรแกรมรวบรวมข้อมูลที่รู้จักและค้นหาการเข้าถึงซ้ำ ๆ จากที่อยู่ IP เดียวกัน เครื่องมือสถิติบนเว็บเช่น AWStats สามารถช่วยคุณได้ มันค่อนข้างเป็นที่นิยมในหมู่โฮสต์เว็บบางแห่งและพวกเขาอาจติดตั้งให้คุณแล้ว
นี่คือบางส่วนเอาท์พุทตัวอย่างจาก AWStats ส่วนที่เกี่ยวข้องสองส่วนสำหรับคุณคือ "โฮสต์" และ "ผู้เข้าชมหุ่นยนต์ / แมงมุม"
ส่วนโฮสต์อาจให้ข้อมูลว่าที่อยู่ IP ใดที่เข้าถึงไซต์ของคุณเพื่อทำให้เกิดการตีกลับ (และคุณสามารถกรองที่อยู่ IP เหล่านี้ใน Google Analytics ได้) ส่วน robots / spider อาจให้คำแนะนำเกี่ยวกับซอฟต์แวร์รวบรวมข้อมูลหรือสคริปต์อัตโนมัติที่เข้าถึงไซต์ของคุณที่อาจใช้ JavaScript หากคุณไม่แน่ใจวิธีอ่านหรือเข้าถึงบันทึกเซิร์ฟเวอร์ให้ขอความช่วยเหลือจากผู้ให้บริการโฮสต์ของคุณ
มีที่อยู่ IP หรือไม่ ค้นหาผู้ที่กำลังใช้งาน
หากคุณจัดการเพื่อรับที่อยู่ IP จากส่วนโฮสต์ใน AWStats หรือที่อื่นคุณสามารถทำการค้นหา IP แบบย้อนกลับเพื่อดูว่าใครกำลังใช้งานอยู่
การค้นหา IP แบบย้อนกลับมักจะให้ชื่อของผู้ให้บริการโฮสต์ที่คุณสามารถรายงานการละเมิดหากคุณเชื่อว่าคำขอเป็นอันตราย หรืออาจให้ชื่อของ ISP ภายในประเทศที่ลูกค้าใช้ระบบอัตโนมัติแบบสคริปต์เพื่อพยายามเอาเปรียบเว็บไซต์ของคุณ โดยปกติคุณสามารถส่งรายงานการละเมิดไปยังabuse@example.com
ที่ซึ่งexample.com
เป็นชื่อของผู้ให้บริการโฮสต์หรือ ISP และบางครั้งจะเสนอชื่อของ บริษัท เฉพาะที่คุณสามารถติดต่อเพื่อขอข้อมูลเพิ่มเติม