อัตราส่วนมาตรฐานของคุกกี้ต่อ“ ผู้เยี่ยมชม” หรือไม่


31

ดังที่ระบุไว้ในบล็อกโพสต์เมื่อเร็ว ๆนี้เราเห็นความแตกต่างระหว่าง "ผู้เข้าชม" และ "ผู้เข้าชม" ของ Quantcast ของ Google Analytics

นอกจากนี้ด้วยเหตุผลที่เราไม่เคยพบมาก่อน Google Analytics เพิ่งได้รับจำนวนมากกว่า Quantcast ตอนนี้ GA กำลังแสดงผู้เข้าชมมากกว่า (15 ล้านคน) บน stackoverflow.com เพียงลำพังกว่า Quantcast ที่เห็นในเครือข่ายทั้งหมด (14 ล้าน):

ทำไม? ฉันไม่รู้ Google Analytics อาจสูญเสียคุกกี้ในบางครั้งหรือ Quantcast คิดถึงผู้เข้าชม การนับเป็นวิทยาศาสตร์ที่ไม่แน่นอน

เราคิดว่านี่เป็นเพราะQuantcast ใช้อัตราส่วนอนุรักษ์นิยมมากกว่าคุกกี้เพื่อผู้เข้าชม ในขณะที่ Google Analytics อาจถือว่า "ผู้เยี่ยมชม" คุกกี้ทุกคน Quantcast จะพิจารณาเฉพาะผู้ที่เข้าชม "1. ผู้เข้าชม" ทุกคนที่เป็นคุกกี้ สิ่งนี้สมเหตุสมผลสำหรับฉันเนื่องจากผู้คนสามารถเข้าถึงไซต์ของเราจากคอมพิวเตอร์หลายเครื่องหลายเบราว์เซอร์และอื่น ๆ

ฉันมีสองคำถามที่เกี่ยวข้องอย่างใกล้ชิด:

  1. มีอัตราส่วนมาตรฐานที่ยอมรับของคุกกี้ต่อผู้เข้าชมหรือไม่? เห็นได้ชัดว่านี่เป็นวิทยาศาสตร์ที่ไม่แน่นอน แต่มีกฎง่ายๆหรือไม่?

  2. มีวิธีที่แม่นยำกว่าในการนับ "ผู้เข้าชม" ไปยังเว็บไซต์อื่นที่ไม่ใช่การพึ่งพาคุกกี้ของเบราว์เซอร์หรือไม่? หรือนี่จะเป็นการประเมินที่ดีที่สุดที่พยายามไม่ว่าคุณจะวัดมันหรือไม่?


Quantcast ใช้คุกกี้อย่างแน่นอนใช่มั้ย พวกเขาไม่เพียงไปที่ที่อยู่ IP หรืออะไรบางอย่าง?
DisgruntledGoat

@disgruntledgoat ฉันเพิ่งตรวจสอบเว็บไซต์: "Quantcast ให้ข้อมูลผู้ชมสำหรับจำนวนคุกกี้ที่ไม่ซ้ำใครและผู้คน"
Matthew Brookes

@DisgruntledGoat ตรวจสอบหน้านี้มาก quantserve.comมันมีคุกกี้จาก
Yahel

คำตอบ:


14

Quantcast ส่งอีเมลฉัน:

คุณบอกว่ามีเดลต้าค่อนข้างมากระหว่างหมายเลข GA และหมายเลข QC ของคุณ แม้ว่าสิ่งนี้จะไม่เกิดขึ้นบ่อย แต่ก็เกิดขึ้นและมีสาเหตุหลายประการที่สามารถเกิดขึ้นได้ ตัวอย่างเช่นเราบัญชีสำหรับคุกกี้บุคคลที่สามและการรีเฟรชอัตโนมัติและ GA ไม่ได้ นอกจากนี้เรายังขอให้ผู้เผยแพร่โฆษณาวางแท็กของเราไว้ที่ด้านล่างของหน้าเพื่อให้สอดคล้องกับมาตรฐาน MRC และ IAB หากแท็กการวัดอื่น ๆ ของคุณสูงกว่าบนหน้าเว็บพวกเขาอาจเริ่มทำงานเมื่อ Quantcast ไม่ได้ (เราเป็นบริการวัดปริมาณการใช้ที่ได้รับการรับรองโดย MRC เท่านั้น) นอกจากนี้ตัวเลขจะไม่เหมือนเดิมทุกประการเนื่องจากข้อควรพิจารณาเกี่ยวกับเขตเวลา - เราใช้ฟังก์ชั่นการทำให้เป็นมาตรฐานและ GA ได้รับการแก้ไข

หากคุณต้องการที่จะเรียนรู้เพิ่มเติมเกี่ยวกับวิธีการที่เราตรวจสอบตัวเลขของเราโปรดตรวจสอบ: http://www.quantcast.com/how-we-do-it นอกจากนี้เรายังมีเอกสารทางเทคนิคเกี่ยวกับข้อมูลผู้ชมที่แก้ไขคุกกี้และวิธีการของเราที่นี่

การอ่านเอกสารสีขาวที่ฉันเห็นว่าจริง ๆ แล้วพวกเขากำลังทำสิ่งที่เจฟฟ์แนะนำ: ทำให้ตัวเลขที่เป็นทางการ "" เหลวไหล "เพื่อให้ได้สิ่งที่พวกเขาคิดว่าใกล้เคียงกับจำนวนคนที่แท้จริง พวกเขามีสมุดปกขาวแก้ไขคุกกี้ผู้ชม (ลิงค์ PDF)ซึ่งหมายความว่าระบบของพวกเขาค่อนข้างซับซ้อนไม่ใช่เรื่องง่ายเพียงแค่หารด้วยจำนวนเวทย์มนตร์:

โปรแกรม Quantcast Quantified Publisher รวบรวมกิจกรรมการบริโภคสื่อมากกว่า 75 พันล้านรายการทุกเดือนสร้างขึ้นโดยคุกกี้มากกว่า 1.4 พันล้านรายการ (ข้อมูล ณ เดือนมิถุนายน 2551) ยิ่งไปกว่านั้นพันธมิตรผู้เผยแพร่โฆษณาเชิงปริมาณของเราหลายคนแบ่งปันตัวระบุที่ไม่ระบุตัวตนกับเราซึ่งเป็นอิสระจากคุกกี้ โมเดลของเรายังมีแผงควบคุมหลายจุดที่จัดทำขึ้นสำหรับจุดอ้างอิงผู้คนและการสอบเทียบที่ปราศจากการลบคุกกี้ เราวิเคราะห์ข้อมูลทั้งหมดนี้ด้วยกระบวนการเก็บรวบรวมอคติและปัญหาที่แตกต่างกัน แบบจำลองของเราคำนึงถึงความถี่ในการเยี่ยมชมระยะเวลาความเป็นไปได้ของการใช้คอมพิวเตอร์หลายเครื่องและแม้กระทั่งผลกระทบของหลาย ๆ คนที่ใช้คอมพิวเตอร์เครื่องเดียวกันเพื่อส่งมอบการประเมินตามคน แบบจำลองของเราสำหรับการแปลคุกกี้ที่ไม่เหมือนใครให้กับผู้คนได้รับการตรวจสอบความถูกต้องโดยใช้ตัวอย่างการพักและชุดข้อมูลอิสระ นอกจากนี้โมเดลของเรายังมีการเปลี่ยนแปลงและปรับเทียบอย่างต่อเนื่องเพื่อสะท้อนให้เห็นถึงลักษณะการพัฒนาของรูปแบบการรับส่งข้อมูลทางอินเทอร์เน็ต


2
น่าสนใจ ข้อความที่ตัดตอนมาหลังมีข้อมูลมากขึ้น (และโน้มน้าวใจ) กว่าครั้งแรก GA ไม่จำเป็นต้องบัญชีสำหรับคุกกี้ของบุคคลที่สามเนื่องจากใช้คุกกี้ของบุคคลที่หนึ่ง ใช่ความแตกต่างของเขตเวลาจะเปลี่ยนตัวเลขที่แม่นยำ แต่ช่วงเวลายาวนานเกินหนึ่งเดือนนั้นไม่น่าเป็นไปได้อย่างยิ่งที่จะอธิบายความแตกต่างของการวัดที่สำคัญ
Yahel

27

ยังมีอีกปัจจัยหนึ่งที่ใช้เล่น Quantcast undercounting: พวกเขาใช้คุกกี้บุคคลที่สาม (คุกกี้ที่ให้บริการจาก.quantserve.comโดเมน) ในขณะที่ Google Analytics ใช้คุกกี้บุคคลที่หนึ่ง ( stackexchange.comฯลฯ )

สิ่งนี้ค่อนข้างสำคัญเนื่องจากเบราว์เซอร์บางตัว (โดยเฉพาะ Safari แต่เมื่อเร็ว ๆ นี้ Firefox และ Chrome) ปิดการใช้งานคุกกี้ของบุคคลที่สามเป็นการตั้งค่าเริ่มต้นและอื่น ๆ อีกมากมายอาจเลือกการตั้งค่าความเป็นส่วนตัวที่แยกจากกัน ซึ่งหมายความว่ามีกลุ่มย่อยของประชากรที่จะไม่ถูกติดตามโดยคุกกี้ของ QuantCast โดยเนื้อแท้นั่นหมายความว่า Google Analytics จะส่งคืนจำนวนผู้เข้าชมที่สูงขึ้นเสมอ

ฉันจะบอกว่าไม่มีกฎง่ายๆ ในฐานะผู้ปฏิบัติงานด้านการวิเคราะห์ฉันจะบอกว่าการแสวงหาจำนวนผู้เข้าชมที่ 'จริง' นั้นหมดหวังและมุ่งเน้นไปที่การเยี่ยมชมของตัวเองแทน ตัวอย่างเช่นสำหรับบัญชี Google Analytics ของฉันฉันมีผู้เยี่ยมชมอย่างน้อย 8 คนโดยเข้าถึง StackOverflow จาก Chrome, Safari และ Firefox บนแล็ปท็อปที่ทำงานของฉันแล็ปท็อปส่วนตัวโทรศัพท์และ iPad ของฉัน บริการการวิเคราะห์ทั้งหมดนับในรูปแบบที่แตกต่างกันและทำให้ทั้งหมดกลับมามีจำนวนที่แตกต่างกันอย่างมีนัยสำคัญ

แม้จะมีการใช้งานที่สมบูรณ์แบบ Google Analytics จะแสดงจำนวนการเข้าชมที่ต่ำกว่าระบบการวิเคราะห์ที่ใช้บันทึกข้อมูลเซิร์ฟเวอร์ แต่จะแสดงจำนวนการเข้าชมที่สูงกว่าระบบที่ใช้คุกกี้ของบุคคลที่สามเช่น Quantcast สิ่งสำคัญไม่ได้ดูที่ผลรวมดิบ แต่แนวโน้มที่แต่ละวิธีแสดงให้เห็นในจุดแข็ง ดังนั้นอย่าเปรียบเทียบหมายเลข Quantcast กับหมายเลข Google Analytics ให้ใช้ตัวเลขภายในบริบทที่พวกเขาถูกรวบรวมแทน

ปัญหาอื่นอาจเป็นไปได้ว่าการใช้งาน Google Analytics ของคุณไม่ถูกต้องเนื่องจากการกำหนดค่าสำหรับการตั้งค่าหลายโดเมนและโดเมนย่อยอาจเป็นฝันร้ายหากทำไม่ถูกต้องและจริงจังซึ่งอาจทำให้เบราว์เซอร์เดียวถูกนับว่าเป็น มีผู้เยี่ยมชมหลายคน นี่ไม่เป็นปัญหาสำหรับ Quantcast เนื่องจากคุกกี้ทั้งหมดถูกตั้งค่าไว้ที่โดเมนบุคคลที่สาม


Google Chrome ดูเหมือนจะบล็อกคุกกี้ของบุคคลที่สามเป็นค่าเริ่มต้น
MrWhite

7

อัตราส่วนของคุกกี้ต่อผู้เข้าชมที่ไม่ซ้ำกันมักจะอยู่ระหว่าง 1.3 และ 1.7 สำหรับไซต์ที่มีผู้เข้าชมมากกว่าล้านครั้ง

ในขณะที่ yc01 ถูกต้องที่ GA ใช้คุกกี้ของบุคคลที่หนึ่งเทียบกับคุกกี้ของบุคคลที่สามเราที่ RealSelf.com ใช้ผู้ให้บริการวิเคราะห์รายแรกสองราย (GA และ Comscore Direct) และ GA ยังคงแสดงผู้เยี่ยมชมที่ไม่ซ้ำแบบสัมบูรณ์กว่า Comscore 30%

Comscore แสดงผู้เข้าชมที่ไม่ซ้ำตามประเทศดังนั้นเพื่อเปรียบเทียบ GA กับ Comscore เราต้องคำนวณจำนวนผู้เข้าชมที่ไม่ซ้ำแบบสัมบูรณ์ตามสหรัฐฯดังนี้:

การเยี่ยมชมของสหรัฐอเมริกา / การเยี่ยมชมทั่วโลก * ผู้ใช้ที่ไม่ซ้ำแน่นอน

(1,150,110 / 1,650,979) * 1,273,059 = 886,842 ผู้ใช้ที่ไม่ซ้ำที่อยู่ในสหรัฐฯ

ในทางตรงกันข้าม Comscore รายงานผู้ใช้ที่ไม่ซ้ำ 680,900 รายจากสหรัฐอเมริกา ดังนั้น GA จึงแสดงมากขึ้น 30.2%

Comscore ได้สร้างธุรกิจของพวกเขาเพื่อพยายามให้มีความถูกต้องในขณะที่ GA เป็นวิธีการติดตามและเพิ่มประสิทธิภาพไซต์ที่ใช้ AdWords และ AdSense เป็นหลัก Comscore มีกลุ่มบุคคลที่พวกเขาใช้เพื่อประเมินปริมาณการใช้งานและพวกเขาใช้กลุ่มนั้นเพื่อกำหนดจำนวนคุกกี้โดยเฉลี่ยต่อคน เมื่อมีผู้ใช้อุปกรณ์มือถือมากขึ้น (การใช้มือถือของเราคือ 15%) ทำให้รู้สึกว่าคุกกี้ที่ไม่ซ้ำใครเกินจำนวนคนที่ไม่ซ้ำ


"อัตราส่วนของคุกกี้ต่อผู้เข้าชมที่ไม่ซ้ำกันมักจะอยู่ระหว่าง 1.3 และ 1.7 สำหรับไซต์ที่มีผู้เข้าชมมากกว่าล้านครั้ง" นั่นเป็นตัวเลขที่ตีพิมพ์โดย Comscore หรือไม่?
Ciaran

นี่เป็นสิ่งที่ถูกต้องอย่างน่าประหลาดใจสำหรับเรา ฉันรันUserSessionสถิติตารางในบางไซต์และมีช่วงตั้งแต่ 2.0 (Stack Overflow) ถึง 1.46 (webapps.se) โดยมีทุกอย่างอยู่ระหว่างนั้น 1.6 ดูเหมือนจะเป็นค่าเริ่มต้นที่ดีมากสำหรับไซต์ที่ใช้เทคโนโลยีเป็นศูนย์กลาง
Jeff Atwood

4

นี่คือการศึกษาล่าสุด (4 พฤษภาคม 2011 - เมื่อวานนี้เมื่อฉันเขียนบทความนี้) จาก MediaMind ด้วย "ตัวคูณอัตราเงินเฟ้อคุกกี้" สำหรับตลาดต่าง ๆ :

อัตราเงินเฟ้อที่คำนวณได้ของพวกเขาอยู่ระหว่าง 2.2 สำหรับเยอรมนีถึง 3.0 สำหรับสหรัฐอเมริกา


นี่เป็นสิ่งที่ยอดเยี่ยม - เป็นประเภทอ้างอิงที่ฉันต้องการ
Jeff Atwood

2

อาจเป็นไปได้ว่าจำนวนผู้เข้าชม GA ของคุณสูงเกินจริงกว่าเว็บไซต์ปกติเนื่องจากมีผู้ชมมากกว่า ตัวอย่างเช่นโปรแกรมเมอร์ผู้พัฒนาเว็บโดยเฉพาะมีแนวโน้มที่จะใช้ช่วงของเบราว์เซอร์และทำให้เพิ่มจำนวนคุกกี้

สำหรับคำถามที่ 1 ฉันเดาว่าเช่นเดียวกับตัวชี้วัดหลาย ๆ ข้อควรใช้ข้อมูลจากเว็บไซต์ของคุณเองแทนที่จะมองหามาตรฐานระดับโลกเนื่องจากการรวมกลุ่มอาจทำให้เข้าใจผิด วิธีหนึ่งในการรับคุกกี้เพื่อนับจำนวนผู้เข้าชมจริงอาจเป็นการนับจำนวนคุกกี้ที่คุณเห็นจากผู้ใช้ที่ลงทะเบียนแต่ละรายจากนั้นจึงได้รับหมายเลขจากนั้น

สำหรับหมายเลข 2 ในทางทฤษฎีวิธีที่ดีที่สุดในการนับจำนวนผู้เข้าชมจริงคือบังคับให้ทุกคนลงทะเบียนบัญชี เห็นได้ชัดว่าไม่ใช่ความคิดที่ดีดังนั้นคุณสามารถดูการทำให้เป็นมาตรฐานได้ ตัวอย่างเช่นคุณสามารถใช้คุกกี้เฉลี่ยสำหรับการวัดผู้ใช้ที่ฉันแนะนำด้านบนและใช้กับหมายเลขผู้เข้าชมที่ GA รายงาน


นี่คือจุดที่ดี ใน Stack Overflow ปัจจุบันเรามี 531,484 เซสชันซึ่ง 261,547 เซสชันชี้ไปที่ผู้ใช้ที่ไม่ซ้ำกันดังนั้นโดยทั่วไปแล้วจะมีคุกกี้ 2 คุกกี้ต่อผู้ใช้ 1 คน
Jeff Atwood

-1

ฉันคิดว่า IP นั้นไว้ใจได้ ... เมื่อฉันสร้างระบบสถิติเช่น GA กับ python ฉันใช้วิธีบางอย่างเช่นนี้

  • ส่งคุกกี้ไปยังเบราว์เซอร์และรับข้อมูลตัวแทนทั้งหมดไปยังฐานข้อมูล
  • วิธีที่ง่ายถ้าการเข้าชมใหม่มีคุกกี้ไม่ใช่การเยี่ยมชมใหม่ดังนั้นฉันจึงบันทึกเป็นไม่ใช่การเข้าชมใหม่ (เช่นฉันได้กำหนดวันที่และเวลาหน่วงสำหรับการค้นหาการเข้าชมใหม่หากผู้ใช้เยี่ยมชมไซต์ซ้ำหลังจาก 2 ชั่วโมง)
  • บันทึก IP ของผู้ใช้และรหัสบางส่วนสำหรับผู้ใช้นี้และ IP และคุกกี้ (บันทึกในคุกกี้ด้วย)
  • ผู้ใช้ใหม่มาและไม่มีคุกกี้ใด ๆ ... นี่เป็น IP ใหม่หรือไม่ ใช่? ตกลงผู้ใช้ใหม่เพียงหยิบตัวแทนผู้ใช้และ IP / ไม่ ผู้ใช้รายนี้มากี่ครั้ง เกินขีด จำกัด ? ไม่ใช่การเยี่ยมชมใหม่จริงๆไม่มากไปกว่าตัวแทนผู้ใช้นี้ ตกลงนี่คือใหม่ ... : D

วิธีนี้มีข้อผิดพลาด แต่ไม่เลวและใกล้ถึงข้อมูลที่ถูกต้อง ... (ขึ้นอยู่กับเวลาการหน่วงเวลาในการค้นหาผู้ใช้ใหม่ (ล่าช้าระหว่างการเยี่ยมชม 2 ครั้ง) และลองเวลาสำหรับผู้ใช้ที่ไม่ได้คุกกี้)


5
วิธีนี้จะจัดการตัวอย่างเช่น บริษัท ที่มีนักพัฒนาที่แตกต่างกันมากมายเข้าถึง StackOverflow จากด้านหลัง NAT พวกเขาทั้งหมดจะถูกนับเป็นผู้เข้าชมหนึ่งคนหรือไม่
Svish

3
ด้าน IP ของข้อบกพร่องนี้จริงๆ ที่อยู่ IP ไม่ใช่ตัวระบุที่ไม่ซ้ำ
Yahel

มีเวลาลองสิ่งนี้ ... เราตรวจสอบตัวแทนและสิ่งอื่น ๆ และเราสามารถเพิ่มหนึ่ง IP ได้มากกว่า 100 ครั้ง ... วิธีที่แนะนำในการค้นหาผู้ใช้จริงหลัง NAT
Mohammad Efazati
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.