ประโยชน์ของการใช้ค่าเฉลี่ยในการสรุปแนวโน้มกลางของการจัดอันดับ 5 คะแนน
ตามที่ @ gung กล่าวว่าฉันคิดว่ามักจะมีเหตุผลที่ดีมากสำหรับการใช้ค่าเฉลี่ยของรายการห้าจุดเป็นดัชนีแนวโน้มกลาง ผมมีอยู่แล้วที่ระบุไว้ที่นี่ด้วยเหตุผลเหล่านี้
ในการถอดความ:
- ค่าเฉลี่ยนั้นง่ายต่อการคำนวณ
- ค่าเฉลี่ยนั้นเข้าใจง่ายและเข้าใจได้ดี
- ค่าเฉลี่ยคือตัวเลขเดียว
- ดัชนีอื่น ๆ มักจะให้ลำดับการเรียงลำดับของวัตถุที่คล้ายกัน
ทำไมค่าเฉลี่ยถึงดีสำหรับ Amazon
คิดเกี่ยวกับเป้าหมายของอเมซอนในการรายงานค่าเฉลี่ย พวกเขาอาจจะเล็งไปที่
- ให้คะแนนที่เข้าใจง่ายสำหรับรายการ
- ให้แน่ใจว่าผู้ใช้ยอมรับระบบการจัดอันดับ
- ให้แน่ใจว่าผู้คนเข้าใจความหมายของการจัดอันดับเพื่อให้พวกเขาสามารถใช้มันอย่างเหมาะสมเพื่อแจ้งการตัดสินใจซื้อ
Amazon จัดเรียงค่าเฉลี่ยของการปัดเศษการนับความถี่สำหรับแต่ละตัวเลือกการจัดอันดับและขนาดตัวอย่าง (เช่นจำนวนการจัดอันดับ) ข้อมูลนี้น่าจะเพียงพอสำหรับคนส่วนใหญ่ที่จะชื่นชมทั้งความเชื่อมั่นทั่วไปเกี่ยวกับรายการและความเชื่อมั่นในการจัดอันดับ (เช่น 4.5 กับ 20 อันดับมีแนวโน้มที่จะมีความแม่นยำมากกว่า 4.5 กับ 2 คะแนนรายการที่มี 10 5 - การจัดอันดับดาวและการให้คะแนนระดับ 1 ดาวที่ไม่มีความเห็นอาจยังคงเป็นรายการที่ดี)
คุณสามารถเห็นค่าเฉลี่ยเป็นตัวเลือกที่เป็นประชาธิปไตย การเลือกตั้งจำนวนมากนั้นขึ้นอยู่กับว่าผู้สมัครคนใดจะได้ค่าเฉลี่ยสูงสุดในระดับสองจุด ในทำนองเดียวกันหากคุณโต้แย้งว่าแต่ละคนที่ส่งความเห็นได้รับการลงคะแนนคุณจะเห็นค่าเฉลี่ยเป็นแบบฟอร์มที่ให้น้ำหนักการโหวตของแต่ละคนอย่างเท่าเทียมกัน
ความแตกต่างของขนาดใช้เป็นปัญหาหรือไม่
มีความหลากหลายของอคติการจัดอันดับที่เป็นที่รู้จักในวรรณคดีจิตวิทยา (สำหรับการตรวจสอบดู Saal et al 1980) เช่นอคติแนวโน้มกลาง, อคติผ่อนปรน, อคติความเข้มงวด นอกจากนี้ผู้ประเมินบางคนจะมีความอิสระมากกว่าและบางคนจะเชื่อถือได้มากกว่า บางคนอาจมีระบบให้คำวิจารณ์เชิงบวกหรือปลอมปลอม สิ่งนี้จะสร้างข้อผิดพลาดหลายรูปแบบเมื่อพยายามคำนวณคะแนนเฉลี่ยที่แท้จริงสำหรับรายการ
อย่างไรก็ตามหากคุณต้องสุ่มตัวอย่างประชากรประชากรความเอนเอียงดังกล่าวจะถูกยกเลิกและขนาดของกลุ่มตัวอย่างที่เพียงพอคุณจะยังคงได้รับค่าเฉลี่ยที่แท้จริง
แน่นอนว่าคุณไม่ได้รับตัวอย่างสุ่มจาก Amazon และมีความเสี่ยงที่ชุดผู้ประเมินที่คุณได้รับสำหรับรายการนั้นจะลำเอียงอย่างเป็นระบบเพื่อผ่อนปรนหรือเข้มงวดมากขึ้นเรื่อย ๆ ที่กล่าวว่าฉันคิดว่าผู้ใช้ของ Amazon จะขอบคุณผู้ใช้ที่ให้คะแนนมาจากตัวอย่างที่ไม่สมบูรณ์ ฉันคิดว่ามันค่อนข้างเป็นไปได้ด้วยขนาดตัวอย่างที่สมเหตุสมผลซึ่งในหลายกรณีความแตกต่างของการตอบสนองส่วนใหญ่จะเริ่มหายไป
ความก้าวหน้าที่เป็นไปได้เกินกว่าค่าเฉลี่ย
ในแง่ของการปรับปรุงความถูกต้องของการจัดอันดับฉันจะไม่ท้าทายแนวคิดทั่วไปของค่าเฉลี่ย แต่ฉันคิดว่ามีวิธีอื่นในการประมาณค่าการจัดอันดับค่าเฉลี่ยของประชากรจริงสำหรับรายการ (เช่นค่าเฉลี่ยที่จะได้รับ เป็นตัวแทนตัวอย่างขนาดใหญ่ขอให้คะแนนรายการ)
- ผู้ให้น้ำหนักตามความน่าเชื่อถือ
- ใช้ระบบการจัดอันดับแบบเบย์ที่ประเมินการจัดอันดับเฉลี่ยเป็นผลรวมถ่วงน้ำหนักของการจัดอันดับเฉลี่ยสำหรับรายการทั้งหมดและค่าเฉลี่ยจากรายการเฉพาะและเพิ่มการให้น้ำหนักสำหรับรายการเฉพาะเมื่อจำนวนการจัดอันดับเพิ่มขึ้น
- ปรับข้อมูลผู้ประเมินตามแนวโน้มการจัดอันดับทั่วไปในรายการต่างๆ (เช่น 5 จากคนที่ให้ 3s โดยทั่วไปจะมีค่ามากกว่าคนที่ให้ 4 วินาที)
ดังนั้นหากความแม่นยำในการให้คะแนนเป็นเป้าหมายหลักของอเมซอนฉันคิดว่ามันควรจะพยายามเพิ่มจำนวนการให้คะแนนต่อรายการและใช้กลยุทธ์ข้างต้นบางอย่าง วิธีการดังกล่าวอาจเกี่ยวข้องโดยเฉพาะอย่างยิ่งเมื่อสร้างการจัดอันดับ "ดีที่สุด" อย่างไรก็ตามสำหรับการให้คะแนนที่ต่ำต้อยบนหน้าเว็บมันอาจเป็นไปได้ว่าค่าเฉลี่ยตัวอย่างนั้นดีขึ้นตามเป้าหมายของความเรียบง่ายและโปร่งใส
อ้างอิง
- Saal, FE, Downey, RG และ Lahey, MA (1980) การให้คะแนนการให้คะแนน: การประเมินคุณภาพของข้อมูลการจัดอันดับ Psychometric Bulletin, 88, 413