สถิติพื้นฐานที่ดีที่จะใช้สำหรับข้อมูลอันดับคืออะไร


67

ฉันมีข้อมูลลำดับที่ได้จากคำถามสำรวจ ในกรณีของฉันพวกเขาคือการตอบสนองสไตล์ Likert (ไม่เห็นด้วยอย่างยิ่ง - ไม่เห็นด้วย - เป็นกลาง - เห็นด้วย - เห็นด้วยอย่างยิ่ง) ในข้อมูลของฉันพวกเขาถูกเข้ารหัสเป็น 1-5

ฉันไม่คิดว่าจะมีความหมายมากที่นี่ดังนั้นสถิติสรุปแบบพื้นฐานใดที่ถือว่ามีประโยชน์


2
ตัวเลือกทั่วไป ได้แก่ - ค่ามัธยฐาน, โหมด, สัดส่วนหรือสัดส่วนสะสมในแต่ละกลุ่ม
Glen_b

คำตอบ:


29

ตารางความถี่เป็นจุดเริ่มต้นที่ดี คุณสามารถทำการนับและความถี่สัมพัทธ์สำหรับแต่ละระดับ นอกจากนี้จำนวนรวมและจำนวนของค่าที่หายไปอาจถูกนำมาใช้

คุณยังสามารถใช้ตารางฉุกเฉินเพื่อเปรียบเทียบตัวแปรสองตัวพร้อมกัน สามารถแสดงโดยใช้พล็อตโมเสคได้เช่นกัน


32

ฉันจะโต้แย้งจากมุมมองที่ประยุกต์ว่าค่าเฉลี่ยมักจะเป็นทางเลือกที่ดีที่สุดสำหรับการสรุปแนวโน้มกลางของรายการ Likert โดยเฉพาะฉันคิดถึงบริบทเช่นแบบสำรวจความพึงพอใจของนักเรียนมาตรวัดการวิจัยตลาดแบบสำรวจความคิดเห็นของพนักงานรายการทดสอบบุคลิกภาพและรายการแบบสำรวจสังคมศาสตร์หลายรายการ

ในบริบทดังกล่าวผู้บริโภคงานวิจัยมักต้องการคำตอบสำหรับคำถามเช่น:

  • ข้อความใดบ้างที่มีข้อตกลงมากกว่าหรือน้อยกว่าเมื่อเทียบกับข้ออื่น?
  • กลุ่มใดบ้างที่เห็นด้วยมากขึ้นหรือน้อยลงด้วยข้อความที่กำหนด?
  • เมื่อเวลาผ่านไปข้อตกลงได้ขึ้นหรือลง?

สำหรับวัตถุประสงค์เหล่านี้หมายความว่ามีประโยชน์หลายประการ:

1. ค่าเฉลี่ยง่ายต่อการคำนวณ:

  • มันง่ายที่จะเห็นความสัมพันธ์ระหว่างข้อมูลดิบและค่าเฉลี่ย
  • มันง่ายในการคำนวณอย่างจริงจัง ดังนั้นค่าเฉลี่ยสามารถฝังลงในระบบการรายงานได้อย่างง่ายดาย
  • นอกจากนี้ยังอำนวยความสะดวกในการเปรียบเทียบข้ามบริบทและการตั้งค่า

2. ค่าเฉลี่ยนั้นค่อนข้างเข้าใจและเข้าใจง่าย:

  • ค่าเฉลี่ยมักใช้เพื่อรายงานแนวโน้มกลางของรายการ Likert ดังนั้นผู้บริโภคของการวิจัยมีแนวโน้มที่จะเข้าใจค่าเฉลี่ย (และเชื่อถือได้และดำเนินการกับมัน)
  • นักวิจัยบางคนชอบตัวเลือกที่ง่ายกว่าในการรายงานอัตราร้อยละของตัวอย่างที่ตอบ 4 หรือ 5 นั่นคือมันมีการตีความค่อนข้างง่ายของ "ข้อตกลงเปอร์เซ็นต์" ในสาระสำคัญนี่เป็นเพียงรูปแบบทางเลือกของค่าเฉลี่ยด้วย0, 0, 0, 1, 1การเข้ารหัส
  • เมื่อเวลาผ่านไปผู้บริโภคในการวิจัยก็สร้างกรอบอ้างอิง ตัวอย่างเช่นเมื่อคุณเปรียบเทียบประสิทธิภาพการสอนของคุณในแต่ละปีหรือในทุกวิชาคุณจะสร้างความรู้สึกที่เหมาะสมยิ่งขึ้นว่าค่าเฉลี่ย 3.7, 3.9, หรือ 4.1 หมายถึงอะไร

3. ค่าเฉลี่ยคือตัวเลขเดียว:

  • หมายเลขเดียวมีค่ามากโดยเฉพาะเมื่อคุณต้องการอ้างสิทธิ์เช่น "นักเรียนพอใจกับหัวเรื่อง X มากกว่าหัวเรื่อง Y"
  • ฉันยังพบสังเกตุว่าตัวเลขหนึ่ง ๆ เป็นข้อมูลหลักที่น่าสนใจในรายการ Likert ค่าเบี่ยงเบนมาตรฐานมีแนวโน้มที่จะเกี่ยวข้องกับขอบเขตที่ค่าเฉลี่ยอยู่ใกล้กับคะแนนกลาง (เช่น 3.0) แน่นอนสังเกตุว่าสิ่งนี้อาจไม่ได้ใช้ในบริบทของคุณ ตัวอย่างเช่นฉันอ่านบางแห่งว่าเมื่อเรตติ้งของ You Tube มีระบบดาวมันมีเรตติ้งต่ำสุดหรือสูงสุดจำนวนมาก ด้วยเหตุนี้จึงเป็นสิ่งสำคัญในการตรวจสอบความถี่หมวดหมู่

4. มันไม่ได้สร้างความแตกต่างมากนัก

  • แม้ว่าฉันจะไม่ได้ทดสอบอย่างเป็นทางการ แต่ฉันก็ตั้งสมมติฐานว่าเพื่อวัตถุประสงค์ในการเปรียบเทียบการจัดอันดับแนวโน้มกลางของรายการหรือกลุ่มของผู้เข้าร่วมหรือเมื่อเวลาผ่านไปตัวเลือกการปรับขนาดที่เหมาะสมสำหรับการสร้างค่าเฉลี่ยนั้น

4
โพสต์ดี! คุณมีความคิดใดบ้างเกี่ยวกับวัฒนธรรม / ประเทศที่แตกต่างกันอาจใช้เครื่องชั่ง likert ซึ่งจะส่งผลกระทบอย่างมากต่อผลลัพธ์เหล่านี้หรือไม่?
ไล่

@chase มีงานวิจัยเกี่ยวกับเรื่องนี้ แต่มันก็ไม่นานแล้วตั้งแต่ฉันได้ดูมัน นี่คือตัวอย่างการค้นหาใน Google scholar.google.com.au/…
Jeromy Anglim

ฉันเห็นด้วยกับเหตุผลของ Mr. Jeromy Anglim เกี่ยวกับการใช้ค่าเฉลี่ย (เช่นค่าเฉลี่ยถ่วงน้ำหนักที่แน่นอน) เนื่องจากการตีความที่มีความน่าเชื่อถือมากที่สุดโดยไม่ลำเอียงมากขึ้นของตัวแปรเชิงลำดับที่ได้รับคำสั่งเช่นการใช้มาตราส่วน Likert ที่แต่ละจุดข้อมูล ค่าเฉลี่ยสุดท้าย


28

สำหรับบทสรุปพื้นฐานฉันยอมรับว่าการรายงานตารางความถี่และตัวบ่งชี้บางอย่างเกี่ยวกับแนวโน้มกลางนั้นใช้ได้ สำหรับการอนุมานบทความล่าสุดที่ตีพิมพ์ใน PARE กล่าวถึง T- กับ MWW-test ห้าจุด Likert ข่าว: T Test เมื่อเทียบกับ Mann-Whitney-Wilcoxon

สำหรับการรักษาที่ละเอียดยิ่งขึ้นฉันขอแนะนำให้อ่านความคิดเห็นของ Agresti เกี่ยวกับตัวแปรเด็ดขาดที่ได้รับคำสั่ง:

Liu, Y และ Agresti, A (2005) การวิเคราะห์ข้อมูลเด็ดขาดสั่งซื้อ: ภาพรวมและการสำรวจของการพัฒนาที่ผ่านมา Sociedad de Estadística e Investigación Operativa Test , 14 (1), 1-73

มันขยายเกินกว่าปกติสถิติเช่นแบบจำลองตามเกณฑ์ (เช่นสัดส่วนอัตราต่อรองสัดส่วน) และมีมูลค่าการอ่านแทนหนังสือCDA Agresti

ด้านล่างฉันแสดงภาพสามวิธีที่แตกต่างกันในการดูแลไอเท็ม Likert; จากบนลงล่างมุมมอง "ความถี่" (ระบุ), มุมมอง "ตัวเลข" และมุมมอง "น่าจะเป็น" ( โมเดลเครดิตบางส่วน ):

ข้อความแสดงแทน

ข้อมูลมาจากScienceข้อมูลในltmแพ็คเกจซึ่งเป็นรายการที่เกี่ยวข้องกับเทคโนโลยี ("เทคโนโลยีใหม่ไม่ได้ขึ้นอยู่กับการวิจัยทางวิทยาศาสตร์ขั้นพื้นฐาน" โดยมีการตอบสนอง "ไม่เห็นด้วยอย่างยิ่ง" ถึง "เห็นด้วยอย่างยิ่ง" ในระดับสี่จุด)


14

การปฏิบัติทั่วไปคือการใช้สถิติที่ไม่อิงพารามิเตอร์ผลรวมอันดับและหมายถึงอันดับเพื่ออธิบายข้อมูลลำดับ

นี่คือวิธีการทำงาน:

ผลรวมอันดับ

  • กำหนดอันดับให้กับสมาชิกแต่ละคนในแต่ละกลุ่ม;

  • เช่นสมมติว่าคุณกำลังมองหาเป้าหมายสำหรับผู้เล่นแต่ละคนในสองทีมฟุตบอลที่เป็นปฏิปักษ์จากนั้นจัดอันดับสมาชิกแต่ละคนใน ทั้งสองทีมจากคนแรกถึงทีมสุดท้าย

  • คำนวณผลรวมอันดับโดยเพิ่มอันดับต่อกลุ่ม ;

  • ขนาดของผลรวมอันดับจะบอกคุณว่าแต่ละกลุ่มมีความใกล้เคียงกันมากเพียงใด

หมายถึงอันดับ

M / R เป็นสถิติที่ซับซ้อนกว่า R / S เพราะมันชดเชยขนาดที่ไม่เท่ากันในกลุ่มที่คุณกำลังเปรียบเทียบ ดังนั้นนอกเหนือจากขั้นตอนข้างต้นคุณหารผลรวมด้วยจำนวนสมาชิกในกลุ่ม

เมื่อคุณมีสถิติทั้งสองนี้คุณสามารถทดสอบผลรวมอันดับเพื่อดูว่าความแตกต่างระหว่างทั้งสองกลุ่มนั้นมีนัยสำคัญทางสถิติหรือไม่ (ฉันเชื่อว่าเป็นที่รู้จักกันในชื่อการทดสอบผลรวมอันดับของ Wilcoxonซึ่งสามารถใช้แทนกันได้ เทียบเท่ากับการทดสอบ Mann-Whitney U)

R ฟังก์ชั่นสำหรับสถิติเหล่านี้ (สิ่งที่ฉันรู้เกี่ยวกับ)

wilcox.testในการติดตั้ง R มาตรฐาน

meanranksในแพ็คเกจcranks


3

ตามบทคัดย่อบทความนี้อาจเป็นประโยชน์สำหรับการเปรียบเทียบตัวแปรหลายตัวที่มีขนาด Likert มันเปรียบเทียบการทดสอบเปรียบเทียบหลายแบบที่ไม่ใช่พารามิเตอร์สองแบบ: แบบทดสอบอิงตามอันดับและแบบทดสอบอิงตาม Chacko มันรวมถึงแบบจำลอง


ในปัจจุบันนี้ดูเหมือนว่าจะเป็นความคิดเห็น @PeterFlom แม้ว่าไลบรารี่ดิจิทัลของ ACM นั้นอาจมีความอ่อนไหวต่อลิงค์เน่าน้อยกว่า แต่คุณคิดว่าจะพูดอะไรบางอย่างเกี่ยวกับบทความหรืออาจจะเป็นข้อมูลที่เป็นประโยชน์ที่มันมีให้?
gung - Reinstate Monica

2
สวัสดี @ gung ฉันไม่แน่ใจว่าจะใส่ความคิดเห็นในหัวข้อยาวนี้ ฉันเพิ่มการอ้างอิงที่นี่ตั้งแต่คำถามที่โพสต์ในวันนี้ถูกปิดและบทความนี้ดูเหมือนว่ามีประโยชน์ (และครอบคลุมประเด็นที่ฉันไม่ได้เห็นที่อื่น)
Peter Flom

2

ฉันมักจะชอบใช้พล็อตโมเสค คุณสามารถสร้างพวกเขาโดย incoorporating covariates อื่น ๆ ที่น่าสนใจ (เช่น: เพศ, ปัจจัยแบ่งชั้น ฯลฯ )


2

ฉันเห็นด้วยกับการประเมินของ Jeromy Anglim โปรดจำไว้ว่าการตอบสนองของ Likert นั้นเป็นค่าประมาณ - คุณไม่ได้ใช้ไม้บรรทัดที่เชื่อถือได้อย่างสมบูรณ์ในการวัดวัตถุทางกายภาพที่มีขนาดที่เสถียร ค่าเฉลี่ยคือการวัดที่มีประสิทธิภาพเมื่อใช้ขนาดตัวอย่างที่เหมาะสม

ในธุรกิจและการวิจัยและพัฒนาผลิตภัณฑ์ค่าเฉลี่ยเป็นสถิติที่ใช้กันโดยทั่วไปมากที่สุดกับเครื่องชั่ง Likert เมื่อใช้เครื่องชั่ง Likert ฉันมักจะเลือกการวัดที่เหมาะกับคำถามการวิจัย ตัวอย่างเช่นหากคุณกำลังพูดถึง "การตั้งค่า" หรือ "ทัศนคติ" คุณสามารถใช้ตัวบ่งชี้ที่อิง Likert หลายตัวโดยแต่ละตัวบ่งชี้จะให้ข้อมูลเชิงลึกที่แตกต่างกันเล็กน้อย

ในการประเมินคำถาม "คนในเซ็กเมนต์จะตอบสนองต่อการเสนอบริการอย่างไร" ฉันอาจดู (1) ค่าเฉลี่ยเลขคณิต (2) ค่ามัธยฐานที่แน่นอน (3) เปอร์เซ็นต์การตอบสนองที่ดีที่สุด (กล่องด้านบน), (4)% สองอันดับแรกอัตราส่วน (5) ของกล่องสองอันดับแรกไปจนถึงสองกล่องด้านล่าง (6) เปอร์เซ็นต์ภายในกล่องระดับกลาง ... ฯลฯ แต่ละการวัดบอกส่วนของเรื่องราวที่แตกต่างกัน ในโครงการที่สำคัญมากฉันใช้ตัวบ่งชี้ Likert หลายตัว ฉันจะใช้ตัวบ่งชี้หลายตัวพร้อมกับตัวอย่างเล็ก ๆ และเมื่อ cross tab เฉพาะมีโครงสร้าง "น่าสนใจ" หรือดูข้อมูลที่หลากหลาย Ahhh ... ศิลปะแห่งสถิติiX


1

"คะแนนกล่อง" มักใช้เพื่อสรุปข้อมูลอันดับโดยเฉพาะอย่างยิ่งเมื่อมันมาพร้อมกับจุดยึดคำพูดที่มีความหมาย กล่าวอีกนัยหนึ่งคุณอาจรายงาน "กล่องบนสุด 2" เปอร์เซ็นต์ที่เลือก "ตกลง" หรือ "เห็นด้วยอย่างยิ่ง"

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.