นัยสำคัญทางสถิติของการเปลี่ยนแปลงเมื่อเวลาผ่านไปในรายการ Likert 5 จุด


9

บริบท:

ฉันมีชุดข้อมูลสองชุดจากแบบสอบถามเดียวกันที่ใช้งานเกินสองปี คำถามแต่ละข้อวัดโดยใช้สเกล 5-Likert

Q1: รูปแบบการเข้ารหัส

ในขณะนี้ฉันได้เขียนคำตอบของฉันในช่วง [0, 1] โดยมี 0 ความหมาย "คำตอบเชิงลบมากที่สุด", 1 ความหมาย "คำตอบเชิงบวกมากที่สุด" และคำตอบอื่น ๆ เว้นระยะเท่ากัน

  • รูปแบบการเข้ารหัส "ดีที่สุด" คืออะไรที่จะใช้สำหรับมาตราส่วน Likert

ฉันรู้ว่านี่อาจเป็นเรื่องส่วนตัว

Q2: ความสำคัญตลอดหลายปีที่ผ่านมา

  • วิธีที่ดีที่สุดในการพิจารณาว่ามีการเปลี่ยนแปลงอย่างมีนัยสำคัญทางสถิติในช่วงสองปีคืออะไร?

นั่นคือการดูผลลัพธ์สำหรับคำถามที่ 1 สำหรับแต่ละปีฉันจะบอกได้อย่างไรว่าความแตกต่างระหว่างผลลัพธ์ 2011 กับผลลัพธ์ 2010 นั้นมีนัยสำคัญทางสถิติหรือไม่ ฉันได้รับความทรงจำที่คลุมเครือเกี่ยวกับการใช้แบบทดสอบ t ของนักเรียนที่นี่ แต่ฉันไม่แน่ใจ

คำตอบ:


7

1. รูปแบบการเข้ารหัส

ในแง่ของการประเมินนัยสำคัญทางสถิติโดยใช้ t-test มันเป็นระยะทางสัมพัทธ์ระหว่างคะแนนสเกลที่สำคัญ ดังนั้น (0, 0.25, 0.5, 0.75, 1) จึงเท่ากับ (1, 2, 3, 4, 5) จากประสบการณ์ของฉันแผนการเข้ารหัสระยะทางที่เท่ากันเช่นที่กล่าวถึงก่อนหน้านี้เป็นเรื่องธรรมดาที่สุดและดูเหมือนสมเหตุสมผลสำหรับรายการ Likert หากคุณสำรวจการปรับสเกลที่เหมาะสมที่สุดคุณอาจสามารถรับแผนการเข้ารหัสทางเลือกอื่นได้

2. การทดสอบทางสถิติ

คำถามของวิธีการประเมินความแตกต่างของกลุ่มในรายการ Likert ที่ได้รับการตอบแล้วที่นี่

ปัญหาแรกคือคุณสามารถเชื่อมโยงการสังเกตข้ามจุดสองจุดได้หรือไม่ ดูเหมือนคุณจะมีตัวอย่างที่แตกต่างกัน สิ่งนี้นำไปสู่ตัวเลือกต่างๆ:

  • กลุ่มอิสระ t-test : นี่เป็นตัวเลือกที่ง่าย มันยังทำการทดสอบความแตกต่างในวิธีการของกลุ่ม ครูสอนจะยืนยันว่าค่า p-value อาจไม่ถูกต้องทั้งหมด อย่างไรก็ตามอาจขึ้นอยู่กับวัตถุประสงค์ของคุณ
  • การทดสอบความแตกต่างแบบ Bootstrapped ในกลุ่มหมายถึง : หากคุณยังต้องการทดสอบความแตกต่างระหว่างความหมายของกลุ่ม แต่ไม่สะดวกกับลักษณะที่ไม่ต่อเนื่องของตัวแปรตามคุณสามารถใช้ bootstrap เพื่อสร้างช่วงความมั่นใจซึ่งคุณสามารถอ้างถึงการเปลี่ยนแปลงในกลุ่ม .
  • การทดสอบ Mann-Whitney U (ในการทดสอบอื่น ๆ ที่ไม่ใช่พารามิเตอร์): การทดสอบดังกล่าวไม่ถือว่าเป็นเรื่องปกติ แต่ก็ยังทดสอบสมมติฐานที่แตกต่างกัน

ดังนั้นโดยสังเขปคุณจะเห็นว่าไม่มีอะไรผิดปกติกับสิ่งที่ฉันเสนอ (การเข้ารหัสระยะทางเท่ากันการทดสอบนัยสำคัญการทดสอบ t-test) นอกเหนือจากมีตัวเลือกอื่น ๆ ที่อาจแม่นยำยิ่งขึ้น?
Mac

@Mac ในความคิดของฉันการมองจากมุมมองที่ประยุกต์ใช้มากขึ้นมันเป็นวิธีที่ง่ายเข้าใจง่ายง่ายต่อการสื่อสารและโดยทั่วไปมีเหตุผล อย่างไรก็ตามบ่อยครั้งที่การพิจารณาวัดสิ่งที่น่าสนใจโดยใช้เครื่องชั่งแทนที่จะเป็นแต่ละรายการ
Jeromy Anglim

ตกลง อย่างไรก็ตามฉันเชื่อในสิ่งที่ฉันต้องการสิ่งนี้จะทำ ขอบคุณมาก!
Mac

เพียงเพื่อให้ทราบว่าการทดสอบ t สามารถค่อนข้างอ่อนไหวต่อความแตกต่างในความแปรปรวนดังนั้นอาจจะเป็นสิ่งที่ต้องตรวจสอบก่อนที่คุณจะตัดสินใจขั้นสุดท้าย
richiemorrisroe

@Mac / cc @richiemorrisroe ในทัศนะของฉันนอกเหนือจากข้อสันนิษฐานเกี่ยวกับความรักร่วมเพศ (ซึ่งค่อนข้างหลีกเลี่ยงกับการทดสอบของ Welch) ปัญหาส่วนใหญ่เกิดจากการแจกแจงการตอบสนองแบบไม่สมมาตร (เพดานหรือพื้น) ซึ่งมักเกิดขึ้นเมื่อใช้รายการ Likert
chl

3

การทดสอบ Wilcoxon Ranksum หรือที่รู้จักกันในชื่อ Mann-Whitney เป็นวิธีการในกรณีของข้อมูลอันดับ วิธีการบูตสแตรปยังเป็นสิ่งที่สวยงามแม้ว่าจะไม่ใช่วิธี "คลาสสิค" วิธี Bootstrapping อาจมีประโยชน์ในกรณีที่คุณตั้งเป้าหมายอย่างอื่นเช่นการวิเคราะห์ปัจจัย ในกรณีของการวิเคราะห์การถดถอยคุณอาจเลือกสั่ง probit หรือ logit สั่งเป็นสเปครุ่น

BTW: หากเครื่องชั่งของคุณมีช่วงที่ใหญ่กว่า (> 10 ค่าต่อตัวแปร) คุณอาจใช้ผลลัพธ์เป็นตัวแปรเมตริกซึ่งทำให้การทดสอบ t เป็นทางเลือกที่ปลอดภัย ได้รับคำแนะนำว่านี่เป็นสิ่งสกปรกเล็กน้อยและอาจถูกพิจารณาว่าเป็นงานของบางคน

สเตฟาน


1
คุณสามารถขยายวิธีการ bootstrap ให้แนวทางที่น่าสนใจสำหรับการวิเคราะห์ปัจจัยได้อย่างไร
chl

ฉันสนใจที่จะเรียนรู้เพิ่มเติมว่าทำไมการทดสอบ Mann-Whitney ถึงได้รับการสนับสนุนแบบทดสอบ t ที่นี่
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.