ตรวจสอบความถูกต้องของแบบสอบถาม


12

ฉันกำลังออกแบบแบบสอบถามสำหรับวิทยานิพนธ์ของฉัน ฉันอยู่ระหว่างการตรวจสอบความถูกต้องของแบบสอบถามที่ฉันใช้การทดสอบอัลฟาของครอนบาคกับกลุ่มตัวอย่างเริ่มต้น คำตอบของแบบสอบถามอยู่ในระดับ Likert; ใครสามารถแนะนำการทดสอบเพิ่มเติมใด ๆ ที่จะนำไปใช้เพื่อช่วยทดสอบความถูกต้องของมัน ฉันไม่ใช่ผู้เชี่ยวชาญเกี่ยวกับสถิติดังนั้นความช่วยเหลือใด ๆ จะได้รับการชื่นชม

ฉันได้ทำการวิจัยมาแล้วและดูเหมือนว่าฉันสามารถทำการวิเคราะห์ Rasch ได้หรือไม่มีใครมีเว็บไซต์ซอฟต์แวร์ฟรีที่จะใช้การทดสอบและคำแนะนำนี้หรือไม่

คำตอบ:


22

ฉันจะสมมติว่าแบบสอบถามของคุณถูกพิจารณาว่าเป็นมาตราส่วนหนึ่งมิติ (มิฉะนั้นอัลฟ่าของครอนบาคไม่สมเหตุสมผลมาก) มันคุ้มค่าที่จะทำการวิเคราะห์ปัจจัยเชิงสำรวจเพื่อตรวจสอบสิ่งนั้น นอกจากนี้ยังช่วยให้คุณสามารถดูว่ารายการเกี่ยวข้องกับเครื่องชั่งอย่างไร (เช่นผ่านการบรรทุกสินค้า)

ขั้นตอนพื้นฐานสำหรับการตรวจสอบรายการของคุณและเครื่องชั่งของคุณควรประกอบด้วย:

  • รายงานที่สมบูรณ์เกี่ยวกับสถิติพื้นฐานของรายการ (ช่วงควอไทล์แนวโน้มกลางเพดานและเอฟเฟกต์พื้นถ้ามี)
  • ตรวจสอบความสอดคล้องภายในเช่นเดียวกับที่คุณทำกับอัลฟ่าของคุณ (ดีที่สุดให้ช่วงความมั่นใจ 95% เพราะมันขึ้นอยู่กับตัวอย่าง)
  • อธิบายการวัดสรุปของคุณ (เช่นคะแนนรวมหรือคะแนนเฉลี่ย, คะแนนสเกล aka) ที่มีสถิติปกติ (ฮิสโตแกรม + ความหนาแน่น, ปริมาณ ฯลฯ );
  • ตรวจสอบการตอบสนองสรุปของคุณกับ covariates เฉพาะที่ควรจะเกี่ยวข้องกับโครงสร้างของคุณกำลังประเมิน - นี้เรียกว่าความถูกต้องกลุ่มที่รู้จักกัน;
  • หากเป็นไปได้ให้ตรวจสอบการตอบกลับสรุปของคุณจากเครื่องมือที่ทราบว่ามีเจตนาที่จะวัดสิ่งก่อสร้างเดียวกัน ( ความถูกต้องพร้อมกันหรือคอนเวอร์เจนซ์)

หากเครื่องชั่งของคุณไม่ใช่มิติเดียวขั้นตอนเหล่านี้จะต้องทำสำหรับแต่ละ subscale และคุณสามารถแยกเมทริกซ์สหสัมพันธ์ของปัจจัยของคุณเพื่อประเมินโครงสร้างปัจจัยอันดับสอง (หรือใช้การสร้างแบบจำลองสมการโครงสร้างหรือการวิเคราะห์ปัจจัยยืนยันหรือ สิ่งที่คุณต้องการ) นอกจากนี้คุณยังสามารถประเมินความถูกต้องของคอนเวอร์เจนซ์และการแบ่งแยกโดยใช้มาตราส่วนแบบหลายลักษณะหรือแบบจำลองหลายวิธีหลายลักษณะ (ขึ้นอยู่กับสหสัมพันธ์ระหว่างหน่วยภายในและระหว่างเครื่องชั่ง) หรือ SEM อีกครั้ง

แล้วผมจะบอกว่ารายการที่ทฤษฎีการตอบสนองจะไม่ช่วยเหลือที่มากจนกว่าคุณจะมีความสนใจในการตัดทอนแบบสอบถามของคุณกรองบางรายการที่แสดงให้เห็นการทำงานของรายการค่าหรือใช้การทดสอบของคุณในชนิดของบางการทดสอบการปรับตัวคอมพิวเตอร์

ไม่ว่าในกรณีใด ๆโมเดล Rasch ใช้สำหรับรายการไบนารี สำหรับรายการที่มีคำสั่งหลายคำสั่งรุ่นที่ใช้กันมากที่สุดคือ:

  • รูปแบบการตอบสนองช้า
  • โมเดลเครดิตบางส่วน
  • โมเดลมาตราส่วนการจัดอันดับ

มีเพียงสองอันหลังที่มาจากตระกูล Rasch และพวกเขาใช้สูตรการต่อรองที่อยู่ติดกันโดยมีแนวคิดว่าหัวเรื่องต้อง "ผ่าน" เกณฑ์หลายอย่างเพื่อรับรองหมวดหมู่การตอบกลับที่กำหนด ความแตกต่างระหว่างรุ่นทั้งสองนี้คือ PCM ไม่ได้กำหนดว่าขีด จำกัด จะมีระยะห่างเท่ากันในระดับทีต้า ( ความสามารถหรือตำแหน่งของวัตถุในสเกลลักษณะแฝง) โมเดลการตอบกลับที่ให้คะแนนจะขึ้นอยู่กับสูตรอัตราต่อรองสะสม โปรดทราบว่าโมเดลเหล่านี้ทุกคนคิดว่าสเกลนั้นมีมิติเดียว นั่นคือมีเพียงหนึ่งคุณลักษณะที่แฝงอยู่ มีสมมติฐานเพิ่มเติมเช่นความเป็นอิสระในท้องถิ่น (เช่นความสัมพันธ์ระหว่างการตอบสนองอธิบายโดยการเปลี่ยนแปลงในระดับความสามารถ)

อย่างไรก็ตามคุณจะได้พบกับเอกสารที่สมบูรณ์มากและเบาะแสที่มีประโยชน์ในการใช้วิธีการทางจิตวิทยาในการวิจัยในปริมาณ 20 ของวารสารซอฟแวร์ทางสถิติปริมาณพิเศษ: Psychometrics ใน R โดยทั่วไปส่วนใหญ่แพคเกจที่น่าสนใจ R ที่ผมใช้ในการทำงานในชีวิตประจำวันของฉันคือLTM , ERM , วิญญาณ , psy อื่น ๆ ที่มีการอ้างอิงในมุมมองงาน CRAN Psychometrics แหล่งข้อมูลอื่น ๆ ที่น่าสนใจคือ:

การทบทวนที่ดีเกี่ยวกับการใช้ FA กับ IRT ในการพัฒนามาตราส่วนสามารถพบได้ในการสร้างมาตราส่วนและการประเมินผลในทางปฏิบัติ: การทบทวนการวิเคราะห์ปัจจัยเทียบกับการประยุกต์ใช้ทฤษฎีการตอบสนองข้อสอบโดยสิบ Holt et al (การทดสอบทางจิตวิทยา 52 (3): 272-297)


11

ในขณะที่สนับสนุนทุกอย่างที่กล่าวไว้ข้างต้นฉันขอแนะนำให้คุณทำสิ่งต่อไปนี้ (ตามลำดับที่คุ้นเคย)

ประการแรกคุณควรใช้ R หากไม่ควรเริ่ม คำแนะนำต่อไปนี้เป็นการบอกกล่าวการใช้งานของ R

ฉันจะสมมติว่าคุณมีตอนนี้คำนวณสถิติเชิงพรรณนาและอื่น ๆ ถ้าไม่แพ็คเกจจิตมีฟังก์ชั่นอธิบาย () ซึ่งควรให้สถิติที่คุณต้องการ

ติดตั้งแพ็กเกจ psych จาก CRAN โหลดแพ็คเกจจิต ใช้รูทีน fa.parallel บนข้อมูลของคุณ สิ่งนี้ควรให้ปัจจัยหลายประการแก่คุณ จากนั้นใช้ VSS (ชุดคำสั่ง) สิ่งนี้จะคำนวณเกณฑ์ MAP ซึ่งจะให้จำนวนปัจจัยต่าง ๆ (ปกติ) ที่คุณต้องการเก็บไว้ ใช้รูปแบบของการวิเคราะห์ปัจจัย (ไม่ใช่องค์ประกอบหลัก) และการหมุนแบบเอียงสำหรับแต่ละปัจจัย หากปัจจัยของคุณดูเหมือนจะไม่สัมพันธ์กันหลังจากการหมุนแบบเอียงให้เปลี่ยนไปใช้การหมุนแบบออโธกอนอล นี่เป็นโครงสร้างมุมฉากสามารถพิจารณาได้จากการหมุนแบบเฉียง แต่ไม่ใช่ในทางกลับกัน

แยกโซลูชันปัจจัยทั้งหมดระหว่างเกณฑ์ MAP และเกณฑ์การวิเคราะห์แบบขนาน พิจารณาว่าสิ่งใดที่มีดัชนีเหมาะสมที่สุดและเหมาะสมที่สุด นี่คือสิ่งที่คุณควรเก็บไว้

บน IRT ต้องใช้ทั้ง ltm และ eRm ฉันขอแนะนำให้เริ่มต้นด้วย eRm มันมีฟังก์ชั่นกราฟิคที่ดีกว่าสำหรับรุ่นของคุณ ที่ถูกกล่าวว่ามันเหมาะกับโมเดลของ Rasch เท่านั้นและบ่อยครั้งที่ข้อมูลจากแบบสอบถามทางจิตวิทยาไม่ตรงตามข้อกำหนดสำหรับพวกเขา โชคดี! ไซโครเมทริกส์เป็นเกมที่สนุกอย่างที่คุณไม่ต้องสงสัย


1
(+1) ฟังดูดี ขอบคุณที่แบ่งปันประสบการณ์ของคุณกับ IRT modelling and FA นอกเหนือจากฟังก์ชั่นกราฟิกวิธีการที่มีเงื่อนไขใน eRm นั้นสอดคล้องกับการคิดเริ่มต้นของทีต้าโดย Rasch (เป็นพารามิเตอร์คงที่)
chl

1

การตรวจสอบความถูกต้องของแบบสอบถามหมายถึงการพิสูจน์ว่าวัดสิ่งที่ควรจะวัด ดังนั้นฉันจะบอกว่านี่ไม่ใช่คำถามเชิงสถิติเป็นส่วนใหญ่และไม่สามารถตอบได้หากไม่ทราบเนื้อหาเฉพาะของแบบสอบถาม Cronbach อัลฟาไม่ได้เกี่ยวกับความถูกต้อง แต่เกี่ยวกับความสอดคล้องภายในซึ่งค่อนข้างเกี่ยวข้องกับความน่าเชื่อถือ (หรือหนึ่งสามารถพูดได้ว่ามันเป็นความน่าเชื่อถือสมมติว่าคำถามของคุณจะใช้แทนกัน - แต่พวกเขาไม่ได้)

ดังนั้นคุณสามารถทำอะไรเพื่อตรวจสอบแบบสอบถามของคุณ คุณสามารถศึกษาว่ากระบวนการทางจิตวิทยาใดก่อให้เกิดรูปแบบผลลัพธ์เฉพาะ (เช่นโดยพยายามชักนำรูปแบบดังกล่าวด้วยการใช้การทดลองหรือใช้กระบวนการคิดดัง [[การวิเคราะห์โปรโตคอล ", Ericsson & Simon, 1992]) หรือเปรียบเทียบกลุ่มที่ตัดกันบางกลุ่ม (เช่นผู้ป่วยที่มีการควบคุม) ที่ควรมีคะแนนแตกต่างกัน หรือมีความสัมพันธ์กับเกณฑ์ภายนอกที่ควรสัมพันธ์กับลักษณะที่คุณวัด หรือวัดลักษณะโดย Psychoscope (TM) และใช้เป็นเกณฑ์

คำตอบอื่น ๆ มีประโยชน์มากขึ้นในการชี้ให้เห็นสิ่งที่คุณอาจทำได้จริง - แม้ว่าส่วนใหญ่จะพูดอย่างเคร่งครัดไม่ใช่เรื่องความถูกต้อง (ยกเว้นการอ้างอิงของ Chi กับ "ความถูกต้องของกลุ่มที่รู้จัก" และความถูกต้องจากภายนอก)

ดูเพิ่มเติมที่ Markus & Borsboom (2013) สำหรับวิธีการที่ทันสมัยเพื่อความถูกต้อง (สิ่งนี้และการอ้างอิงที่เป็นประโยชน์อื่น ๆ @ หน้าแรกของ Borsboom )

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.