ฉันจะสมมติว่าแบบสอบถามของคุณถูกพิจารณาว่าเป็นมาตราส่วนหนึ่งมิติ (มิฉะนั้นอัลฟ่าของครอนบาคไม่สมเหตุสมผลมาก) มันคุ้มค่าที่จะทำการวิเคราะห์ปัจจัยเชิงสำรวจเพื่อตรวจสอบสิ่งนั้น นอกจากนี้ยังช่วยให้คุณสามารถดูว่ารายการเกี่ยวข้องกับเครื่องชั่งอย่างไร (เช่นผ่านการบรรทุกสินค้า)
ขั้นตอนพื้นฐานสำหรับการตรวจสอบรายการของคุณและเครื่องชั่งของคุณควรประกอบด้วย:
- รายงานที่สมบูรณ์เกี่ยวกับสถิติพื้นฐานของรายการ (ช่วงควอไทล์แนวโน้มกลางเพดานและเอฟเฟกต์พื้นถ้ามี)
- ตรวจสอบความสอดคล้องภายในเช่นเดียวกับที่คุณทำกับอัลฟ่าของคุณ (ดีที่สุดให้ช่วงความมั่นใจ 95% เพราะมันขึ้นอยู่กับตัวอย่าง)
- อธิบายการวัดสรุปของคุณ (เช่นคะแนนรวมหรือคะแนนเฉลี่ย, คะแนนสเกล aka) ที่มีสถิติปกติ (ฮิสโตแกรม + ความหนาแน่น, ปริมาณ ฯลฯ );
- ตรวจสอบการตอบสนองสรุปของคุณกับ covariates เฉพาะที่ควรจะเกี่ยวข้องกับโครงสร้างของคุณกำลังประเมิน - นี้เรียกว่าความถูกต้องกลุ่มที่รู้จักกัน;
- หากเป็นไปได้ให้ตรวจสอบการตอบกลับสรุปของคุณจากเครื่องมือที่ทราบว่ามีเจตนาที่จะวัดสิ่งก่อสร้างเดียวกัน ( ความถูกต้องพร้อมกันหรือคอนเวอร์เจนซ์)
หากเครื่องชั่งของคุณไม่ใช่มิติเดียวขั้นตอนเหล่านี้จะต้องทำสำหรับแต่ละ subscale และคุณสามารถแยกเมทริกซ์สหสัมพันธ์ของปัจจัยของคุณเพื่อประเมินโครงสร้างปัจจัยอันดับสอง (หรือใช้การสร้างแบบจำลองสมการโครงสร้างหรือการวิเคราะห์ปัจจัยยืนยันหรือ สิ่งที่คุณต้องการ) นอกจากนี้คุณยังสามารถประเมินความถูกต้องของคอนเวอร์เจนซ์และการแบ่งแยกโดยใช้มาตราส่วนแบบหลายลักษณะหรือแบบจำลองหลายวิธีหลายลักษณะ (ขึ้นอยู่กับสหสัมพันธ์ระหว่างหน่วยภายในและระหว่างเครื่องชั่ง) หรือ SEM อีกครั้ง
แล้วผมจะบอกว่ารายการที่ทฤษฎีการตอบสนองจะไม่ช่วยเหลือที่มากจนกว่าคุณจะมีความสนใจในการตัดทอนแบบสอบถามของคุณกรองบางรายการที่แสดงให้เห็นการทำงานของรายการค่าหรือใช้การทดสอบของคุณในชนิดของบางการทดสอบการปรับตัวคอมพิวเตอร์
ไม่ว่าในกรณีใด ๆโมเดล Rasch ใช้สำหรับรายการไบนารี สำหรับรายการที่มีคำสั่งหลายคำสั่งรุ่นที่ใช้กันมากที่สุดคือ:
- รูปแบบการตอบสนองช้า
- โมเดลเครดิตบางส่วน
- โมเดลมาตราส่วนการจัดอันดับ
มีเพียงสองอันหลังที่มาจากตระกูล Rasch และพวกเขาใช้สูตรการต่อรองที่อยู่ติดกันโดยมีแนวคิดว่าหัวเรื่องต้อง "ผ่าน" เกณฑ์หลายอย่างเพื่อรับรองหมวดหมู่การตอบกลับที่กำหนด ความแตกต่างระหว่างรุ่นทั้งสองนี้คือ PCM ไม่ได้กำหนดว่าขีด จำกัด จะมีระยะห่างเท่ากันในระดับทีต้า ( ความสามารถหรือตำแหน่งของวัตถุในสเกลลักษณะแฝง) โมเดลการตอบกลับที่ให้คะแนนจะขึ้นอยู่กับสูตรอัตราต่อรองสะสม โปรดทราบว่าโมเดลเหล่านี้ทุกคนคิดว่าสเกลนั้นมีมิติเดียว นั่นคือมีเพียงหนึ่งคุณลักษณะที่แฝงอยู่ มีสมมติฐานเพิ่มเติมเช่นความเป็นอิสระในท้องถิ่น (เช่นความสัมพันธ์ระหว่างการตอบสนองอธิบายโดยการเปลี่ยนแปลงในระดับความสามารถ)
อย่างไรก็ตามคุณจะได้พบกับเอกสารที่สมบูรณ์มากและเบาะแสที่มีประโยชน์ในการใช้วิธีการทางจิตวิทยาในการวิจัยในปริมาณ 20 ของวารสารซอฟแวร์ทางสถิติปริมาณพิเศษ: Psychometrics ใน R โดยทั่วไปส่วนใหญ่แพคเกจที่น่าสนใจ R ที่ผมใช้ในการทำงานในชีวิตประจำวันของฉันคือLTM , ERM , วิญญาณ , psy อื่น ๆ ที่มีการอ้างอิงในมุมมองงาน CRAN Psychometrics แหล่งข้อมูลอื่น ๆ ที่น่าสนใจคือ:
การทบทวนที่ดีเกี่ยวกับการใช้ FA กับ IRT ในการพัฒนามาตราส่วนสามารถพบได้ในการสร้างมาตราส่วนและการประเมินผลในทางปฏิบัติ: การทบทวนการวิเคราะห์ปัจจัยเทียบกับการประยุกต์ใช้ทฤษฎีการตอบสนองข้อสอบโดยสิบ Holt et al (การทดสอบทางจิตวิทยา 52 (3): 272-297)