การตอบสนองนี้จะหารือเกี่ยวกับแบบจำลองที่เป็นไปได้จากมุมมองการวัดซึ่งเราได้รับชุดของตัวแปรที่สัมพันธ์กันที่สังเกตได้ (รายการ) หรือมาตรการซึ่งความแปรปรวนร่วมกันจะถือว่าเป็นการวัดที่มีการระบุไว้เป็นอย่างดี ลักษณะ) ซึ่งจะได้รับการพิจารณาเป็นตัวแปรแฝง หากคุณไม่คุ้นเคยกับรูปแบบการวัดลักษณะแฝงฉันขอแนะนำสองบทความต่อไปนี้: การโจมตีของ psychometriciansโดย Denny Borsbooom และการสร้างแบบจำลองตัวแปรแฝง: การสำรวจโดย Anders Skrondal และ Sophia Rabe-Hesketh ฉันจะพูดนอกเรื่องเล็กน้อยด้วยตัวบ่งชี้ไบนารีก่อนที่จะจัดการกับรายการที่มีหมวดหมู่การตอบสนองหลายรายการ
วิธีหนึ่งในการแปลงข้อมูลระดับลำดับเป็นมาตราส่วนช่วงเวลาคือการใช้รูปแบบการตอบสนองรายการบางชนิด ตัวอย่างที่รู้จักกันดีคือแบบจำลอง Raschซึ่งขยายแนวคิดของรูปแบบการทดสอบแบบขนานจากทฤษฎีการทดสอบแบบคลาสสิกเพื่อรับมือกับรายการที่ทำคะแนนแบบไบนารีผ่าน generalized (พร้อมลิงค์ logit) โมเดลเชิงเส้นผสมเอฟเฟกต์ (ในบางส่วนของการใช้งานซอฟต์แวร์ 'ทันสมัย') ซึ่งความน่าจะเป็นของการรับรองรายการที่กำหนดคือฟังก์ชั่น 'ความยากลำบากในรายการ' และ 'ความสามารถของบุคคล' การทำงานร่วมกันระหว่างตำแหน่งหนึ่ง ๆ กับลักษณะแฝงที่ถูกวัดและตำแหน่งของสินค้าในระดับ logit เดียวกันซึ่งสามารถจับผ่านพารามิเตอร์การแยกแยะรายการเพิ่มเติมหรือการมีปฏิสัมพันธ์กับคุณลักษณะเฉพาะของแต่ละบุคคลซึ่งเรียกว่าการทำงานของรายการที่แตกต่างกัน ) การสร้างพื้นฐานจะถือว่าเป็นมิติเดียวและตรรกะของแบบจำลอง Rasch เป็นเพียงว่าผู้ตอบแบบสอบถามมีจำนวน 'การสร้าง' - ให้พูดคุยเกี่ยวกับความรับผิดชอบของหัวเรื่อง (ความสามารถของเขา / เธอ)θเช่นเดียวกับรายการใด ๆ ที่กำหนดโครงสร้างนี้ ('ความยากลำบาก' ของพวกเขา) อะไรคือสิ่งที่น่าสนใจก็คือความแตกต่างระหว่างที่ตั้งของผู้ถูกกล่าวหาและสถานที่ตั้งของรายการตามมาตราวัดที่θเพื่อเป็นตัวอย่างที่เป็นรูปธรรมพิจารณาคำถามต่อไปนี้: "ฉันพบว่ามันยากที่จะมุ่งเน้นไปที่สิ่งอื่นนอกเหนือจากความวิตกกังวลของฉัน" (ใช่ / ไม่ใช่) คนที่ทุกข์ทรมานจากความผิดปกติของความวิตกกังวลมีแนวโน้มที่จะตอบคำถามนี้ในเชิงบวกเมื่อเปรียบเทียบกับบุคคลที่สุ่มมาจากประชากรทั่วไปและไม่มีประวัติของภาวะซึมเศร้าหรือโรคที่เกี่ยวข้องกับความวิตกกังวลที่ผ่านมาθ
ยังไม่มีข้อความ= 766α = 0.971[ 0.967 ; 0.975 ]) เริ่มแรกมีการเสนอหมวดหมู่การตอบสนองห้าหมวดหมู่ (1 = 'ไม่เคย', 2 = 'ไม่ค่อย', 3 = 'บางครั้ง', 4 = 'บ่อยครั้ง' และ 5 = 'เสมอ') สำหรับแต่ละรายการ เราจะพิจารณาการตอบกลับด้วยคะแนนไบนารี่เท่านั้น
(ที่นี่การตอบสนองต่อรายการประเภท Likert ได้รับการบันทึกเป็นการตอบสนองแบบไบนารี (1/2 = 0, 3-5 = 1) และเราพิจารณาว่าแต่ละรายการมีการเลือกปฏิบัติอย่างเท่าเทียมกันในแต่ละบุคคลดังนั้นความเท่าเทียมกันระหว่างเส้นโค้งของรายการ (Rasch รุ่น).)
x
สำหรับรายการโพลีโทมีหมวดหมู่ที่สั่งซื้อมีหลายตัวเลือก: โมเดลเครดิตบางส่วน , โมเดลมาตราส่วนการจัดอันดับหรือโมเดลตอบกลับอย่างช้าๆ เพื่อตั้งชื่อ แต่มีเพียงไม่กี่ส่วนที่ใช้ในการวิจัยประยุกต์ สองคนแรกเป็นของ "Rasch family" ของ IRT model และแบ่งปันคุณสมบัติต่อไปนี้: (a) monotonicityของฟังก์ชั่นการตอบสนองความน่าจะเป็น (เส้นโค้งการตอบสนองของรายการ / หมวดหมู่), (b) ความเพียงพอของคะแนนรวมของแต่ละบุคคล พารามิเตอร์ที่พิจารณาว่าได้รับการแก้ไข), (c) ความเป็นอิสระในท้องถิ่นหมายถึงการตอบสนองต่อรายการที่เป็นอิสระเงื่อนไขตามลักษณะแฝงและ (d) การขาดการทำงานของรายการที่แตกต่าง หมายความว่าเงื่อนไขตามลักษณะแฝงการตอบสนองเป็นอิสระจากตัวแปรเฉพาะบุคคลภายนอก (เช่นเพศอายุเชื้อชาติ SES)
การขยายตัวอย่างก่อนหน้านี้ไปยังกรณีที่หมวดหมู่การตอบสนองห้าหมวดหมู่ได้รับการคำนึงถึงอย่างมีประสิทธิภาพผู้ป่วยจะมีความเป็นไปได้สูงกว่าในการเลือกหมวดหมู่การตอบสนอง 3 ถึง 5 เมื่อเทียบกับบางคนที่สุ่มตัวอย่างจากประชากรทั่วไป เมื่อเทียบกับการสร้างแบบจำลองของรายการ dichotomous ที่อธิบายไว้ข้างต้นโมเดลเหล่านี้จะพิจารณาแบบสะสม (เช่นอัตราต่อรองของการตอบ 3 ต่อ 2 หรือน้อยกว่า) หรือเกณฑ์หมวดหมู่ที่อยู่ติดกัน (อัตราต่อรองของการตอบ 3 ต่อ 2) ซึ่งกล่าวถึงในหมวดหมู่ Agresti การวิเคราะห์ข้อมูล(ตอนที่ 12) ความแตกต่างที่สำคัญระหว่างโมเดลดังกล่าวอยู่ในวิธีการเปลี่ยนจากหมวดหมู่การตอบกลับหนึ่งไปยังอีกประเภทหนึ่ง: โมเดลเครดิตบางส่วนไม่คิดว่าความแตกต่างระหว่างตำแหน่งขีด จำกัด ที่กำหนดและค่าเฉลี่ยของตำแหน่งขีด จำกัด บนคุณลักษณะแฝงมีค่าเท่ากับหรือ เหมือนกันทุกรายการตรงกันข้ามกับโมเดลมาตราส่วนการจัดอันดับ ความแตกต่างที่ละเอียดอ่อนอีกประการระหว่างแบบจำลองเหล่านี้คือบางส่วนของพวกเขา (เช่นการตอบสนองแบบไม่มีเงื่อนไข จำกัด หรือแบบจำลองสินเชื่อบางส่วน) ช่วยให้พารามิเตอร์การเลือกปฏิบัติที่ไม่เท่ากันระหว่างรายการ ดูการใช้แบบจำลองทฤษฎีการตอบสนองข้อสอบสำหรับการประเมินรายการคำถามและคุณสมบัติมาตราส่วนโดย Reeve and Fayers หรือพื้นฐานของทฤษฎีการตอบสนองข้อสอบโดย Frank B. Baker สำหรับรายละเอียดเพิ่มเติม
เนื่องจากในกรณีก่อนหน้านี้เราได้พูดถึงการตีความของเส้นโค้งความน่าจะเป็นในการตอบสนองสำหรับรายการที่มีการแบ่งขั้วให้ดูที่ส่วนโค้งการตอบสนองรายการที่ได้จากรูปแบบการตอบกลับอย่างช้า ๆ โดยเน้นรายการเป้าหมายเดียวกัน
(แบบจำลองการตอบสนองแบบไม่ จำกัด อย่างเข้มงวดช่วยให้สามารถเลือกปฏิบัติได้อย่างไม่เท่ากันในแต่ละรายการ)
ที่นี่ข้อสังเกตต่อไปนี้สมควรได้รับการพิจารณา:
- [ 2 ; 2.5 ]
- มีการเปลี่ยนแปลงโดยรวมจากซ้ายไปขวาระหว่างรายการที่ประเมินคุณภาพการนอนหลับและผู้ที่ประเมินภาวะที่รุนแรงมากขึ้นแม้ว่าความผิดปกติของการนอนหลับจะไม่ใช่เรื่องแปลก สิ่งนี้คาดว่าจะเกิดขึ้น: แม้แต่คนในประชากรทั่วไปก็อาจมีปัญหาในการนอนหลับเป็นอิสระจากภาวะสุขภาพของพวกเขาและผู้ที่ซึมเศร้าหรือวิตกกังวลอย่างรุนแรงอาจมีปัญหา อย่างไรก็ตาม 'คนปกติ' (ถ้าเคยมีความหมายใด ๆ ) ไม่น่าจะแสดงสัญญาณของความผิดปกติบางอย่าง (ความน่าจะเป็นที่พวกเขาเลือกหมวดหมู่การตอบสนองที่สูงที่สุดเป็นศูนย์สำหรับคนที่อยู่ในระดับกลางหรือมากกว่า 0; 1])
θ
นอกจากการคิดแบบจำลองการวัดอย่างแท้จริงแล้วสิ่งที่ทำให้แบบจำลองของ Rasch น่าดึงดูดคือคะแนนรวมซึ่งเป็นสถิติที่เพียงพอสามารถใช้เป็นตัวแทนสำหรับคะแนนแฝงได้ ยิ่งไปกว่านั้นคุณสมบัติความพอเพียงแสดงถึงความสามารถในการแยกพารามิเตอร์ของแบบจำลอง (บุคคลและรายการ) (ในกรณีของรายการโพลีโทมิกไม่ควรลืมว่าทุกสิ่งมีผลในระดับหมวดหมู่การตอบสนองรายการ)
ตรวจสอบที่ดีของลำดับชั้นรุ่น IRT กับการดำเนินงาน R, มีอยู่ในแมร์และ Hatzinger บทความที่ตีพิมพ์ในวารสารสถิติซอฟต์แวร์ : ขยาย Rasch การสร้างแบบจำลองที่: ERM แพคเกจสำหรับการประยุกต์ใช้ IRT รุ่นใน R รุ่นอื่น ๆ ได้แก่รุ่นบันทึกเชิงเส้นรุ่นที่ไม่ใช่ตัวแปรเช่นรุ่น Mokkenหรือรุ่นกราฟิก
นอกเหนือจาก R ฉันไม่ทราบถึงการใช้งานของ Excel แต่มีการเสนอแพ็กเกจสถิติหลายชุดในเธรดนี้: เริ่มต้นอย่างไรกับการใช้ทฤษฎีการตอบกลับรายการและซอฟต์แวร์ที่จะใช้
ในที่สุดหากคุณต้องการศึกษาความสัมพันธ์ระหว่างชุดของรายการและตัวแปรตอบกลับโดยไม่ต้องใช้แบบจำลองการวัดรูปแบบของการวัดเชิงปริมาณบางรูปแบบผ่านการปรับขนาดที่เหมาะสมก็น่าสนใจเช่นกัน นอกเหนือจากการใช้งาน R ที่กล่าวถึงในเธรดเหล่านั้นแล้วโซลูชัน SPSS ก็ถูกเสนอบนเธรดที่เกี่ยวข้องด้วย
อ้างอิง
- Pilkonis, P. , Choi, S. , Reise, S. , Stover, A. และ Riley, W. และคณะ (2011) ธนาคารรายการสำหรับ mea- SURING ความทุกข์ทางอารมณ์จากการรายงานผู้ป่วยระบบข้อมูลการวัดผลลัพธ์ (PROMIS): ซึมเศร้าวิตกกังวลและความโกรธ การประเมิน , 18 (3), 263–283
- Choi, S. , Gibbons, L. และ Crane, P. (2011) lordif: แพคเกจ R สำหรับการตรวจสอบรายการค่าใช้ไฮบริดทำงานซ้ำลำดับโลจิสติกการถดถอย / ทฤษฎีการตอบสนองและการจำลอง วารสารซอฟต์แวร์เชิงสถิติ , 39 (8)