จะแปลงข้อมูลลำดับจากแบบสอบถามเป็นข้อมูลช่วงเวลาที่เหมาะสมได้อย่างไร


13

มีวิธีการที่ตรงไปตรงมาในการแปลงข้อมูลระดับลำดับเป็นระดับช่วงเวลา (เช่นเดียวกับที่มีสำหรับการทำรอบทางอื่น ๆ )? และสามารถใช้งานได้ใน Excel หรือ SPSS?

มีข้อมูลพูดว่า: 10 คำถามเกี่ยวกับระดับลำดับ (กล่าวว่าขนาด 0-5 ที่ 0 = "ไม่ได้เลย", 5 = "ตลอดเวลา") ฉันต้องการที่จะเปลี่ยนพวกเขาเพื่อให้พวกเขาสามารถได้รับการปฏิบัติที่เหมาะสม ข้อมูลระดับช่วงเวลาสำหรับจุดประสงค์ในการทดสอบพารามิเตอร์ (การแจกแจงแบบปกติการทดสอบแบบไม่อิงพารามิเตอร์จากคำถาม)

จะขอบคุณอย่างยิ่งสำหรับคำตอบ!


เราจะมีค่า 6, 7, 8, 9, 10 ในระดับ 0-5 หรือฉันจะพลาดบางอย่างได้อย่างไร
ttnphns

3
คุณหมายถึงอะไรตรงไปตรงมา? ในการแปลงตัวแปรเด็ดขาดเป็นสเกลเมตริกไม่ใช่เรื่องง่าย มีตัวแบบตัวแปรแฝงบางตัว (เช่นตัวแบบ IRT) ที่ให้สมมติฐานบางอย่างอนุญาตให้ทำเช่นนั้นได้ อีกวิธีคือการปรับขนาดที่เหมาะสมที่สุด แต่สำหรับสิ่งนี้ฉันคิดว่าคุณต้องเต็มใจทำสิ่งต่างๆด้วย R และเจาะลึกลงไปในสถิติขั้นสูงบางอย่างเช่นแบบจำลองตัวแปรแฝงหรือ PCA แบบไม่เชิงเส้น เสียงนั้นโอเคไหม?
Momo

คำตอบ:


25

การตอบสนองนี้จะหารือเกี่ยวกับแบบจำลองที่เป็นไปได้จากมุมมองการวัดซึ่งเราได้รับชุดของตัวแปรที่สัมพันธ์กันที่สังเกตได้ (รายการ) หรือมาตรการซึ่งความแปรปรวนร่วมกันจะถือว่าเป็นการวัดที่มีการระบุไว้เป็นอย่างดี ลักษณะ) ซึ่งจะได้รับการพิจารณาเป็นตัวแปรแฝง หากคุณไม่คุ้นเคยกับรูปแบบการวัดลักษณะแฝงฉันขอแนะนำสองบทความต่อไปนี้: การโจมตีของ psychometriciansโดย Denny Borsbooom และการสร้างแบบจำลองตัวแปรแฝง: การสำรวจโดย Anders Skrondal และ Sophia Rabe-Hesketh ฉันจะพูดนอกเรื่องเล็กน้อยด้วยตัวบ่งชี้ไบนารีก่อนที่จะจัดการกับรายการที่มีหมวดหมู่การตอบสนองหลายรายการ

วิธีหนึ่งในการแปลงข้อมูลระดับลำดับเป็นมาตราส่วนช่วงเวลาคือการใช้รูปแบบการตอบสนองรายการบางชนิด ตัวอย่างที่รู้จักกันดีคือแบบจำลอง Raschซึ่งขยายแนวคิดของรูปแบบการทดสอบแบบขนานจากทฤษฎีการทดสอบแบบคลาสสิกเพื่อรับมือกับรายการที่ทำคะแนนแบบไบนารีผ่าน generalized (พร้อมลิงค์ logit) โมเดลเชิงเส้นผสมเอฟเฟกต์ (ในบางส่วนของการใช้งานซอฟต์แวร์ 'ทันสมัย') ซึ่งความน่าจะเป็นของการรับรองรายการที่กำหนดคือฟังก์ชั่น 'ความยากลำบากในรายการ' และ 'ความสามารถของบุคคล' การทำงานร่วมกันระหว่างตำแหน่งหนึ่ง ๆ กับลักษณะแฝงที่ถูกวัดและตำแหน่งของสินค้าในระดับ logit เดียวกันซึ่งสามารถจับผ่านพารามิเตอร์การแยกแยะรายการเพิ่มเติมหรือการมีปฏิสัมพันธ์กับคุณลักษณะเฉพาะของแต่ละบุคคลซึ่งเรียกว่าการทำงานของรายการที่แตกต่างกัน ) การสร้างพื้นฐานจะถือว่าเป็นมิติเดียวและตรรกะของแบบจำลอง Rasch เป็นเพียงว่าผู้ตอบแบบสอบถามมีจำนวน 'การสร้าง' - ให้พูดคุยเกี่ยวกับความรับผิดชอบของหัวเรื่อง (ความสามารถของเขา / เธอ)θเช่นเดียวกับรายการใด ๆ ที่กำหนดโครงสร้างนี้ ('ความยากลำบาก' ของพวกเขา) อะไรคือสิ่งที่น่าสนใจก็คือความแตกต่างระหว่างที่ตั้งของผู้ถูกกล่าวหาและสถานที่ตั้งของรายการตามมาตราวัดที่θเพื่อเป็นตัวอย่างที่เป็นรูปธรรมพิจารณาคำถามต่อไปนี้: "ฉันพบว่ามันยากที่จะมุ่งเน้นไปที่สิ่งอื่นนอกเหนือจากความวิตกกังวลของฉัน" (ใช่ / ไม่ใช่) คนที่ทุกข์ทรมานจากความผิดปกติของความวิตกกังวลมีแนวโน้มที่จะตอบคำถามนี้ในเชิงบวกเมื่อเปรียบเทียบกับบุคคลที่สุ่มมาจากประชากรทั่วไปและไม่มีประวัติของภาวะซึมเศร้าหรือโรคที่เกี่ยวข้องกับความวิตกกังวลที่ผ่านมาθ

N=766α=0.971[0.967;0.975]) เริ่มแรกมีการเสนอหมวดหมู่การตอบสนองห้าหมวดหมู่ (1 = 'ไม่เคย', 2 = 'ไม่ค่อย', 3 = 'บางครั้ง', 4 = 'บ่อยครั้ง' และ 5 = 'เสมอ') สำหรับแต่ละรายการ เราจะพิจารณาการตอบกลับด้วยคะแนนไบนารี่เท่านั้น

ป้อนคำอธิบายรูปภาพที่นี่
(ที่นี่การตอบสนองต่อรายการประเภท Likert ได้รับการบันทึกเป็นการตอบสนองแบบไบนารี (1/2 = 0, 3-5 = 1) และเราพิจารณาว่าแต่ละรายการมีการเลือกปฏิบัติอย่างเท่าเทียมกันในแต่ละบุคคลดังนั้นความเท่าเทียมกันระหว่างเส้นโค้งของรายการ (Rasch รุ่น).)

x

สำหรับรายการโพลีโทมีหมวดหมู่ที่สั่งซื้อมีหลายตัวเลือก: โมเดลเครดิตบางส่วน , โมเดลมาตราส่วนการจัดอันดับหรือโมเดลตอบกลับอย่างช้าๆ เพื่อตั้งชื่อ แต่มีเพียงไม่กี่ส่วนที่ใช้ในการวิจัยประยุกต์ สองคนแรกเป็นของ "Rasch family" ของ IRT model และแบ่งปันคุณสมบัติต่อไปนี้: (a) monotonicityของฟังก์ชั่นการตอบสนองความน่าจะเป็น (เส้นโค้งการตอบสนองของรายการ / หมวดหมู่), (b) ความเพียงพอของคะแนนรวมของแต่ละบุคคล พารามิเตอร์ที่พิจารณาว่าได้รับการแก้ไข), (c) ความเป็นอิสระในท้องถิ่นหมายถึงการตอบสนองต่อรายการที่เป็นอิสระเงื่อนไขตามลักษณะแฝงและ (d) การขาดการทำงานของรายการที่แตกต่าง หมายความว่าเงื่อนไขตามลักษณะแฝงการตอบสนองเป็นอิสระจากตัวแปรเฉพาะบุคคลภายนอก (เช่นเพศอายุเชื้อชาติ SES)

การขยายตัวอย่างก่อนหน้านี้ไปยังกรณีที่หมวดหมู่การตอบสนองห้าหมวดหมู่ได้รับการคำนึงถึงอย่างมีประสิทธิภาพผู้ป่วยจะมีความเป็นไปได้สูงกว่าในการเลือกหมวดหมู่การตอบสนอง 3 ถึง 5 เมื่อเทียบกับบางคนที่สุ่มตัวอย่างจากประชากรทั่วไป เมื่อเทียบกับการสร้างแบบจำลองของรายการ dichotomous ที่อธิบายไว้ข้างต้นโมเดลเหล่านี้จะพิจารณาแบบสะสม (เช่นอัตราต่อรองของการตอบ 3 ต่อ 2 หรือน้อยกว่า) หรือเกณฑ์หมวดหมู่ที่อยู่ติดกัน (อัตราต่อรองของการตอบ 3 ต่อ 2) ซึ่งกล่าวถึงในหมวดหมู่ Agresti การวิเคราะห์ข้อมูล(ตอนที่ 12) ความแตกต่างที่สำคัญระหว่างโมเดลดังกล่าวอยู่ในวิธีการเปลี่ยนจากหมวดหมู่การตอบกลับหนึ่งไปยังอีกประเภทหนึ่ง: โมเดลเครดิตบางส่วนไม่คิดว่าความแตกต่างระหว่างตำแหน่งขีด จำกัด ที่กำหนดและค่าเฉลี่ยของตำแหน่งขีด จำกัด บนคุณลักษณะแฝงมีค่าเท่ากับหรือ เหมือนกันทุกรายการตรงกันข้ามกับโมเดลมาตราส่วนการจัดอันดับ ความแตกต่างที่ละเอียดอ่อนอีกประการระหว่างแบบจำลองเหล่านี้คือบางส่วนของพวกเขา (เช่นการตอบสนองแบบไม่มีเงื่อนไข จำกัด หรือแบบจำลองสินเชื่อบางส่วน) ช่วยให้พารามิเตอร์การเลือกปฏิบัติที่ไม่เท่ากันระหว่างรายการ ดูการใช้แบบจำลองทฤษฎีการตอบสนองข้อสอบสำหรับการประเมินรายการคำถามและคุณสมบัติมาตราส่วนโดย Reeve and Fayers หรือพื้นฐานของทฤษฎีการตอบสนองข้อสอบโดย Frank B. Baker สำหรับรายละเอียดเพิ่มเติม

เนื่องจากในกรณีก่อนหน้านี้เราได้พูดถึงการตีความของเส้นโค้งความน่าจะเป็นในการตอบสนองสำหรับรายการที่มีการแบ่งขั้วให้ดูที่ส่วนโค้งการตอบสนองรายการที่ได้จากรูปแบบการตอบกลับอย่างช้า ๆ โดยเน้นรายการเป้าหมายเดียวกัน

ป้อนคำอธิบายรูปภาพที่นี่
(แบบจำลองการตอบสนองแบบไม่ จำกัด อย่างเข้มงวดช่วยให้สามารถเลือกปฏิบัติได้อย่างไม่เท่ากันในแต่ละรายการ)

ที่นี่ข้อสังเกตต่อไปนี้สมควรได้รับการพิจารณา:

  • [2;2.5]
  • มีการเปลี่ยนแปลงโดยรวมจากซ้ายไปขวาระหว่างรายการที่ประเมินคุณภาพการนอนหลับและผู้ที่ประเมินภาวะที่รุนแรงมากขึ้นแม้ว่าความผิดปกติของการนอนหลับจะไม่ใช่เรื่องแปลก สิ่งนี้คาดว่าจะเกิดขึ้น: แม้แต่คนในประชากรทั่วไปก็อาจมีปัญหาในการนอนหลับเป็นอิสระจากภาวะสุขภาพของพวกเขาและผู้ที่ซึมเศร้าหรือวิตกกังวลอย่างรุนแรงอาจมีปัญหา อย่างไรก็ตาม 'คนปกติ' (ถ้าเคยมีความหมายใด ๆ ) ไม่น่าจะแสดงสัญญาณของความผิดปกติบางอย่าง (ความน่าจะเป็นที่พวกเขาเลือกหมวดหมู่การตอบสนองที่สูงที่สุดเป็นศูนย์สำหรับคนที่อยู่ในระดับกลางหรือมากกว่า 0; 1])

θ

นอกจากการคิดแบบจำลองการวัดอย่างแท้จริงแล้วสิ่งที่ทำให้แบบจำลองของ Rasch น่าดึงดูดคือคะแนนรวมซึ่งเป็นสถิติที่เพียงพอสามารถใช้เป็นตัวแทนสำหรับคะแนนแฝงได้ ยิ่งไปกว่านั้นคุณสมบัติความพอเพียงแสดงถึงความสามารถในการแยกพารามิเตอร์ของแบบจำลอง (บุคคลและรายการ) (ในกรณีของรายการโพลีโทมิกไม่ควรลืมว่าทุกสิ่งมีผลในระดับหมวดหมู่การตอบสนองรายการ)

ตรวจสอบที่ดีของลำดับชั้นรุ่น IRT กับการดำเนินงาน R, มีอยู่ในแมร์และ Hatzinger บทความที่ตีพิมพ์ในวารสารสถิติซอฟต์แวร์ : ขยาย Rasch การสร้างแบบจำลองที่: ERM แพคเกจสำหรับการประยุกต์ใช้ IRT รุ่นใน R รุ่นอื่น ๆ ได้แก่รุ่นบันทึกเชิงเส้นรุ่นที่ไม่ใช่ตัวแปรเช่นรุ่น Mokkenหรือรุ่นกราฟิก

นอกเหนือจาก R ฉันไม่ทราบถึงการใช้งานของ Excel แต่มีการเสนอแพ็กเกจสถิติหลายชุดในเธรดนี้: เริ่มต้นอย่างไรกับการใช้ทฤษฎีการตอบกลับรายการและซอฟต์แวร์ที่จะใช้

ในที่สุดหากคุณต้องการศึกษาความสัมพันธ์ระหว่างชุดของรายการและตัวแปรตอบกลับโดยไม่ต้องใช้แบบจำลองการวัดรูปแบบของการวัดเชิงปริมาณบางรูปแบบผ่านการปรับขนาดที่เหมาะสมก็น่าสนใจเช่นกัน นอกเหนือจากการใช้งาน R ที่กล่าวถึงในเธรดเหล่านั้นแล้วโซลูชัน SPSS ก็ถูกเสนอบนเธรดที่เกี่ยวข้องด้วย

อ้างอิง

  1. Pilkonis, P. , Choi, S. , Reise, S. , Stover, A. และ Riley, W. และคณะ (2011) ธนาคารรายการสำหรับ mea- SURING ความทุกข์ทางอารมณ์จากการรายงานผู้ป่วยระบบข้อมูลการวัดผลลัพธ์ (PROMIS): ซึมเศร้าวิตกกังวลและความโกรธ การประเมิน , 18 (3), 263–283
  2. Choi, S. , Gibbons, L. และ Crane, P. (2011) lordif: แพคเกจ R สำหรับการตรวจสอบรายการค่าใช้ไฮบริดทำงานซ้ำลำดับโลจิสติกการถดถอย / ทฤษฎีการตอบสนองและการจำลอง วารสารซอฟต์แวร์เชิงสถิติ , 39 (8)

@Momo ขอบคุณ นั่นเป็นเรื่องแปลก ในขณะที่ตอบรับ (และแก้ไขคำตอบนี้อีกครั้งในวันนี้) ฉันไม่ได้สังเกตเห็นความคิดเห็นของคุณซึ่งมีค่าเท่ากับ +1 ขนาดใหญ่ ได้โปรดอย่าลังเลที่จะแก้ไขคำตอบของฉันตามที่เห็นสมควร
chl

3

ในหนังสือของเขาการวิเคราะห์ข้อมูลหมวดหมู่สามัญอลัน Agresti ครอบคลุมหลาย หนึ่งในนั้นคือ ridits ที่ฉันพูดคุยในบล็อกของฉัน


1
คุณช่วยอธิบายเรื่องนี้อีกหน่อยได้ไหม? ในความคิดแรกดูเหมือนว่าวิธีการใด ๆ ที่อ้างว่าแปลข้อมูลแบบออบเจกต์เป็นข้อมูลแบบช่วงชิงจะเป็นเวทย์มนตร์เนื่องจากดูเหมือนว่าคุณจะให้ตัวอย่างทางพยาธิวิทยาที่ไม่ดังที่จะ "ทำลาย" วิธีการใด ๆ แต่ฉันอาจหายไป สิ่งที่สำคัญ ดูเหมือนว่าจะต้องมีความคิดเกี่ยวกับระยะห่างระหว่างหมวดหมู่ตามลำดับ - สิ่งนั้นมาจากไหน?
มาโคร

สูตรอยู่ในบล็อกโพสต์และการอภิปรายเต็มรูปแบบอยู่ในหนังสือของ Agresti แต่โดยพื้นฐานแล้วจะใช้ข้อมูลเพื่อสร้าง "สัดส่วนการสะสมเฉลี่ย" แล้วใช้เป็นคะแนน ระยะทางมาจากสัดส่วนในการตอบสนองแต่ละครั้งไม่ใช่จากสิ่งใด ๆ ในหมวดหมู่ของตัวเอง
Peter Flom - Reinstate Monica

2
+1 Ridits อธิบายได้อย่างง่ายดายเนื่องจากเศษส่วนน้อยกว่า + (1/2) เศษส่วนเท่ากัน ดังนั้นหาก 1, 2, 3, 4, 5 ได้สังเกตเศษส่วนหรือความน่าจะเป็น 0.2, 0.4, 0.2, 0.1, 0.1 แล้วการกำจัด 1 คือ 0.1; ที่ 2 คือ 0.4 และอื่น ๆ Ridits รักษาหมวดหมู่แบบสมมาตรและมีโอกาสน้อยกว่าเศษส่วนน้อยกว่าหรือเศษส่วนมากกว่าที่จะรวม 0 หรือ 1 เป็นผลซึ่งมักจะอึดอัดใจ
Nick Cox

ชื่อriditนั้นตั้งใจโดย Bross อย่างตั้งใจ (หมายเหตุ: จำเป็นต้องมีการอ้างอิง) และคำอธิบายที่ควรจะเป็นการพูดพล่อยๆ ชื่อที่ดีกว่าคือฟังก์ชันการกระจายกลาง (Parzen 1993) และฟังก์ชันเกรด Haberman (1996) Haberman, SJ 1996. สถิติขั้นสูงเล่มที่ 1: คำอธิบายของประชากร . นิวยอร์ก: สปริงเกอร์ Parzen, E. 1993 เปลี่ยนพล็อต PP และฟังก์ชั่นควอนไทด์ตัวอย่างแบบต่อเนื่อง การสื่อสารในสถิติ - ทฤษฎีและวิธีการ 22: 3287-3304
Nick Cox

1
Ridits สามารถผลักผ่านเช่นปกติหรือฟังก์ชันแบบเกาส์ควอนตัม
Nick Cox
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.