หนึ่งสามารถลดจำนวนของสินค้าใน Likert-scale ที่เผยแพร่ได้อย่างถูกต้องหรือไม่?


11

[แก้ไขเพื่อตอบกลับ feedback- ขอบคุณ :-)]

Doh! แก้ไขเพิ่มเติม! ขออภัย!

สวัสดี-

ฉันกำลังทำการรวบรวมข้อมูลที่ค่อนข้างหยาบและพร้อมกับการสำรวจที่ส่งไปยังเจ้าหน้าที่ดูแลสุขภาพโดยใช้สเกลที่ตีพิมพ์เกี่ยวกับขวัญกำลังใจและปัญหาอื่น ๆ

สิ่งเดียวคือเครื่องชั่งค่อนข้างยาวกับสิ่งอื่น ๆ ทั้งหมดในแบบสำรวจและฉันต้องการลดขนาดของมันโดยการลดขนาดย่อยแต่ละอันครึ่งและใช้เพียงครึ่งรายการ สัญชาตญาณของฉันคือสิ่งนี้ดีเนื่องจาก subscales มีความสัมพันธ์ระหว่างกันและแม้ว่ามันจะไม่เหมาะสำหรับการวิจัยมาตรฐานการตีพิมพ์ แต่ก็ไม่เป็นไรสำหรับการค้นหาข้อเท็จจริงภายในองค์กร

ฉันสงสัยว่าใครมีความคิดใด ๆ เกี่ยวกับความถูกต้องของการทำสิ่งผิดพลาดหรือสิ่งอื่นใด โดยเฉพาะอย่างยิ่งการอ้างอิงที่ได้รับสุดซึ้งเพราะเพื่อนร่วมงานของฉันจะต้องมีความเชื่อมั่น!

ขอบคุณมาก Chris B

edits-

ใช่มันเป็นเครื่องชั่งที่ผ่านการตรวจสอบแล้วซึ่งมีคุณสมบัติของไซโครเมท

มันมีมิติเดียวและมีระดับย่อยถ้าเป็นวิธีที่ถูกต้อง

ฉันจะทำงานที่ระดับย่อยและยอดรวมไม่ใช่รายการระดับ

30 รายการอาจจะประมาณ 40-60 คน

ไชโย!


นี่เป็นมาตราส่วนที่ผ่านการตรวจสอบแล้วโดยมีคุณสมบัติทางไซโครเมทที่รู้จักหรือไม่?
chl

สวัสดีคริสดังนั้นคุณจะไม่ลดจำนวนของรายการในระดับ likert แต่ใช้คำถาม / รายการน้อยลง (ซึ่งวัดจากระดับ likert) โดยทั่วไปดูเหมือนว่าจะขึ้นอยู่กับมาตรการของคุณ คุณสามารถตรวจสอบความสัมพันธ์ของรายการที่คุณตั้งใจจะลงกับสิ่งที่คุณกำลังรักษา จริง ๆ แล้วมันเป็นวิธีที่น่าสนใจในการวัดจำนวนที่จะลบออก - มันอาจคุ้มค่าที่จะใส่กรอบคำถามใหม่อีกครั้งด้วยวิธีนี้ (ถ้าคุณทำไม่ได้ เป็นคำถามที่ดี :)
Tal Galili

คำถามเพิ่มเติมที่สาม: (1) นี่คือมาตราส่วนแบบสามมิติหรือมีหลาย subscales, (2) หมายเลขบุคคลและจำนวนรายการคืออะไรและ (3) คุณทำงานในระดับของรายการหรือทั้งหมด หรือคะแนนเฉลี่ย?
chl

คำตอบ:


11

แม้ว่าจะยังมีข้อมูลบางส่วนที่ขาด (บุคคลและรายการต่อ subscale) นี่คือคำแนะนำทั่วไปเกี่ยวกับการลดขนาด นอกจากนี้เนื่องจากคุณกำลังทำงานในระดับแบบสอบถามฉันไม่เห็นว่าทำไมความยาวของมันถึงสำคัญมาก (หลังจากนั้นคุณจะให้สถิติสรุปเช่นคะแนนรวมหรือคะแนนเฉลี่ย)

ฉันจะสมมติว่า (a) คุณมีชุดของรายการ K ที่วัดโครงสร้างบางอย่างที่เกี่ยวข้องกับขวัญกำลังใจ (b) สเกล "unidimensional" ของคุณเป็นปัจจัยอันดับสองที่อาจถูกแบ่งย่อยเป็นแง่มุมต่าง ๆ (c) คุณต้องการ ลดขนาดของคุณเป็น k <K รายการเพื่อสรุปผลคะแนนมาตราส่วนโดยรวมที่ถูกต้องของผู้ทดสอบที่ถูกต้องในขณะที่รักษาความถูกต้องของเนื้อหาของสเกล

เกี่ยวกับความถูกต้องของเนื้อหา / โครงสร้างของของขนาดที่ผ่านการตรวจสอบแล้ว: มีการเลือกจำนวนรายการอย่างแน่นอนเพื่อให้สะท้อนถึงโครงสร้างของดอกเบี้ยที่ดีที่สุด ด้วยการทำให้แบบสอบถามสั้นลงคุณกำลังลดความครอบคลุมของโครงสร้าง มันจะเป็นการดีที่จะตรวจสอบว่าโครงสร้างปัจจัยยังคงเหมือนเดิมเมื่อพิจารณาเพียงครึ่งหนึ่งของรายการ (ซึ่งอาจส่งผลกระทบต่อวิธีการเลือกพวกเขาหลังจากทั้งหมด) ซึ่งสามารถทำได้โดยใช้เทคนิค FA ดั้งเดิม คุณมีความรับผิดชอบในการตีความสเกลด้วยจิตวิญญาณที่คล้ายคลึงกับของผู้แต่ง

เกี่ยวกับความน่าเชื่อถือของคะแนน : แม้ว่าจะเป็นการวัดที่ขึ้นกับตัวอย่างความน่าเชื่อถือของคะแนนจะลดลงเมื่อลดจำนวนรายการ (เช่นสูตรสเปียร์แมน - บราวน์ ) อีกวิธีในการดูนั่นคือข้อผิดพลาดมาตรฐานของการวัด (SEM) จะเพิ่มขึ้น แต่ดูโมดูลการสอน NCME เกี่ยวกับข้อผิดพลาดมาตรฐานของการวัดโดย Leo M Harvill จำเป็นต้องพูดมันใช้กับตัวบ่งชี้ทุกตัวที่ขึ้นอยู่กับจำนวนของรายการ (เช่นอัลฟาของ Cronbach ซึ่งสามารถใช้ในการประเมินความน่าเชื่อถือรูปแบบเดียวคือความสอดคล้องภายใน) หวังว่านี่จะไม่ส่งผลกระทบใด ๆ ต่อการเปรียบเทียบระหว่างกลุ่มตามคะแนนดิบ

ดังนั้นคำแนะนำของฉัน (วิธีที่ง่ายที่สุด) คือ:

  1. เลือกรายการของคุณเพื่อเพิ่มความครอบคลุมการสร้าง ตรวจสอบมิติข้อมูลด้วย FA และความครอบคลุมด้วยการแจกแจงคำตอบที่ไม่แปรเปลี่ยน
  2. เปรียบเทียบความสัมพันธ์ระหว่างค่าเฉลี่ยกับค่าที่รายงานก่อนหน้านี้
  3. คำนวณความสอดคล้องภายในสำหรับสเกลเต็มและคอมโพสิตของคุณ ตรวจสอบว่าพวกเขาเห็นด้วยกับสถิติที่เผยแพร่ในระดับเดิม (ไม่จำเป็นต้องทดสอบอะไรเลยนี่คือมาตรการที่ขึ้นกับตัวอย่าง)
  4. ทดสอบความสัมพันธ์เชิงเส้น (หรือ polychoric หรืออันดับ) ระหว่างคะแนนดั้งเดิมและลด (ย่อย) เพื่อให้แน่ใจว่าพวกเขาจะเปรียบเทียบได้ (เช่นที่ตำแหน่งบุคคลที่อยู่ในลักษณะแฝงไม่แตกต่างกันมากในขณะที่คัดค้านผ่านคะแนนดิบ );
  5. หากคุณมีตัวแปรเฉพาะเรื่องภายนอก (เช่นเพศอายุหรือการวัดที่เกี่ยวข้องกับขวัญกำลังใจที่ดีที่สุด) ให้เปรียบเทียบความตรงของกลุ่มที่รู้จักระหว่างสองรูปแบบ

วิธีที่ยากคือการพึ่งพาทฤษฎีการตอบสนองของรายการเพื่อเลือกรายการเหล่านั้นที่มีข้อมูลสูงสุดเกี่ยวกับลักษณะการลดขนาดแฝง - จริง ๆ แล้วเป็นหนึ่งในแอปพลิเคชันที่ดีที่สุด รุ่นสำหรับรายการพหุวิภาคได้อธิบายไว้บางส่วนในหัวข้อนี้Validating แบบสอบถาม

อัปเดตหลังจากอัปเดตครั้งที่ 2 ของคุณ

  1. ลืมเกี่ยวกับ IRT ทุกรุ่นสำหรับรายการที่มีหลายองค์ประกอบที่มีวัตถุไม่กี่ตัว
  2. การวิเคราะห์ปัจจัยจะประสบกับขนาดตัวอย่างที่ต่ำเช่นนั้น คุณจะได้รับการประมาณการการโหลดปัจจัยที่ไม่น่าเชื่อถือ
  3. 30 รายการหารด้วย 2 = 15 รายการ (มันง่ายที่จะเข้าใจการเพิ่มขึ้นของ SEM ที่สอดคล้องกันสำหรับคะแนนรวม) แต่มันจะแย่ลงถ้าคุณพิจารณา subscales (นี่เป็นคำถามที่สองของฉัน - ไม่ใช่รายการ ต่อหนึ่งระดับย่อยหากมี)

8

ฉันเดาว่าไม่มีคำตอบ "ใช่ / ไม่ใช่" ชัดเจนสำหรับคำถามของคุณ ถ้าคุณปล่อยรายการจากมาตราส่วนย่อยโดยพลการเพื่อสร้างแบบฟอร์มสั้น ๆ ของแบบสอบถามต้นฉบับคุณจะสูญเสียการตรวจสอบ psychometric ของแบบฟอร์มที่ยาว สิ่งที่สามารถเปลี่ยนแปลงได้คือโครงสร้างแฟคทอเรียลของแบบสอบถามความน่าเชื่อถือของมาตราส่วนย่อยความสัมพันธ์แบบรวมรายการ ฯลฯ (คุณจะสังเกตว่าฉันคุ้นเคยกับการคิดทฤษฎีการทดสอบแบบดั้งเดิมไม่ใช่ IRT) นอกจากนี้คุณไม่สามารถใช้มาตรฐานเดิมของแบบสอบถามได้ นั่นเป็นเหตุผลที่แบบสอบถามสั้นที่สร้างขึ้นต้องผ่านขั้นตอนการตรวจสอบความถูกต้องแยกต่างหาก

ทั้งนี้ขึ้นอยู่กับความต้องการของคุณทั้งหมดจะไม่หายไป คุณอาจไม่ต้องการมาตรฐานเพราะคุณอาจต้องการเปรียบเทียบผลลัพธ์ในตัวอย่างของคุณโดยไม่ต้องทำการตัดสินแบบ "สมบูรณ์" ด้วยความเคารพต่อประชากรอ้างอิง IMHO จะเป็นข้อดีถ้าคุณมีโอกาสตรวจสอบแบบฟอร์มสั้นด้วยแบบฟอร์มดั้งเดิมอย่างน้อยสำหรับกลุ่มย่อยของกลุ่มของคุณ นี่อาจทำให้คุณเห็นว่าผลลัพธ์คล้ายกันหรือไม่

แม้ว่าโดยทั่วไปแล้วผลลัพธ์ของแบบสอบถามอาจมีความอ่อนไหวอย่างน่าประหลาดใจต่อองค์ประกอบรายการ ผู้คนไม่กรอกแบบสอบถามอย่างเป็นหุ่นยนต์ แต่ตั้งสมมติฐานโดยปริยายและการอนุมานทางปัญญาทุกประเภท: "สิ่งนี้เกี่ยวกับอะไรจริง ๆ ?", "ฉันคาดหวังอะไรที่จะรายงานที่นี่", "พวกเขาต้องการทราบอะไรจริง ๆ " สิ่งนี้สามารถได้รับอิทธิพลอย่างมากจากบริบทที่กำหนดของรายการ cf Schwarz, N. 1996. ความรู้ความเข้าใจและการสื่อสาร: อคติการตัดสินวิธีการวิจัยและตรรกะของการสนทนา Mahwah, NJ: Lawrence Erlbaum


4

ฉันจะเพิ่มจุดหนึ่ง

ตระหนักถึงความแตกต่างระหว่างกลุ่ม (เช่นการเปรียบเทียบกลุ่มหมายถึงช่วงเวลา) และการวัดระดับบุคคล (เช่นคะแนนความสัมพันธ์ในระดับกับเกล็ดอื่น ๆ ในระดับบุคคล)

ความน่าเชื่อถือมีความแตกต่างกับสองระดับ บางทีการทำให้เข้าใจง่ายต่อไปนี้อาจช่วยได้:

  • ความน่าเชื่อถือของการวัดระดับกลุ่มได้รับอิทธิพลอย่างมากจากจำนวนผู้เข้าร่วมที่คุณมีและระดับที่มีความแปรปรวนที่แท้จริงในระดับกลุ่ม
  • ความน่าเชื่อถือของการวัดระดับบุคคลนั้นขึ้นอยู่กับจำนวนของรายการที่คุณมีและระดับที่แต่ละคนแตกต่างกันอย่างแท้จริง

2
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.