วิธีการปฏิบัติต่อจุดข้อมูลหลาย ๆ จุดอย่างถูกต้องในแต่ละหัวข้อ


10

ขณะนี้ฉันกำลังเถียงกับใครบางคนเกี่ยวกับวิธีการปฏิบัติต่อข้อมูลอย่างถูกต้องด้วยการวัดที่หลากหลายสำหรับแต่ละเรื่อง ในกรณีนี้ข้อมูลจะถูกรวบรวมสำหรับแต่ละเรื่องภายในเวลาอันสั้นสำหรับเงื่อนไขที่แตกต่างกันในแต่ละเรื่อง การวัดทั้งหมดรวบรวมตัวแปรเดียวกันอย่างแน่นอนเพียงหลายค่า

ทางเลือกหนึ่งในขณะนี้คือการจัดกลุ่มข้อมูลตามเงื่อนไขและไม่สนใจว่าจุดข้อมูลหลายจุดมาจากเรื่องเดียว อย่างไรก็ตามจุดข้อมูลจากแต่ละเรื่องอาจไม่เป็นอิสระอย่างสมบูรณ์

อีกทางเลือกหนึ่งคือการใช้ค่าเฉลี่ยของการวัดทั้งหมดสำหรับแต่ละเงื่อนไขจากแต่ละเรื่องแล้วเปรียบเทียบค่าเฉลี่ย อย่างไรก็ตามสิ่งนี้อาจส่งผลกระทบต่อความสำคัญเนื่องจากในการวิเคราะห์ขั้นสุดท้ายไม่ได้นำมาพิจารณาว่าหมายถึงมีข้อผิดพลาดน้อยลง

คุณจะวิเคราะห์ข้อมูลดังกล่าวได้อย่างถูกต้องอย่างไร? สิ่งนี้ได้รับการดูแลใน SPSS หรือไม่? โดยหลักการแล้วมันควรจะเป็นไปได้ที่จะคำนวณระยะขอบข้อผิดพลาดเมื่อทำการคำนวณค่าเฉลี่ยและมากกว่าการพิจารณาในการวิเคราะห์ขั้นสุดท้าย แต่ฉันไม่คิดว่า SPSS กำลังทำการคำนวณนี้อยู่ด้านหลังของฉัน


1
นี่เป็นมาตรการที่ออกแบบซ้ำ ๆ กันเพื่อให้แต่ละวิชาทำงานในเงื่อนไขทั้งหมดหรือหลายเงื่อนไขหรือไม่? หรือเป็นเพียงกลุ่มอิสระหรือมาตรการออกแบบที่แต่ละวิชาอยู่ในสภาพเดียว
John

ในการออกแบบนี้แต่ละวิชาวิ่งในทุกสภาวะ อย่างไรก็ตามมีบางจุดข้อมูลซึ่งจะต้องถูกปฏิเสธเพราะวิชาล้มเหลวในงานที่มือ ไม่น่าเป็นไปได้ที่หัวเรื่องจะล้มเหลวในงานย่อยทั้งหมดสำหรับเงื่อนไขเดียว (มีการทำซ้ำประมาณ 40 ครั้งต่อเงื่อนไข) ดังนั้นส่วนใหญ่แต่ละวิชาจะมีจุดข้อมูลสำหรับเงื่อนไขทั้งหมด
LiKao

คำตอบ:


9

มันจะเป็นการละเมิดความเป็นอิสระในการ "จัดกลุ่มข้อมูลตามเงื่อนไขและไม่สนใจว่าจุดข้อมูลหลายจุดมาจากเรื่องเดียว" นั่นคือการไม่ไป วิธีหนึ่งคือ "ใช้ค่าเฉลี่ยของการวัดทั้งหมดสำหรับแต่ละเงื่อนไขจากแต่ละเรื่องแล้วเปรียบเทียบค่าเฉลี่ย" คุณสามารถทำเช่นนั้นได้คุณจะไม่ละเมิดความเป็นอิสระ แต่คุณกำลังสูญเสียข้อมูลบางอย่างในการรวมตัวกับวิธีการระดับหัวเรื่อง

บนใบหน้าของมันฟังดูเหมือนการออกแบบแบบผสมที่มีเงื่อนไขระหว่างตัวแบบและช่วงเวลาต่าง ๆ ที่วัดได้ภายในตัวแบบ อย่างไรก็ตามนั่นทำให้เกิดคำถามขึ้นทำไมคุณรวบรวมข้อมูลในหลาย ๆ จุด ผลของเวลาหรือความก้าวหน้าของตัวแปรเมื่อเวลาผ่านไปคาดว่าจะแตกต่างกันระหว่างเงื่อนไขหรือไม่ หากคำตอบคือใช่สำหรับคำถามใดคำถามหนึ่งจากนั้นให้โครงสร้างของข้อมูลฉันคาดหวังว่าสิ่งที่คุณสนใจคือ ANOVA แบบผสม ANOVA แบบผสมจะแบ่งความแปรปรวนของหัวเรื่องออกจาก SSTotal "ด้านหลังของคุณ" เหมือนเดิม แต่การแบ่งพาร์ติชันนั้นช่วยให้คุณทดสอบเงื่อนไขของอาสาสมัครหรือไม่ขึ้นอยู่กับปัจจัยอื่น ๆ

อย่างไรก็ตามใน SPSS / PASW 18 วิเคราะห์ -> โมเดลเชิงเส้นทั่วไป -> การวัดซ้ำ คุณจะมีหนึ่งแถวสำหรับแต่ละหัวเรื่องและหนึ่งคอลัมน์สำหรับแต่ละจุดและแต่ละแถวเป็นตัวระบุเงื่อนไข ตัวระบุเงื่อนไขจะเข้าสู่ส่วน "ระหว่าง" และมาตรการซ้ำ ๆ จะได้รับการดูแลเมื่อคุณกำหนดปัจจัยการวัดซ้ำ


ตกลงนี่คือสิ่งที่ฉันคิด จุดข้อมูลหลายจุดต่อเงื่อนไขถูกรวบรวมด้วยเหตุผลสองประการ หนึ่งคือข้อมูลควรมีความน่าเชื่อถือมากขึ้นด้วยวิธีนี้ อีกเหตุผลหนึ่งคือต้องทิ้งบางจุดข้อมูล (วิชาไม่ปฏิบัติตามคำแนะนำอย่างถูกต้องตลอดเวลา) เงื่อนไขนั้นสมบูรณ์ในวิชาดังนั้นเราจึงไม่ได้มีการออกแบบผสมในกรณีนี้เลย น่าเสียดายที่การวัดซ้ำเกิดขึ้นเนื่องจากเรามีการทำซ้ำประมาณ 40 ครั้งต่อเงื่อนไขในแต่ละเรื่อง จำนวนการทำซ้ำที่สูงอย่างไรก็ตามหมายถึงเราสูญเสียข้อมูลจำนวนมากเมื่อใช้ค่าเฉลี่ย
LiKao

ถ้าอย่างนั้นฉันขอแนะนำคำตอบของจอห์น แบบผสมน่าจะดีกว่า ที่สามารถจำลองทั้งค่าเฉลี่ยและความแปรปรวนภายในแต่ละเรื่องและให้ความเคารพในการซ้อน ประเด็นหนึ่งที่มีการวิเคราะห์เช่นนี้ก็คือความถูกต้องขององศาอิสระนั้นไม่ชัดเจนและเกณฑ์สำหรับนัยสำคัญทางสถิติก็ไม่ชัดเจน ตรงกันข้ามกับรหัสที่ระบุของ John ฉันขอแนะนำให้ปรับความชันแบบสุ่มสำหรับเอฟเฟกต์สภาพของคุณ ฉันเห็นการจำลองบางอย่างที่แนะนำว่าไม่สามารถทำได้อาจเพิ่มอัตราความผิดพลาด Type I ของคุณ
russellpierce

4

การออกแบบมาตรการซ้ำ ๆ เป็นวิธีดั้งเดิมในการจัดการสิ่งนี้ตามที่ drknexus กล่าวถึง เมื่อทำการวิเคราะห์เช่นนั้นคุณจะต้องรวมคะแนน / เงื่อนไข / หัวเรื่องหนึ่งเรื่อง มันละเอียดอ่อนต่อการละเมิดสมมติฐานเกี่ยวกับความกลมและปัญหาอื่น ๆ อย่างไรก็ตามเทคนิคที่ทันสมัยกว่าคือการใช้การสร้างแบบจำลองหลายระดับหรือเอฟเฟ็กต์แบบผสม การใช้เทคนิคนี้คุณไม่ได้รวบรวมข้อมูล มีวิธีการรักษาหลายอย่าง แต่ตอนนี้ฉันยังไม่ทราบวิธีการสอนพื้นฐานที่ดีที่สุด Baayen (2008) บทที่ 7 เป็นสิ่งที่ดี Pinheiro & Bates (2000) เป็นสิ่งที่ดีมาก แต่จากเสียงของสิ่งต่าง ๆ ทำตามคำแนะนำของพวกเขาในบทนำและอ่านบิตที่แนะนำสำหรับผู้เริ่มต้น

หากคุณต้องการเพียงแค่รับผลลัพธ์สไตล์ ANOVA สมมติว่าข้อมูลทั้งหมดของคุณอยู่ในรูปแบบยาว (หนึ่งบรรทัด / จุดข้อมูล) และคุณมีคอลัมน์ที่ระบุหัวข้อการตอบสนอง (y) และตัวแปรเงื่อนไข (x) คุณสามารถลอง ดูบางอย่างเช่นนี้ใน R (ตรวจสอบให้แน่ใจว่าติดตั้งแพ็คเกจ lme4)

library(lme4)
dat <- read.table('myGreatData.txt', header = TRUE)
m <- lmer( y ~ x + (1|subject), data = dat)
summary(m)
anova(m)

แน่นอนคุณสามารถมีคอลัมน์ตัวแปรเงื่อนไขอื่น ๆ อีกมากมายบางทีอาจมีปฏิสัมพันธ์ จากนั้นคุณอาจเปลี่ยนคำสั่ง lmer เป็น ...

m <- lmer( y ~ x1 * x2 + (1|subject), data = dat)

(BTW ฉันเชื่อว่าการไม่รวมตัวกันในมาตรการซ้ำ ๆ เพื่อเพิ่มอำนาจเป็นการเข้าใจผิดอย่างเป็นทางการใคร ๆ ก็จำชื่อได้)


ฉันคิดว่าการเข้าใจผิดที่ล้มเหลวในการรวมและใช้ df จากจำนวนคำตอบมากกว่าจำนวนเรื่องเป็นการละเมิดความเป็นอิสระ อีกวิธีหนึ่ง (ฉันคิดว่า) มันอาจจะคิดว่าการอนุมานที่ระดับของการตอบสนองแต่ละรายการสำหรับชุดวิชาคงที่
russellpierce
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.