ความสัมพันธ์ระหว่างตัวแปรเด็ดขาด


11

มีจำนวนมากเกี่ยวกับ collinearity ที่เกี่ยวกับการทำนายแบบต่อเนื่อง แต่ไม่มากนักที่ฉันสามารถค้นหาในตัวทำนายแบบหมวดหมู่ ฉันมีข้อมูลประเภทนี้แสดงไว้ด้านล่าง

ปัจจัยแรกคือตัวแปรทางพันธุกรรม (นับอัลลีล) ปัจจัยที่สองคือประเภทของโรค เห็นได้ชัดว่ายีนนำหน้าโรคและเป็นปัจจัยในการแสดงอาการที่นำไปสู่การวินิจฉัย อย่างไรก็ตามการวิเคราะห์อย่างสม่ำเสมอโดยใช้ผลบวกของสี่เหลี่ยมจัตุรัสที่มีประเภท II หรือ III ดังเช่นที่ใช้กันทั่วไปในทางจิตวิทยากับ SPSS คิดถึงผลกระทบที่เกิดขึ้น การวิเคราะห์สแควร์สจำนวนหนึ่งเป็นการวิเคราะห์แบบหยิบมันขึ้นมาเมื่อป้อนคำสั่งที่เหมาะสมเพราะมันขึ้นอยู่กับลำดับ นอกจากนี้มีแนวโน้มว่าจะมีส่วนประกอบเพิ่มเติมในกระบวนการของโรคซึ่งไม่เกี่ยวข้องกับยีนที่ไม่ได้ระบุอย่างดีกับประเภท II หรือ III ดูanova (lm1)ด้านล่าง vs lm2 หรือ Anova

ข้อมูลตัวอย่าง:

set.seed(69)
iv1 <- sample(c(0,1,2), 150, replace=T)
iv2 <- round(iv1 + rnorm(150, 0, 1), 0)
iv2 <- ifelse(iv2<0, 0, iv2)
iv2 <- ifelse(iv2>2, 2, iv2)
dv  <- iv2 + rnorm(150, 0, 2)
iv2 <- factor(iv2, labels=c("a", "b", "c"))
df1 <- data.frame(dv, iv1, iv2)

library(car)
chisq.test(table(iv1, iv2))          # quick gene & disease relations
lm1 <- lm(dv~iv1*iv2, df1);    lm2 <- lm(dv~iv2*iv1, df1)
anova(lm1);                    anova(lm2)
Anova(lm1, type="II");         Anova(lm2, type="II")
  1. lm1กับ type I SS สำหรับฉันดูเหมือนจะเป็นวิธีที่เหมาะสมในการวิเคราะห์ข้อมูลตามทฤษฎีพื้นหลัง สมมติฐานของฉันถูกต้องหรือไม่
  2. ฉันคุ้นเคยกับการออกแบบฉากมุมฉากซึ่งปัญหาเหล่านี้มักไม่ปรากฏขึ้น มันยากที่จะโน้มน้าวให้ผู้ตรวจสอบหรือไม่ว่านี่เป็นกระบวนการที่ดีที่สุด (สมมติว่าจุดที่ 1 ถูกต้อง) ในบริบทของศูนย์กลาง SPSS หรือไม่?
  3. และจะรายงานอะไรในส่วนของสถิติ? การวิเคราะห์พิเศษใด ๆ หรือความคิดเห็นที่ควรเข้าไป?

เป็นเรื่องน่าแปลกใจที่ได้ยินว่ามีคนใช้ SPSS รู้เพียง Type III หรือ II SS และคุณเสียงเช่นนั้น
ttnphns

2
ฉันเคยมีช่องว่างความรู้เดียวกันกับที่ฉันอ้างถึงในคำถามของฉัน ดูเหมือนว่าจะเป็นภาพสะท้อนของความสนใจความรู้และวิธีการที่พวกเขาได้รับการแนะนำให้รู้จักกับซอฟต์แวร์มากกว่าซอฟต์แวร์เอง แต่ตัวเลือกเริ่มต้นเล่นเป็นส่วนใหญ่เช่นกันกับตัวเลือกประเภท III เริ่มต้นที่ใช้ใน SPSS
Matt Albrecht

คุณดูเหมือนจะบอกว่าคุณมีวิธีป้อนตัวทำนาย 2 ตัวในลำดับเฉพาะโดยใช้กระบวนการ anova ของ (SISS) (unianova?) ฉันรู้วิธีระบุลำดับโดยการเปลี่ยนไปใช้ขั้นตอนการถดถอยเท่านั้น คุณจะทำสิ่งนี้ได้อย่างไร
rolando2

คำตอบ:


8

การจับคู่กันระหว่างปัจจัยต่าง ๆ นั้นค่อนข้างซับซ้อน ตัวอย่างคลาสสิกคือสิ่งที่คุณได้รับเมื่อคุณจัดกลุ่มและจำลองตัวจำลองตัวแปรต่อเนื่องสามตัวคือ 'อายุ', 'ระยะเวลา' และ 'ปี' มันถูกวิเคราะห์ใน:

ค่าสัมประสิทธิ์ที่คุณได้รับหลังจากลบการอ้างอิงสี่ (ไม่ใช่สาม) จะถูกระบุถึงแนวโน้มเชิงเส้นที่ไม่รู้จักเท่านั้น สิ่งนี้สามารถวิเคราะห์ได้เพราะ collinearity เกิดขึ้นจาก collinearity ที่รู้จักกันในตัวแปรที่มา (อายุ + ปี = ระยะเวลา)

งานบางชิ้นได้ถูกทำขึ้นด้วยความเชื่อผิด ๆ ระหว่างสองปัจจัย มันได้รับการวิเคราะห์ใน:

ผลที่สุดคือ collinearity ระหว่างตัวแปรเด็ดขาดหมายความว่าชุดข้อมูลจะต้องแบ่งออกเป็นส่วนที่ไม่ได้เชื่อมต่อกับระดับการอ้างอิงในแต่ละองค์ประกอบ ค่าสัมประสิทธิ์โดยประมาณจากส่วนประกอบต่าง ๆ ไม่สามารถเปรียบเทียบได้โดยตรง

สำหรับ collinearities ที่ซับซ้อนมากขึ้นระหว่างปัจจัยสามอย่างหรือมากกว่านั้นสถานการณ์นั้นซับซ้อน มีโพรซีเดอร์อยู่ในการค้นหาฟังก์ชันที่ประมาณค่าได้เช่นการผสมเชิงเส้นของสัมประสิทธิ์ซึ่งสามารถตีความได้เช่นใน:

  • "ในการเชื่อมต่อของการออกแบบคอลัมน์แถว" โดย Godolphin และ Godolphin ใน Utilitas Mathematica (60) pp 51-65

แต่สำหรับความรู้ของฉันไม่มี bullet เงินทั่วไปสำหรับการจัดการ collinearities ในวิธีที่ง่ายอยู่


1

หลังจากคุยกับสถิติผู้คนรอบ ๆ สถานที่แล้ว ดูเหมือนว่าคำถามประเภทนี้อาจไม่ใช่คำถามที่ตอบถูกที่สุด การใช้ ANOVA (หรือวิธีการที่คล้ายกัน) เพื่อตรวจสอบการปฏิสัมพันธ์ทางพันธุกรรมและการวินิจฉัยเกี่ยวกับมาตรการทางจิตวิทยาเมื่อพวกเขามีความสัมพันธ์สูงเป็นคำถามที่ยาก ฉันถูกชี้ไปเพื่อตรวจสอบโครงสร้างของข้อมูลด้วยการสร้างแบบจำลองสมการโครงสร้าง

คำตอบนี้จะได้รับการปรับปรุงเมื่อฉันเรียนรู้เพิ่มเติมเกี่ยวกับ SEM

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.