วิธีการทดสอบเอฟเฟกต์ปฏิสัมพันธ์กับการทดสอบที่ไม่ใช่พารามิเตอร์ (เช่นการทดสอบการเปลี่ยนแปลง)


10

ฉันมีตัวแปรเด็ดขาด / สองเล็กน้อย แต่ละคนสามารถรับค่าที่แตกต่างกันเพียงสองค่าเท่านั้น (ดังนั้นฉันจึงมีทั้งหมด 4 แบบ)

การรวมกันของค่าแต่ละค่ามาพร้อมกับชุดของค่าตัวเลข ดังนั้นฉันมีตัวเลข 4 ชุด เพื่อให้เป็นรูปธรรมมากขึ้นขอให้เราบอกว่าฉันมีmale / femaleและyoung / oldเป็นตัวแปรที่กำหนดและฉันมีweight"เอาท์พุท" เชิงตัวเลข

ฉันรู้ว่าการเปลี่ยนจากmaleเป็นfemaleเปลี่ยนน้ำหนักเฉลี่ยและการเปลี่ยนแปลงเหล่านี้มีนัยสำคัญทางสถิติ ดังนั้นฉันสามารถคำนวณgenderปัจจัย เช่นเดียวกับageตัวแปร ฉันรู้ว่าการเปลี่ยนจากyoungเป็นoldเปลี่ยนน้ำหนักเฉลี่ยและฉันสามารถคำนวณageปัจจัยที่เกี่ยวข้องได้

ตอนนี้สิ่งที่ฉันต้องการดูว่าข้อมูลพิสูจน์ให้เห็นว่าการเปลี่ยนจากหญิงสาวเป็นชายชราเป็นมากกว่าการรวมกันของเพศ - และปัจจัยอายุ กล่าวอีกนัยหนึ่งฉันต้องการทราบว่าข้อมูลพิสูจน์ว่ามี "เอฟเฟ็กต์ 2 มิติ" หรือกล่าวอีกนัยหนึ่งว่าเอฟเฟกต์อายุและเพศไม่ได้เป็นอิสระ ตัวอย่างเช่นอาจเป็นเรื่องเก่าสำหรับผู้ชายที่เพิ่มน้ำหนักตามปัจจัย 1.3 และสำหรับผู้หญิงปัจจัยที่เกี่ยวข้องคือ 1.1

แน่นอนฉันสามารถคำนวณสองปัจจัยที่กล่าวถึง (ปัจจัยอายุสำหรับผู้ชายและปัจจัยอายุสำหรับผู้หญิง) และพวกเขาจะแตกต่างกัน แต่ฉันต้องการคำนวณนัยสำคัญทางสถิติของความแตกต่างนี้ ความแตกต่างนี้จริงแค่ไหน

ฉันต้องการทำแบบทดสอบที่ไม่ใช่พารามิเตอร์หากเป็นไปได้ เป็นไปได้ไหมที่จะทำสิ่งที่ฉันต้องการจะทำโดยการผสมทั้งสี่เซตสับมันแบ่งอีกครั้งและคำนวณบางอย่าง


2
ความยากลำบากอย่างหนึ่งในการจัดการกับปฏิสัมพันธ์ที่ไม่ใช่พารามิเตอร์คือการเปลี่ยนแปลงแบบโมโนโทนิของการตอบสนองสามารถลบการโต้ตอบที่มีอยู่ชักนำให้เกิดการปฏิสัมพันธ์ที่มันหายไปหรือพลิกทิศทางของการโต้ตอบ นี่เป็นการชี้ให้เห็นว่าวิธีการตามอันดับนั้นอาจไม่สามารถทำในสิ่งที่คุณคาดหวังได้
Glen_b -Reinstate Monica

ด้วยการทดสอบการเปลี่ยนแปลงในตัวแปรดั้งเดิมคุณไม่มีปัญหา แต่ปรากฎว่าไม่มีการทดสอบที่แน่นอนสำหรับการโต้ตอบ คุณสามารถรับการทดสอบโดยประมาณได้
Glen_b -Reinstate Monica

คำตอบ:


5

มีการทดสอบแบบไม่มีพารามิเตอร์สำหรับการโต้ตอบ คุณพูดแทนที่น้ำหนักที่สังเกตได้จากอันดับของพวกเขาและรักษาชุดข้อมูลผลลัพธ์เป็น ANOVA heteroskedastic ดูที่ "วิธีการแบบไม่มีพารามิเตอร์ในการออกแบบแบบแฟคทอเรียล" โดย Brunner และ Puri (2001)

อย่างไรก็ตามชนิดของการโต้ตอบแบบไม่มีพารามิเตอร์ที่คุณสนใจไม่สามารถแสดงในหมวดหมู่ทั่วไปนี้ได้ คุณพูดว่า:

กล่าวอีกนัยหนึ่งฉันต้องการทราบว่าข้อมูลพิสูจน์ว่ามี "เอฟเฟ็กต์ 2 มิติ" หรือกล่าวอีกนัยหนึ่งว่าเอฟเฟกต์อายุและเพศไม่ได้เป็นอิสระ ตัวอย่างเช่นอาจเป็นเรื่องเก่าสำหรับผู้ชายที่เพิ่มน้ำหนักตามปัจจัย 1.3 และสำหรับผู้หญิงปัจจัยที่เกี่ยวข้องคือ 1.1

หลังเป็นไปไม่ได้ การทำงานร่วมกันแบบไม่มีพารามิเตอร์จะต้องเกี่ยวข้องกับการเปลี่ยนสัญญาณกล่าวคือการเพิ่มน้ำหนักตัวผู้เพิ่มขึ้น แต่การลดน้ำหนักตัวเมีย การเปลี่ยนเครื่องหมายดังกล่าวยังคงอยู่แม้ว่าคุณจะเปลี่ยนน้ำหนักอย่างน่าเบื่อ แต่คุณสามารถเลือกการแปลงแบบซ้ำซากกับข้อมูลที่แม็พการเพิ่มน้ำหนักตามปัจจัย 1.1 ใกล้เคียงกับที่คุณต้องการเป็น 1.3 แน่นอนคุณจะไม่แสดงความแตกต่างอย่างมีนัยสำคัญหากสามารถใกล้เคียงกับที่คุณต้องการ

หากคุณสนใจการโต้ตอบโดยไม่มีการเปลี่ยนแปลงเครื่องหมายคุณควรยึดการวิเคราะห์ตามปกติ การแปลงแบบซ้ำซากจำเจที่ไม่อนุญาตให้ "กลืนความแตกต่าง" แน่นอนว่านี่เป็นอีกสิ่งที่คุณควรคำนึงถึงโดยการสร้างแบบจำลองและตีความสถิติของคุณ


1

หากคุณเชื่อว่าผลกระทบของอายุและเพศที่มีมากกว่าเพียงแค่ผลกระทบที่แต่ละท่านอาจจะพิจารณารูปแบบγWอีผมก.ชั่วโมงเสื้อผม=αaก.อีผม+βก.อีndอีRผม+γ(ก.อีndอีRผมaก.อีผม).γสัมประสิทธิ์จับขนาดของผล "2D" ของอายุและเพศ คุณสามารถตรวจสอบเสื้อสถิติของที่จะได้รับความคิดที่หยาบกับว่าγคุณสังเกตในรูปแบบของคุณอย่างมีนัยสำคัญที่แตกต่างจากγ = 0γγγ=0

นี่เป็นตัวอย่างกราฟิกหยาบมากที่จะแสดงสิ่งที่เพิ่มเติมนี้คูณระยะไม่genderiagei

ในโมเดลเราจะพยายามใส่ไฮเปอร์เพลนแบบง่าย ๆ เข้ากับข้อมูลresponse=x1+x2

ป้อนคำอธิบายรูปภาพที่นี่

นี่คือรูปแบบเป็นเส้นตรงในโควาเรียตดังนั้นรูปร่างเชิงเส้นที่คุณเห็นในพล็อตด้านบน

ในทางกลับกันโมเดลนั้นไม่เป็นเชิงเส้นในx 1และx 2และด้วยเหตุนี้จึงอนุญาตให้มีความโค้งบางระดับresponse=x1+x2+x1x2x1x2

ป้อนคำอธิบายรูปภาพที่นี่

ความล้มเหลวในการปฏิเสธสมมติฐานที่ว่านั้นไม่เหมือนกับการปฏิเสธว่ามีความโค้งของรูปแบบนี้ในแบบจำลองγ=0

ในแง่ของการทดสอบที่ไม่ใช่ตัวแปรที่คุณสามารถทำสิ่งที่ตามเส้นของสิ่งที่คุณได้รับการแนะนำโดยบูตข้อผิดพลาดมาตรฐานสำหรับγซึ่งหมายความว่าหลายครั้งที่คุณ: 1) ตัวอย่างข้อมูลของคุณด้วยการเปลี่ยน 2) คำนวณโหมดเชิงเส้น 3) ได้รับการประมาณการγ หลังจากที่คุณได้ประมาณการหลายγ , คุณสามารถใช้50 ± P % quantile การตั้งค่าที่ไม่ใช่ตัวแปร2 P %ช่วงความเชื่อมั่นγ สำหรับข้อมูลเพิ่มเติมเกี่ยวกับเรื่องนี้ google "bootstrap ข้อผิดพลาดมาตรฐาน"γγ^γ^50±p%2p%γ


สิ่งนี้จะเป็นแบบไม่เป็นเชิงเส้นได้อย่างไรหาก x1 และ x2 สามารถรับค่าเป็น 0 หรือ 1 ได้เท่านั้น แกมม่าในตัวอย่างของคุณจะอธิบายความโค้งในรูปแบบใดได้อย่างไร
5ayat

มันไม่สำคัญว่าสิ่งที่โดเมนคือมันยังไม่ใช่เชิงเส้นเพราะฟังก์ชั่นที่ไม่สามารถเขียนเป็นเส้นตรงกันของการขัดแย้งของมัน (เช่น ) สำหรับจุดที่สองของคุณสังเกตว่าฉันพูดอย่างระมัดระวังว่า "เป็นตัวอย่างกราฟิกที่หยาบมาก" นี่คืออะนาล็อกอย่างต่อเนื่องของกรณีไบนารี αR2:x1+x2+x1x2=i=12αixผม
Mustafa S Eisa

ฉันจะเพิ่มอย่างไรก็ตามว่าเมื่อโดเมนเป็นเลขฐานสอง (ซึ่งเป็นเช่นจุดยอดของคิวบ์ 2D) คุณสามารถรักษาฟังก์ชันนี้เป็นเส้นตรงได้ แต่รูปแบบการทำงานนั้นไม่ใช่แบบเส้นตรงอย่างเคร่งครัด
Mustafa S Eisa

@ MustafaMEisa ฉันไม่เคยเห็นคำศัพท์โต้ตอบในโมเดลเชิงเส้นที่อธิบายในแง่ของ "จุดยอดของลูกบาศก์สองมิติ" มันจะเป็นข้อมูลถ้าคุณสามารถทำอย่างละเอียด
5ayat

@ HorstGrünbuschฉันก็อยากรู้อยากเห็นเกี่ยวกับความคิดเห็นของคุณในคำตอบนี้เพราะคุณได้ให้ความเห็นที่เป็นประโยชน์กับคำตอบของฉันแล้ว
5ayat

1

ดังที่คนอื่น ๆ ตั้งข้อสังเกตสิ่งนี้สามารถจำลองแบบเชิงเส้นด้วยการโต้ตอบ คุณกำลังโต้ตอบกับหุ่นสองตัวและไม่มีสิ่งใดเป็นเส้นตรงเกี่ยวกับเรื่องนี้ ให้แบบจำลอง: ผลกระทบส่วนเพิ่ม 'เพศ' เป็นอนุพันธ์บางส่วน:

wt=α+b1age+b2gender+b3agegender+ε

wtgender=b2+b3agอี

มาดูกันว่าเพศและอายุสามารถรับค่า 0 หรือ 1 ได้หรือไม่เรากำลังมองหาความแตกต่างของกลุ่มสี่กลุ่มเท่านั้น? นั่นคือเรามีเพียงสี่แตกต่างกันเราสามารถเสียบเข้ากับสมการข้างต้น (1) และกรัมE = 0 (2) กรัมE n d อีR = 1และกรัมe = 1 , (3) g e n d e r = 0และa g egender=0age=0gendอีR=1aก.อี=1ก.อีndอีR=0และ (4)กรัมE n d อีR = 1และกรัมE = 0 ดังนั้นตัวอย่างเฉพาะของคุณเทียบเท่ากับการเปรียบเทียบระหว่างค่าเฉลี่ยสี่กลุ่มaก.อี=1ก.อีndอีR=1aก.อี=0

นอกจากนี้ยังอาจเป็นประโยชน์ในการดูการสนทนานี้เพื่อทำความเข้าใจว่าข้างต้นเทียบเท่ากับ ANOVA กับตัวแปรระบุสองแบบ เป็นวิธีที่จะย้ำความจริงที่ว่ามีตัวอย่างที่เฉพาะเจาะจงของคุณ (อีกครั้งเพราะมีเพียงสี่ผสมเป็นไปได้ของอายุและเพศ) เราสามารถระบุรูปแบบเช่นต่อไปนี้โดยไม่ต้องเป็นคำที่มีปฏิสัมพันธ์อย่างชัดเจนอื่น:

wt=α+b1young.male+b2old.male+b3young.female+ε

ที่ไหนถูกละไว้เป็นหมวดหมู่การอ้างอิงของคุณและสำหรับตัวอย่างเช่นค่าสัมประสิทธิ์1จะมีความแตกต่างในวิธีการระหว่างo L d อีเอ็มลิตรอีและY o U n กรัม ม. ลิตรอี ที่ตัดαยังจะเท่ากับค่าเฉลี่ยW Tภายในo L d f eโอล.d.อีม.aล.อี1โอล.d.อีม.aล.อีYโอยูnก..ม.aล.อีαWเสื้อ (อีกครั้งคือหมวดอ้างอิง)โอล.d.อีม.aล.อี

ลองใช้กับข้อมูลของคุณเอง ด้วยโมเดลเชิงเส้นที่มีการโต้ตอบ ANOVA ที่มีการโต้ตอบหรือใช้หุ่นสำหรับแต่ละกลุ่มที่ไม่มีการโต้ตอบคุณจะได้รับผลลัพธ์เดียวกัน ค่อนข้างเท่ห์ใช่มั้ย หนังสือสถิติอาจอภิปรายวิธีการเหล่านี้ในบทที่แตกต่างกันแต่ถนนทุกสายนำไปสู่กรุงโรม จริงๆแล้วการดูว่าการทำงานกับข้อมูลของคุณเป็นวิธีที่ดีที่สุดในการเรียนรู้ ...

ตัวอย่างข้างต้นจึงเป็นวิธีที่ซับซ้อนเกินกว่าที่จะได้ข้อสรุปนี้ (ซึ่งเราแค่เปรียบเทียบค่าเฉลี่ยสี่กลุ่ม) แต่สำหรับการเรียนรู้เกี่ยวกับวิธีการทำงานของการโต้ตอบฉันคิดว่านี่เป็นการออกกำลังกายที่มีประโยชน์ มีโพสต์ที่ดีมากเกี่ยวกับประวัติส่วนตัวเกี่ยวกับการโต้ตอบตัวแปรต่อเนื่องกับตัวแปรที่กำหนดหรือการโต้ตอบสองตัวแปรต่อเนื่อง แม้ว่าคำถามของคุณจะได้รับการแก้ไขเพื่อระบุการทดสอบแบบไม่อิงพารามิเตอร์ แต่ฉันคิดว่ามันมีประโยชน์ที่จะคิดผ่านปัญหาของคุณจากวิธีการทั่วไปที่มากขึ้น (เช่นพาราเมตริก) เพราะวิธีการที่ไม่ใช่พารามิเตอร์มากที่สุดในการทดสอบสมมติฐานมีตรรกะเดียวกัน สมมติฐานน้อยลงเกี่ยวกับการแจกแจงเฉพาะ

แต่คำถามที่ถามเฉพาะสำหรับวิธีการที่ไม่ใช่ตัวแปรซึ่งอาจจะมีความเหมาะสมมากขึ้นตัวอย่างเช่นถ้าเราไม่ต้องการที่จะทำให้สมมติฐานบางอย่างเกี่ยวกับภาวะปกติของ T การทดสอบไม่ใช่ตัวแปรที่เหมาะสมจะทดสอบดันน์ การทดสอบนี้คล้ายกับการทดสอบยศรวมของ Wilcoxon-Mann-Whitney แต่มีมากกว่าสองประเภทWเสื้อ

โอล.d.ม.อีnYโอยูnก..Wโอม.อีn

สั้น ๆ ที่การโต้ตอบ "สำคัญ"

x1x2x1x2แต่อีกครั้งถ้าเรามี covariates สองตัวเท่านั้นที่สามารถรับค่าเป็น 0 หรือ 1 นั่นหมายความว่าเรากำลังดูที่กลุ่มสี่ค่าเฉลี่ย

ตัวอย่างการทำงาน

ลองเปรียบเทียบผลลัพธ์จากโมเดลปฏิสัมพันธ์กับผลลัพธ์จากการทดสอบของ Dunn อันดับแรกให้สร้างข้อมูลบางส่วนที่ (a) ผู้ชายมีน้ำหนักมากกว่าผู้หญิง (b) น้ำหนักของชายที่อายุน้อยกว่าผู้ชายที่มีอายุมากกว่าและ (c) ไม่มีความแตกต่างระหว่างผู้หญิงที่อายุน้อยกว่าและผู้หญิงที่มีอายุมากกว่า

set.seed(405)
old.men<-rnorm(50,mean=80,sd=15)
young.men<-rnorm(50,mean=70,sd=15)
young.women<-rnorm(50,mean=60,sd=15)
old.women<-rnorm(50,mean=60,sd=15)
cat<-rep(1:4, c(50,50,50,50))
gender<-rep(1:2, c(100,100))
age<-c(rep(1,50),rep(2,100),rep(1,50))
wt<-c(old.men,young.men,young.women,old.women)
data<-data.frame(cbind(wt,cat,age,gender))
data$cat<-factor(data$cat,labels=c("old.men","young.men","young.women","old.women"))
data$age<-factor(data$age,labels=c("old","young"))
data$gender<-factor(data$gender,labels=c("male","female"))

Wเสื้อ

mod<-lm(wt~age*gender,data)
library(effects)
allEffects(mod)

 model: wt ~ age * gender

 age*gender effect
       gender
age         male   female
  old   80.61897 57.70635
  young 67.78351 56.01228

ต้องการคำนวณข้อผิดพลาดมาตรฐานหรือช่วงความมั่นใจสำหรับเอฟเฟ็กต์เล็กน้อยของคุณหรือไม่ แพ็คเกจ 'เอฟเฟกต์' ที่อ้างถึงด้านบนสามารถทำสิ่งนี้ให้คุณได้ แต่ที่ดีกว่าไอเคนและเวสต์ (1991) ให้สูตรแก่คุณแม้จะเป็นรูปแบบปฏิสัมพันธ์ที่ซับซ้อนมากขึ้น ตารางของพวกเขาถูกพิมพ์อย่างสะดวกที่นี่พร้อมคำอธิบายที่ดีมากโดย Matt Golder

ตอนนี้ใช้การทดสอบของ Dunn

#install.packages("dunn.test")
dunn.test(data$wt, data$cat, method="bh")

Kruskal-Wallis chi-squared = 65.9549, df = 3, p-value = 0


                           Comparison of x by group                            
                             (Benjamini-Hochberg)                              
Col Mean-|
Row Mean |    old.men   young.me   young.wo
---------+---------------------------------
young.me |   3.662802
         |    0.0002*
         |
young.wo |   7.185657   3.522855
         |    0.0000*    0.0003*
         |
old.wome |   6.705346   3.042544  -0.480310
         |    0.0000*    0.0014*     0.3155

ค่า p ของผลการทดสอบ Kruskal-Wallis chi-squared แสดงให้เห็นว่าอย่างน้อยหนึ่งในกลุ่มของเรา 'มาจากประชากรที่แตกต่างกัน' สำหรับการเปรียบเทียบแบบกลุ่มต่อกลุ่มหมายเลขบนสุดคือสถิติการทดสอบ z ของ Dunn และหมายเลขด้านล่างคือค่า p ซึ่งได้รับการปรับสำหรับการเปรียบเทียบหลายรายการ เนื่องจากข้อมูลตัวอย่างของเราค่อนข้างถูกประดิษฐ์จึงไม่น่าแปลกใจที่เรามีค่า p จำนวนน้อยมาก แต่ให้สังเกตการเปรียบเทียบด้านล่างขวาระหว่างผู้หญิงที่อายุน้อยกว่าและผู้หญิงที่มีอายุมากกว่า การทดสอบอย่างถูกต้องสนับสนุนสมมติฐานว่างว่าไม่มีความแตกต่างระหว่างสองกลุ่มนี้

...

UPDATE: เมื่อได้รับคำตอบอื่น ๆ คำตอบนี้ได้รับการปรับปรุงเพื่อโต้แย้งความคิดที่ว่าสิ่งนี้ต้องการรูปแบบของการสร้างแบบจำลองที่ไม่เป็นเชิงเส้นหรือ - ได้รับตัวอย่างที่เฉพาะเจาะจงของ OP ของไบนารีโควาเรียตสองกลุ่มคือสี่กลุ่ม การเปลี่ยนแปลงสัญญาณเพื่อ asesses นี้ไม่ใช่พารามิเตอร์ ตัวอย่างเช่นถ้าอายุต่อเนื่องจะมีวิธีอื่นในการแก้ไขปัญหานี้ แต่นั่นไม่ใช่ตัวอย่างที่ OP กำหนด


คุณไม่ได้ใช้โครงสร้างของปัจจัยที่มีสองปัจจัย คุณเปรียบเทียบสี่กลุ่มเท่านั้น การทดสอบของ Dunn ไม่ได้เกี่ยวกับการมีปฏิสัมพันธ์เลย
Horst Grünbusch

ตกลงการทดสอบของ Dunn ไม่เกี่ยวกับการมีปฏิสัมพันธ์ อย่างไรก็ตามคำถามจะถามเฉพาะเกี่ยวกับการโต้ตอบระหว่างตัวแปรไบนารีสองตัว คำตอบของฉันแสดงให้เห็นว่านี่เทียบเท่ากับการเปรียบเทียบทั้งสี่กลุ่ม หากคำศัพท์โต้ตอบใหม่สำหรับ OP หวังว่านี่เป็นภาพประกอบที่มีประโยชน์
5ayat

1

ดังนั้นคุณมีตัวแปรสุ่มเหล่านี้:

  • Aยังไม่มีข้อความ
  • S{ชาย,หญิง}
  • W]0,[

และคุณมีฟังก์ชันมวล / ความหนาแน่นของความน่าจะเป็นเหล่านี้:

  • WW
  • W,AW,A
  • W,SW,S
  • W,A,SW,A,S

Was

  • W,A(W,a)W(W)
  • W,S(W,s)W(W)

W,A,S(W,a,s)W,A(W,a)W,S(W,s)

Was

อย่างไรก็ตามคุณไม่ทราบว่าเป็น PDF ร่วมที่แท้จริงข้างต้น เนื่องจากคุณต้องการ จำกัด ตัวเองให้ใช้วิธีการที่ไม่ใช่พารามิเตอร์ตอนนี้งานของคุณคือการค้นหาการประมาณค่าที่ไม่ใช่พารามิเตอร์เหล่านี้:

  • ^W,A(W,a)
  • ^W,S(W,s)
  • ^W,A,S(W,a,s)

จากนั้นแสดงว่า:

  • การประเมินความหนาแน่นของคุณนั้นแม่นยำเพียงพอ
  • ^W,A,S(W,a,s)^W,A(W,a)^W,S(W,s)
  • ^W,A,S(W,a,s)=^W,A(W,a)=^W,S(W,s)

0

ที่จะได้รับการตรวจสอบผลกระทบการทำงานร่วมกัน การสร้างแบบจำลองเชิงเส้นจะสามารถตรวจสอบสิ่งดังกล่าว แต่มันไม่ใช่พารามิเตอร์ที่ไม่ใช่ดังนั้นฉันเดาว่าต้องใช้เครื่องมืออื่น

คุณตรวจสอบageและgenderมีผลจนถึงตอนนี้อย่างไร

แก้ไข: คำตอบนี้ดูเหมือนจะช่วยคุณ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.