ฉันมีตารางที่มีสี่กลุ่ม (4 กลุ่ม BMI) เป็นตัวแปรอิสระ (ตัวคูณ) ฉันมีตัวแปรตามนั่นคือ "ร้อยละแม่สูบบุหรี่ในการตั้งครรภ์"
อนุญาตให้ใช้ ANOVA สำหรับสิ่งนี้หรือฉันต้องใช้ไคสแควร์หรือการทดสอบอื่น ๆ
ฉันมีตารางที่มีสี่กลุ่ม (4 กลุ่ม BMI) เป็นตัวแปรอิสระ (ตัวคูณ) ฉันมีตัวแปรตามนั่นคือ "ร้อยละแม่สูบบุหรี่ในการตั้งครรภ์"
อนุญาตให้ใช้ ANOVA สำหรับสิ่งนี้หรือฉันต้องใช้ไคสแควร์หรือการทดสอบอื่น ๆ
คำตอบ:
มีความแตกต่างระหว่างการมีตัวแปรไบนารีเป็นตัวแปรตามของคุณและมีสัดส่วนเป็นตัวแปรตามของคุณ
ตัวแปรขึ้นอยู่กับไบนารี :
สัดส่วนเป็นตัวแปรตาม :
ขึ้นอยู่กับว่าการตอบสนองภายในกลุ่มต่างกันมีค่าใกล้เคียง 0 หรือ 100% หากมีค่ามากเกินไป (เช่นค่าหลายค่าที่ซ้อนทับใน 0 หรือ 100%) สิ่งนี้จะเป็นเรื่องยาก (หากคุณไม่รู้จัก "ตัวหาร" นั่นคือจำนวนเรื่องที่คำนวณเปอร์เซ็นต์แล้วคุณจะไม่สามารถใช้แนวทางฉุกเฉินได้) หากค่าภายในกลุ่มมีความสมเหตุสมผลมากขึ้นคุณสามารถแปลง ตัวแปรการตอบสนอง (เช่นคลาสสิก arcsine-square-root หรือการแปลง logit) มีวิธีการทดสอบแบบกราฟิก (ที่แนะนำ) และข้อสมมติฐานว่าง (ไม่ต้องการ) ที่หลากหลายสำหรับการตัดสินใจว่าข้อมูลที่แปลงของคุณเป็นไปตามสมมติฐานของ ANOVA อย่างเพียงพอหรือไม่ความสม่ำเสมอของความแปรปรวน การทดสอบกราฟิก: boxplots (ความสม่ำเสมอของความแปรปรวน) และแผนการ QQ (ปกติ) [หลังควรทำภายในกลุ่มหรือในส่วนที่เหลือ] การทดสอบสมมติฐานแบบ Null: เช่นการทดสอบ Bartlett หรือ Fligner (ความสม่ำเสมอของความแปรปรวน), Shapiro-Wilk, Jarque-Bera เป็นต้น
คุณต้องมีข้อมูลดิบเพื่อให้ตัวแปรตอบสนองคือ 0/1 (ไม่ใช่ควัน, ควัน) จากนั้นคุณสามารถใช้การถดถอยโลจิสติกไบนารี ไม่ถูกต้องที่จะจัดกลุ่ม BMI เป็นระยะ จุดตัดไม่ถูกต้องอาจไม่มีอยู่และคุณยังไม่ได้ทดสอบอย่างเป็นทางการว่า BMI เกี่ยวข้องกับการสูบบุหรี่หรือไม่ คุณกำลังทดสอบว่าค่าดัชนีมวลกายที่มีข้อมูลส่วนใหญ่ทิ้งนั้นเกี่ยวข้องกับการสูบบุหรี่หรือไม่ คุณจะพบว่าโดยเฉพาะช่วง BMI ด้านนอกนั้นค่อนข้างต่างกัน
หากคุณเลือกที่จะทำการ ANOVA สามัญกับข้อมูลตามสัดส่วนมันเป็นสิ่งสำคัญในการตรวจสอบสมมติฐานของความแปรปรวนข้อผิดพลาดที่เป็นเนื้อเดียวกัน หาก (ตามปกติกับข้อมูลเปอร์เซ็นต์) ความแปรปรวนของข้อผิดพลาดนั้นไม่คงที่ทางเลือกที่เหมือนจริงมากขึ้นคือลองเบต้าการถดถอยซึ่งสามารถอธิบายถึงความแตกต่างในรูปแบบนี้ได้ นี่คือบทความเกี่ยวกับวิธีการทางเลือกในการจัดการกับตัวแปรตอบกลับที่เป็นเปอร์เซ็นต์หรือสัดส่วน: http://www.ime.usp.br/~sferrari/beta.pdf
หากคุณใช้ R แพ็คเกจbetaregอาจมีประโยชน์