ฉันพยายามที่จะหาความสัมพันธ์ระหว่างคู่และตัวแปรต่อเนื่อง
จากการทำงานภาคพื้นดินของฉันในเรื่องนี้ฉันพบว่าฉันต้องใช้การทดสอบแบบอิสระและเงื่อนไขที่จำเป็นสำหรับมันคือการกระจายตัวของตัวแปรจะต้องเป็นปกติ
ฉันทำการทดสอบ Kolmogorov-Smirnov เพื่อทดสอบความปกติและพบว่าตัวแปรต่อเนื่องไม่ปกติและเอียง (ประมาณ 4,000 จุดข้อมูล)
ฉันทำการทดสอบ Kolmogorov-Smirnov สำหรับตัวแปรทั้งหมด ฉันควรแบ่งพวกเขาออกเป็นกลุ่มและทำแบบทดสอบหรือไม่? กล่าวคือถ้าฉันมีrisk level
( 0
= ไม่เสี่ยง1
= เสี่ยง) และระดับคอเลสเตอรอลฉันควร:
แบ่งพวกมันออกเป็นสองกลุ่มอย่างเช่น
Risk level =0 (Cholestrol level) -> Apply KS Risk level =1 (Cholestrol level) -> Apply KS
พาพวกเขาไปด้วยกันและทำการทดสอบ? (ฉันใช้กับชุดข้อมูลทั้งหมดเท่านั้น)
หลังจากนั้นฉันควรทำอย่างไรหากมันยังไม่ปกติ
แก้ไข: สถานการณ์ข้างต้นเป็นเพียงคำอธิบายที่ฉันพยายามให้สำหรับปัญหาของฉัน ฉันมีชุดข้อมูลซึ่งมีตัวแปรมากกว่า 1,000 รายการและตัวอย่างประมาณ 4000 รายการ พวกมันมีทั้งต่อเนื่องหรือเด็ดขาดในธรรมชาติ งานของฉันคือการทำนายตัวแปรแบบแบ่งขั้วตามตัวแปรเหล่านี้ (อาจเกิดขึ้นกับแบบจำลองการถดถอยโลจิสติก) ดังนั้นฉันคิดว่าการตรวจสอบเบื้องต้นจะเกี่ยวข้องกับการค้นหาความสัมพันธ์ระหว่างโดมิโนและตัวแปรต่อเนื่อง
ฉันพยายามที่จะดูว่าการกระจายตัวของตัวแปรเป็นอย่างไรและด้วยเหตุนี้จึงพยายามไปทดสอบ t ที่นี่ฉันพบว่าปกติเป็นปัญหา การทดสอบ Kolmogorov-Smirnov ให้ค่านัยสำคัญ 0.00 ในตัวแปรเหล่านี้ส่วนใหญ่
ฉันควรถือว่าเป็นเรื่องปกติ ความเบ้และความแรงของตัวแปรเหล่านี้ยังแสดงให้เห็นว่าข้อมูลนั้นเบ้ (> 0) ในเกือบทุกกรณี
ตามบันทึกที่ให้ไว้ด้านล่างฉันจะตรวจสอบความสัมพันธ์จุดที่เป็นจุดศูนย์กลางต่อไป แต่เกี่ยวกับการกระจายของตัวแปรฉันยังไม่แน่ใจ