หากผู้ชมจริงๆไม่มีพื้นหลังสถิติฉันคิดว่าฉันจะพยายามที่จะลดความซับซ้อนของการอธิบายค่อนข้างน้อยมาก ก่อนอื่นฉันจะวาดระนาบพิกัดบนกระดานโดยมีเส้นตรงเป็นดังนี้:
ทุกคนในการพูดคุยของคุณจะคุ้นเคยกับสมการของเส้นตรงy = m x + bเพราะนั่นคือสิ่งที่เรียนรู้ในระดับชั้นประถมศึกษา ดังนั้นฉันจะแสดงให้เห็นว่าข้างการวาดภาพ อย่างไรก็ตามฉันจะเขียนย้อนกลับเช่น: Y= m x + b
m x + b = y
ฉันจะบอกว่าสมการนี้เป็นตัวอย่างของการถดถอยเชิงเส้นอย่างง่าย จากนั้นฉันจะอธิบายวิธีที่คุณ (หรือคอมพิวเตอร์) สามารถปรับสมการดังกล่าวให้สอดคล้องกับพล็อตจุดกระจายข้อมูลเช่นที่แสดงในภาพนี้:
ฉันจะบอกว่าที่นี่เรากำลังใช้อายุของสิ่งมีชีวิตที่เรากำลังศึกษาเพื่อทำนายว่ามันใหญ่แค่ไหนและสมการการถดถอยเชิงเส้นผลลัพธ์ที่เราได้รับ (แสดงในภาพ) สามารถใช้ในการทำนายว่าสิ่งมีชีวิตใหญ่แค่ไหน คือถ้าเรารู้อายุของมัน
m x + b = y
จากนั้นฉันจะอธิบายอีกครั้งว่านี่เป็นตัวอย่างของสมการการถดถอยเชิงเส้นอย่างง่ายและจริง ๆ แล้วมีความซับซ้อนมากขึ้น ตัวอย่างเช่นในหลากหลายที่เรียกว่าการถดถอยโลจิสติก y จะได้รับอนุญาตให้เป็น 1 หรือ 0 อาจต้องการใช้รูปแบบนี้หากคุณพยายามคาดเดาคำตอบ "ใช่" หรือ "ไม่" เช่นว่ามีคนเป็นโรคหรือไม่ ความหลากหลายพิเศษอีกอย่างคือสิ่งที่เรียกว่าการถดถอยของปัวซองซึ่งใช้ในการวิเคราะห์ข้อมูล "นับ" หรือ "เหตุการณ์" (ฉันจะไม่เจาะลึกลงไปอีกหากไม่จำเป็นจริงๆ)
ฉันจะอธิบายว่าการถดถอยเชิงเส้นการถดถอยโลจิสติกและการถดถอยปัวซองเป็นตัวอย่างพิเศษทั้งหมดของวิธีการทั่วไปที่มากกว่าสิ่งที่เรียกว่า "โมเดลเชิงเส้นเชิงเส้นทั่วไป" สิ่งที่ยอดเยี่ยมเกี่ยวกับ "แบบจำลองเชิงเส้นทั่วไป" คือพวกมันอนุญาตให้เราใช้ข้อมูล "การตอบสนอง" ที่สามารถรับค่าใด ๆ (เช่นสิ่งมีชีวิตขนาดใหญ่อยู่ในการถดถอยแบบเส้นตรง) ใช้เวลาเพียง 1 หรือ 0 โรคในการถดถอยโลจิสติก) หรือใช้นับจำนวน (เช่นจำนวนเหตุการณ์ในการถดถอยปัวซอง)
ฉันจะบอกว่าในสมการประเภทนี้ x's (ตัวทำนาย) เชื่อมต่อกับ y's (การตอบสนอง) ผ่านสิ่งที่นักสถิติเรียกว่า "ฟังก์ชันลิงก์" เราใช้ "ฟังก์ชันลิงก์" เหล่านี้ในกรณีที่ x ไม่เกี่ยวข้องกับ y ในลักษณะเชิงเส้น
อย่างไรก็ตามนี่คือสองเซ็นต์ของฉันในปัญหา! บางทีคำอธิบายที่ฉันเสนออาจฟังดูแปลก ๆ และโง่เง่า แต่ถ้าจุดประสงค์ของแบบฝึกหัดนี้เป็นเพียงการให้ "ใจความสำคัญ" ผ่านไปยังผู้ฟังบางทีคำอธิบายเช่นนี้ก็ไม่ได้แย่เกินไป ฉันคิดว่ามันเป็นสิ่งสำคัญที่แนวคิดจะถูกอธิบายในวิธีที่ใช้งานง่ายและคุณหลีกเลี่ยงการโยนคำเช่น "องค์ประกอบแบบสุ่ม", "องค์ประกอบของระบบ", "ฟังก์ชันลิงก์", "ยับยั้ง", "ฟังก์ชัน logit" ฯลฯ หากคุณ ' กำลังพูดคุยกับคนที่ไม่มีพื้นฐานทางสถิติอย่างแท้จริงเช่นนักชีววิทยาหรือแพทย์โดยทั่วไปดวงตาของพวกเขาจะเปล่งประกายเมื่อได้ยินคำพูดเหล่านั้น พวกเขาไม่รู้ว่าการกระจายความน่าจะเป็นคืออะไรพวกเขาไม่เคยได้ยินเกี่ยวกับฟังก์ชันลิงก์และพวกเขาไม่รู้ว่า "logit"
ในคำอธิบายของคุณเกี่ยวกับผู้ชมที่ไม่ใช่เชิงสถิติฉันจะเน้นไปที่การใช้แบบจำลองที่หลากหลายเมื่อใด ฉันอาจพูดถึงจำนวนนักทำนายที่คุณได้รับอนุญาตให้รวมทางด้านซ้ายมือของสมการ (ฉันได้ยินกฎของหัวแม่มือไม่เกินขนาดตัวอย่างของคุณหารด้วยสิบ) นอกจากนี้ยังเป็นการดีที่จะรวมตัวอย่างสเปรดชีตที่มีข้อมูลและอธิบายให้ผู้ชมทราบถึงวิธีการใช้แพคเกจซอฟต์แวร์เชิงสถิติเพื่อสร้างแบบจำลอง จากนั้นฉันจะอธิบายผลลัพธ์ของแบบจำลองทีละขั้นตอนและพยายามอธิบายความหมายของตัวอักษรและตัวเลขที่แตกต่างกันทั้งหมด นักชีววิทยามีความรู้เกี่ยวกับสิ่งนี้และสนใจที่จะเรียนรู้ว่าจะใช้แบบทดสอบอะไรเมื่อใดแทนที่จะได้รับความเข้าใจในคณิตศาสตร์ที่อยู่เบื้องหลัง GUI ของ SPSS!
ฉันจะซาบซึ้งความคิดเห็นหรือข้อเสนอแนะเกี่ยวกับคำอธิบายของฉันที่นำเสนอโดยเฉพาะอย่างยิ่งถ้าใครบันทึกข้อผิดพลาดหรือคิดว่าวิธีที่ดีกว่าที่จะอธิบายมัน!