ฉันพบ ANOVA เป็นครั้งแรกเมื่อฉันเป็นนักเรียนปริญญาโทที่ Oxford ในปี 1978 วิธีการที่ทันสมัยโดยการสอนตัวแปรอย่างต่อเนื่องและจัดหมวดหมู่เข้าด้วยกันในรูปแบบการถดถอยหลายแบบทำให้นักสถิติรุ่นเยาว์ยากที่จะเข้าใจว่าเกิดอะไรขึ้น ดังนั้นการกลับไปสู่ช่วงเวลาที่ง่ายกว่านั้นมีประโยชน์
ในรูปแบบดั้งเดิม ANOVA เป็นการออกกำลังกายในแบบเลขคณิตโดยที่คุณจะแบ่งผลรวมของกำลังสองออกเป็นส่วน ๆ ที่เกี่ยวข้องกับการรักษาบล็อกการโต้ตอบอะไรก็ตาม ในการตั้งค่าที่สมดุลจำนวนสแควร์สที่มีความหมายที่ใช้งานง่าย (เช่น SSB และ SST) จะรวมกันเป็นผลรวมของสแควร์สที่ปรับทั้งหมด ทั้งหมดนี้ต้องขอบคุณการทำงานทฤษฎีบทค็อชฮาน การใช้ Cochran คุณสามารถคำนวณค่าที่คาดหวังของคำเหล่านี้ภายใต้สมมติฐานว่างปกติและโฟลว์สถิติ F จากที่นั่น
เป็นโบนัสเมื่อคุณเริ่มคิดเกี่ยวกับ Cochran และผลรวมของช่องสี่เหลี่ยมมันทำให้รู้สึกถึงการแบ่งและการแบ่งสี่เหลี่ยมของการรักษาของคุณโดยใช้ความแตกต่างมุมฉาก ทุกรายการในตาราง ANOVA ควรมีการตีความที่น่าสนใจต่อสถิติและให้สมมติฐานที่ทดสอบได้
ฉันเพิ่งเขียนคำตอบที่ความแตกต่างระหว่างวิธี MOM และ ML เกิดขึ้น คำถามเปิดใช้การประมาณแบบจำลองเอฟเฟกต์แบบสุ่ม ณ จุดนี้วิธีการแบบดั้งเดิมของ ANOVA ได้รวมส่วน บริษัท ทั้งหมดไว้ด้วยการประเมินความเป็นไปได้สูงสุดและการประเมินผลกระทบจะไม่เหมือนกันอีกต่อไป เมื่อการออกแบบไม่สมดุลกันคุณจะไม่ได้รับสถิติ F เหมือนกัน
ย้อนกลับไปในวันที่เมื่อนักสถิติต้องการคำนวณผลกระทบแบบสุ่มจากการแยกส่วนหรือการออกแบบมาตรการซ้ำความแปรปรวนแบบสุ่มถูกคำนวณจากค่าเฉลี่ยกำลังสองของตาราง ANOVA ดังนั้นหากคุณมีพล็อตที่มีความแปรปรวนและความแปรปรวนที่เหลือคือคุณอาจมีค่าที่คาดหวังของสแควร์เฉลี่ย ("สแควร์เฉลี่ยที่คาดหวัง", EMS) สำหรับพล็อตคือมีจำนวนแยกในพล็อต คุณตั้งค่าสแควร์เฉลี่ยเท่ากับความคาดหวังและแก้หา σ 2 σ 2 + n σ 2 P n ^ σ 2 ขσ2pσ2σ2+nσ2pnσ2b^. ANOVA ให้วิธีประมาณค่าโมเมนต์สำหรับความแปรปรวนของเอฟเฟกต์แบบสุ่ม ตอนนี้เรามีแนวโน้มที่จะแก้ปัญหาดังกล่าวด้วยโมเดลเอฟเฟกต์ผสมและส่วนประกอบความแปรปรวนได้จากการประมาณค่าความน่าจะเป็นสูงสุดหรือ REML
การวิเคราะห์ความแปรปรวนดังกล่าวไม่ใช่วิธีการของขั้นตอนช่วงเวลา มันเปิดการแยกผลรวมของช่องสี่เหลี่ยม (หรือโดยทั่วไปรูปแบบสมการกำลังสองของการตอบสนอง) เป็นส่วนประกอบที่ให้สมมติฐานที่มีความหมาย มันขึ้นอยู่กับกฎเกณฑ์อย่างมากเนื่องจากเราต้องการให้ผลบวกของกำลังสองมีการแจกแจงแบบไคสแควร์สำหรับการทดสอบ F ในการทำงาน
กรอบความน่าจะเป็นสูงสุดนั้นกว้างกว่าและนำไปใช้กับสถานการณ์เช่นตัวแบบเชิงเส้นแบบทั่วไปที่ไม่ใช้ผลบวกของกำลังสอง ซอฟต์แวร์บางตัว (เช่น R) เชื้อเชิญความสับสนด้วยการระบุวิธี anova เพื่อทดสอบอัตราส่วนความน่าจะเป็นด้วยการแจกแจงแบบไคสแควร์แบบ asymptotic หนึ่งสามารถปรับการใช้คำว่า "anova" แต่พูดอย่างเคร่งครัดทฤษฎีหลังมันแตกต่างกัน