มีวิธีอะไร (วิธี?) ที่จะอธิบายด้วยสายตาว่า ANOVA คืออะไร?
จะมีการอ้างอิงลิงค์ลิงค์ (R packages) ใด ๆ
มีวิธีอะไร (วิธี?) ที่จะอธิบายด้วยสายตาว่า ANOVA คืออะไร?
จะมีการอ้างอิงลิงค์ลิงค์ (R packages) ใด ๆ
คำตอบ:
โดยส่วนตัวแล้วฉันชอบแนะนำการถดถอยเชิงเส้นและ ANOVA โดยแสดงว่ามันเหมือนกันทั้งหมดและโมเดลเชิงเส้นจำนวนนั้นเพื่อแบ่งส่วนความแปรปรวนทั้งหมด: เรามีความแปรปรวนบางอย่างในผลลัพธ์ที่สามารถอธิบายได้โดยปัจจัยที่น่าสนใจรวมถึงที่ไม่ได้อธิบาย ส่วนหนึ่ง (เรียกว่า 'ส่วนที่เหลือ') โดยทั่วไปฉันใช้ภาพประกอบต่อไปนี้ (เส้นสีเทาสำหรับความแปรปรวนทั้งหมด, เส้นสีดำสำหรับความแปรปรวนเฉพาะกลุ่มหรือรายบุคคล):
ฉันยังเหมือนheplotsแพคเกจ R จากไมเคิลเป็นมิตรและจอห์นฟ็อกซ์ แต่ยังเห็นการทดสอบสมมติฐานภาพในหลายตัวแปรเชิงเส้นรุ่นที่: heplots แพคเกจสำหรับ R
วิธีการมาตรฐานในการอธิบายสิ่งที่ ANOVA ทำจริงโดยเฉพาะในกรอบของตัวแบบเชิงเส้นนั้นได้รับการอธิบายอย่างดีในคำตอบของคำถามที่ซับซ้อนโดยเครื่องบินโดย Christensen แต่มีภาพประกอบน้อยมาก วิธีทางสถิติของ Saville and Wood : วิธีเรขาคณิตมีตัวอย่างบางส่วน แต่ส่วนใหญ่เกี่ยวกับการถดถอย ในการออกแบบและวิเคราะห์การทดลองของมอนต์โกเมอรี่ซึ่งส่วนใหญ่เน้นที่ DoE มีภาพประกอบที่ฉันชอบ แต่ดูด้านล่าง
(นี่คือของฉัน :-)
แต่ผมคิดว่าคุณต้องมองหาตำราเกี่ยวกับการเชิงเส้นรุ่นถ้าคุณต้องการที่จะดูว่าผลรวมของสี่เหลี่ยมข้อผิดพลาด ฯลฯ แปลเป็นปริภูมิเวกเตอร์ที่แสดงบนวิกิพีเดีย การประมาณค่าและการอนุมานในเศรษฐมิติโดย Davidson และ MacKinnon ดูเหมือนว่าจะมีภาพประกอบที่ดี (บทที่ 1 ครอบคลุมเรขาคณิต OLS จริง ๆ ) แต่ฉันดูเฉพาะการแปลภาษาฝรั่งเศส (มีที่นี่ ) เรขาคณิตของการถดถอยเชิงเส้นก็มีภาพประกอบที่ดีเช่นกัน
แก้ไข :
Ah และฉันก็จำได้ว่าบทความนี้โดยโรเบิร์ต Pruzek, กราฟิกใหม่สำหรับทางเดียว ANOVA
แก้ไข 2
และตอนนี้แพ็คเกจgranova (ที่ถูกกล่าวถึงโดย @ gd047 และเกี่ยวข้องกับกระดาษด้านบน) ได้รับการย้ายไปยัง ggplot แล้วดูgranovaGGพร้อมภาพประกอบ ANOVA แบบทางเดียวด้านล่าง
แล้วเรื่องแบบนี้ล่ะ?
กำลังติดตาม Crawley (2005) สถิติ. การแนะนำโดยใช้ R: Wiley
plot.design()
( แต่คุณในรุ่น :-) เพิ่ม
ขอบคุณสำหรับคำตอบที่ดีของคุณ ในขณะที่พวกเขามีความกระจ่างแจ้งฉันรู้สึกว่าการใช้พวกเขาสำหรับหลักสูตรที่ฉันสอนอยู่ในขณะนี้ (ดีแล้ว) จะมากเกินไปสำหรับนักเรียนของฉัน (ฉันช่วยสอนหลักสูตร BioStatistics สำหรับนักเรียนระดับสูงในสาขาวิทยาศาสตร์การแพทย์)
ดังนั้นฉันจึงสร้างภาพสองภาพ (ทั้งสองเป็นแบบจำลอง) ซึ่งฉันคิดว่าเป็นตัวอย่างที่มีประโยชน์สำหรับการอธิบาย ANOVA
ฉันยินดีที่จะอ่านความคิดเห็นหรือข้อเสนอแนะเพื่อปรับปรุงพวกเขา
ภาพแรกแสดงการจำลองจุดข้อมูล 30 จุดโดยแยกเป็น 3 แปลง (แสดงวิธีแยก MST = Var กับข้อมูลที่สร้าง MSB และ MSW:
ภาพที่สองแสดงให้เห็นถึง 4 แปลงแต่ละภาพสำหรับการรวมกันของความแปรปรวนและความคาดหวังที่แตกต่างกันสำหรับกลุ่มในขณะที่
ตรวจสอบการนำเสนอของ Hadley Wickham ( pdf , mirror ) บน ggplot เริ่มต้นในหน้า 23-40 ของเอกสารนี้เขาอธิบายวิธีการที่น่าสนใจในการแสดงภาพ ANOVAs
* ลิงค์มาจาก: http://had.co.nz/ggplot2/
เป็นคำถามที่ดีมาก คุณรู้ไหมว่าฉันได้ดิ้นรนกับการโอบรอบ ANOVA เป็นเวลานานมาก ฉันมักจะพบว่าตัวเองกลับไปที่สัญชาตญาณ "ระหว่างกับภายใน" และฉันก็พยายามจินตนาการอยู่เสมอว่าสิ่งนี้จะเป็นอย่างไรในหัวของฉัน ฉันดีใจที่คำถามนี้เกิดขึ้นและฉันรู้สึกทึ่งกับวิธีการที่หลากหลายในคำตอบข้างต้น
อย่างไรก็ตามเป็นเวลานานหลายปีแล้วที่ฉันต้องการรวบรวมแปลงหลายแห่งในที่เดียวที่ฉันสามารถเห็นสิ่งที่เกิดขึ้นพร้อมกันจากหลายทิศทาง: 1) ประชากรมีความห่างกันอย่างไร 2) ห่างกันข้อมูลที่มี 3) วิธีการใหญ่เป็นระหว่างเมื่อเทียบกับภายในและ 4) วิธีการทำกลางเมื่อเทียบกับnoncentralแจกแจง F เปรียบเทียบ?
ในโลกที่ยิ่งใหญ่อย่างแท้จริงฉันสามารถเล่นกับตัวเลื่อนเพื่อดูว่าขนาดของกลุ่มตัวอย่างเปลี่ยนแปลงไปอย่างไร
ดังนั้นฉันจึงได้เล่นกับmanipulate
คำสั่งในRStudioและวัวศักดิ์สิทธิ์มันใช้งานได้! นี่คือหนึ่งในแผนการภาพรวมจริง ๆ :
หากคุณมี RStudio คุณจะได้รับรหัสสำหรับการทำพล็อตข้างต้น (ตัวเลื่อนและทั้งหมด)! บน Github ที่นี่
หลังจากเล่นกับเรื่องนี้ซักพักฉันก็ประหลาดใจที่สถิติ F แตกต่างจากกลุ่มได้ดีถึงขนาดขนาดกลุ่มตัวอย่างที่เล็ก เมื่อฉันดูที่ประชากรพวกเขาไม่ได้อยู่ห่างไกลกันมากนัก (ถึงตาฉัน) แต่แถบ "ภายใน" นั้นถูกแคระโดยแถบ "ระหว่าง" อย่างต่อเนื่อง เรียนรู้บางสิ่งทุกวันฉันเดา
เพื่อแสดงให้เห็นถึงสิ่งที่เกิดขึ้นกับการวิเคราะห์ความแปรปรวนแบบทางเดียวในบางครั้งฉันได้ใช้แอปเพล็ตที่ผู้เขียน "แนะนำให้รู้จักกับการปฏิบัติทางสถิติ" ซึ่งช่วยให้นักเรียนสามารถเล่นกับภายในและระหว่างความแปรปรวนและสังเกตเห็นผลกระทบต่อสถิติ F . นี่คือลิงค์ (แอปเพล็ตเป็นอันสุดท้ายในหน้า) ภาพหน้าจอตัวอย่าง:
ผู้ใช้ควบคุมแถบเลื่อนด้านบนที่แตกต่างกันกระจายแนวตั้งของข้อมูลสามกลุ่ม จุดสีแดงที่ด้านล่างเคลื่อนที่ไปตามพล็อตของค่า p ในขณะที่สถิติ F ที่แสดงด้านล่างได้รับการปรับปรุง
ดูเหมือนว่าเรือได้แล่นไปแล้วในแง่ของคำตอบ แต่ฉันคิดว่าถ้านี่เป็นหลักสูตรเบื้องต้นที่การจัดแสดงส่วนใหญ่ที่นี่จะยากเกินไปที่จะเข้าใจสำหรับนักเรียนที่เริ่มต้น ... หรืออย่างน้อยที่สุดด้วย ยากที่จะเข้าใจโดยไม่มีหน้าจอเบื้องต้นซึ่งให้คำอธิบายที่ง่ายมากเกี่ยวกับความแปรปรวนของการแบ่ง แสดงให้พวกเขาเห็นว่าการเพิ่มขึ้นของจำนวนรวมของ SST มีจำนวนอาสาสมัครอย่างไร จากนั้นหลังจากแสดงให้เห็นถึงการพองตัวของอาสาสมัครหลายคน (อาจเพิ่มหนึ่งรายการในแต่ละกลุ่มหลาย ๆ ครั้ง) ให้อธิบายว่า SST = SSB + SSW (แม้ว่าฉันชอบที่จะเรียกมันว่า SSE ตั้งแต่เริ่มแรกเพราะหลีกเลี่ยงความสับสน ) จากนั้นแสดงให้พวกเขาเห็นภาพของการแบ่งพาร์ทิชันความแปรปรวนเช่นรหัสสีสี่เหลี่ยมขนาดใหญ่เพื่อให้คุณสามารถดูว่า SST ทำจาก SSB และ SSW ได้อย่างไร จากนั้น
นี่คือตัวแทนของสถานการณ์บางคนซึ่งในการวิเคราะห์ความแปรปรวนจะสรุปให้อยู่ในระดับที่แตกต่างกันพอดีระหว่างและXX