ทำอย่างไรจึงจะเห็นภาพว่า ANOVA ทำอะไร


60

มีวิธีอะไร (วิธี?) ที่จะอธิบายด้วยสายตาว่า ANOVA คืออะไร?

จะมีการอ้างอิงลิงค์ลิงค์ (R packages) ใด ๆ


ในบล็อกของเขา 'นักจิตวิทยาในการเขียนโปรแกรมเชิงสถิติ' Kristoffer Magnusson ให้ตัวอย่างที่ยอดเยี่ยมของการสร้างภาพอโนวา
Epifunky

ฉันได้พบภาพที่ดีของการวิเคราะห์ความแปรปรวน มันไม่แม่นยำเหมือนคำตอบก่อนหน้า แต่คุณสามารถเล่นกับการสร้างภาพ พบว่ามันค่อนข้างน่าสนใจ: students.brown.edu/seeing-theory/regression/index.html#third
Mike

คำตอบ:


51

โดยส่วนตัวแล้วฉันชอบแนะนำการถดถอยเชิงเส้นและ ANOVA โดยแสดงว่ามันเหมือนกันทั้งหมดและโมเดลเชิงเส้นจำนวนนั้นเพื่อแบ่งส่วนความแปรปรวนทั้งหมด: เรามีความแปรปรวนบางอย่างในผลลัพธ์ที่สามารถอธิบายได้โดยปัจจัยที่น่าสนใจรวมถึงที่ไม่ได้อธิบาย ส่วนหนึ่ง (เรียกว่า 'ส่วนที่เหลือ') โดยทั่วไปฉันใช้ภาพประกอบต่อไปนี้ (เส้นสีเทาสำหรับความแปรปรวนทั้งหมด, เส้นสีดำสำหรับความแปรปรวนเฉพาะกลุ่มหรือรายบุคคล):

ข้อความแสดงแทน

ฉันยังเหมือนheplotsแพคเกจ R จากไมเคิลเป็นมิตรและจอห์นฟ็อกซ์ แต่ยังเห็นการทดสอบสมมติฐานภาพในหลายตัวแปรเชิงเส้นรุ่นที่: heplots แพคเกจสำหรับ R

วิธีการมาตรฐานในการอธิบายสิ่งที่ ANOVA ทำจริงโดยเฉพาะในกรอบของตัวแบบเชิงเส้นนั้นได้รับการอธิบายอย่างดีในคำตอบของคำถามที่ซับซ้อนโดยเครื่องบินโดย Christensen แต่มีภาพประกอบน้อยมาก วิธีทางสถิติของ Saville and Wood : วิธีเรขาคณิตมีตัวอย่างบางส่วน แต่ส่วนใหญ่เกี่ยวกับการถดถอย ในการออกแบบและวิเคราะห์การทดลองของมอนต์โกเมอรี่ซึ่งส่วนใหญ่เน้นที่ DoE มีภาพประกอบที่ฉันชอบ แต่ดูด้านล่าง

ข้อความแสดงแทน

(นี่คือของฉัน :-)

แต่ผมคิดว่าคุณต้องมองหาตำราเกี่ยวกับการเชิงเส้นรุ่นถ้าคุณต้องการที่จะดูว่าผลรวมของสี่เหลี่ยมข้อผิดพลาด ฯลฯ แปลเป็นปริภูมิเวกเตอร์ที่แสดงบนวิกิพีเดีย การประมาณค่าและการอนุมานในเศรษฐมิติโดย Davidson และ MacKinnon ดูเหมือนว่าจะมีภาพประกอบที่ดี (บทที่ 1 ครอบคลุมเรขาคณิต OLS จริง ๆ ) แต่ฉันดูเฉพาะการแปลภาษาฝรั่งเศส (มีที่นี่ ) เรขาคณิตของการถดถอยเชิงเส้นก็มีภาพประกอบที่ดีเช่นกัน

แก้ไข :

Ah และฉันก็จำได้ว่าบทความนี้โดยโรเบิร์ต Pruzek, กราฟิกใหม่สำหรับทางเดียว ANOVA

แก้ไข 2

และตอนนี้แพ็คเกจgranova (ที่ถูกกล่าวถึงโดย @ gd047 และเกี่ยวข้องกับกระดาษด้านบน) ได้รับการย้ายไปยัง ggplot แล้วดูgranovaGGพร้อมภาพประกอบ ANOVA แบบทางเดียวด้านล่าง

ป้อนคำอธิบายรูปภาพที่นี่


ภาพประกอบแรกผลิตโดยใช้ R หรือไม่
George Dontas

@ gd047 ใช่ ควรมีซอร์สโค้ดน่าเกลียดอยู่ที่ไหนสักแห่งถ้าคุณต้องการ คนที่สองจะทำใน Metapost
chl

3
@ gd047 สิทธิทั้งหมดตามปกติมันเสมอเมื่อเรามองหารหัสเดิมว่าเราไม่สามารถพบว่ามัน (แม้จะมีความพยายามที่ดีที่สุดของฉันกับ grep / หา) ดังนั้นฉันเขียนอย่างรวดเร็ว (ยังคงน่าเกลียด) R สคริปต์สำหรับการที่ ฉันยังได้นำตัวอย่างของที่รหัส MP
chl

เรขาคณิตของการเชื่อมโยงการถดถอยเชิงเส้นดูเหมือนจะเน่าเปื่อยไปอย่างน่าเศร้า
Silverfish

23

แล้วเรื่องแบบนี้ล่ะ? ข้อความแสดงแทน

กำลังติดตาม Crawley (2005) สถิติ. การแนะนำโดยใช้ R: Wiley


1
(+1) ฉันเตือนฉันของplot.design()( แต่คุณในรุ่น :-) เพิ่ม
CHL

นี่คือสิ่งที่ดีที่สุด.
อยากรู้อยากเห็น

13

ขอบคุณสำหรับคำตอบที่ดีของคุณ ในขณะที่พวกเขามีความกระจ่างแจ้งฉันรู้สึกว่าการใช้พวกเขาสำหรับหลักสูตรที่ฉันสอนอยู่ในขณะนี้ (ดีแล้ว) จะมากเกินไปสำหรับนักเรียนของฉัน (ฉันช่วยสอนหลักสูตร BioStatistics สำหรับนักเรียนระดับสูงในสาขาวิทยาศาสตร์การแพทย์)

ดังนั้นฉันจึงสร้างภาพสองภาพ (ทั้งสองเป็นแบบจำลอง) ซึ่งฉันคิดว่าเป็นตัวอย่างที่มีประโยชน์สำหรับการอธิบาย ANOVA

ฉันยินดีที่จะอ่านความคิดเห็นหรือข้อเสนอแนะเพื่อปรับปรุงพวกเขา

ภาพแรกแสดงการจำลองจุดข้อมูล 30 จุดโดยแยกเป็น 3 แปลง (แสดงวิธีแยก MST = Var กับข้อมูลที่สร้าง MSB และ MSW:

  • พล็อตด้านซ้ายแสดงพล็อตกระจายของข้อมูลต่อกลุ่ม
  • ตรงกลางแสดงให้เห็นว่าข้อมูลที่เราจะใช้กับ MSB นั้นเป็นอย่างไร
  • ภาพที่ถูกต้องแสดงให้เห็นว่าข้อมูลที่เราจะใช้กับขยะเป็นอย่างไร

ข้อความแสดงแทน

ภาพที่สองแสดงให้เห็นถึง 4 แปลงแต่ละภาพสำหรับการรวมกันของความแปรปรวนและความคาดหวังที่แตกต่างกันสำหรับกลุ่มในขณะที่

  • แถวแรกของพล็อตสำหรับความแปรปรวนต่ำในขณะที่แถวที่สองสำหรับความแปรปรวนสูง (เอ้อ)
  • คอลัมน์แรกของพล็อตมีไว้สำหรับความคาดหวังที่เท่าเทียมกันระหว่างกลุ่มในขณะที่คอลัมน์ที่สองแสดงกลุ่มที่มีความคาดหวังที่แตกต่างกัน (มาก)

ข้อความแสดงแทน


2
(+1) ฉันคิดเสมอว่าข้อความพกพาเมื่อสอน ANOVA คือ: (1) เรามีอัตราส่วน F ที่สะท้อนถึงความสำคัญของความแปรปรวนที่เกิดจากปัจจัยที่เราสนใจ ความแปรปรวนทั้งหมด (หรือ MSB / MSW โดยที่ MSW = MST-MSB), (2) ความแตกต่างระหว่างค่าเฉลี่ยของกลุ่มคือความแปรปรวนและ (3) เราทดสอบอย่างชัดเจน vs . ( ) หากคุณสามารถถ่ายทอดความคิดเหล่านั้นลงในจอแสดงผลกราฟิก - ซึ่งน่าจะเป็นกรณีนี้ - จากนั้นฉันคิดว่าคุณเกือบจะเสร็จแล้ว H0: μ1=μ2==μk H1:  i,j | μiμjH1¬ H0
chl

สวัสดี chl ขอบคุณสำหรับข้อเสนอแนะในเชิงบวก (และสำหรับคำตอบรายละเอียดก่อนหน้าของคุณ)! ฉันคิดว่าการนวดกลับบ้านที่ใหญ่ที่สุดที่ฉันได้รับจากการเตรียมเนื้อหาสำหรับชั้นเรียนนี้คือ: 1) วิธีอธิบายการเปลี่ยนแปลงของข้อมูลต้นฉบับเพื่อรับมาตรการแปรปรวนของ MSB และ MSW 2) สถิติการทดสอบของ MSB / MSW เป็นจริงการทดสอบด้านเดียว (ไม่ใช่สองด้าน) โดยที่ H0 คือ MSB <= MSW สุดท้ายฉันแค่คิดว่าจะทราบว่ามันเป็นความจริงที่ SSW = SST-SSB (แต่ฉันไม่เห็นว่ามันเป็นความจริงสำหรับ MSW = MST-MSB)
Tal Galili

1
ใช่ขอโทษฉันเขียนอย่างรวดเร็ว ฉันหมายถึง: พิจารณาโมเดลหรือและไฮไลต์กราฟิกที่ย่อยสลายต่อไปนี้:นั่นคือ obs จะแสดงเป็นส่วนเบี่ยงเบนจากค่าเฉลี่ยยิ่งใหญ่ + ค่าเฉลี่ยกลุ่ม + ความผันผวนรอบค่าเฉลี่ยกลุ่ม จากนั้นเรามีหรือการเปลี่ยนแปลงทั้งหมด = ระหว่าง การเปลี่ยนแปลงกลุ่ม + รูปแบบภายในกลุ่ม (ซึ่งเป็นภาพแรกของคุณ) yij=μ+αi+εijyij=μi+εijyij=yi¯+εij=y¯+(y¯iy¯)+(yijy¯i)(yijy¯)=(y¯iy¯)+(yijy¯i)
chl

12

เนื่องจากเรารวบรวมกราฟที่ดีบางประเภทในโพสต์นี้ต่อไปนี้เป็นอีกสิ่งที่ฉันค้นพบเมื่อเร็ว ๆ นี้และอาจช่วยให้คุณเข้าใจวิธีการทำงานของ ANOVA และวิธีสร้างสถิติ F กราฟิกถูกสร้างขึ้นโดยใช้แพ็กเกจgranovaใน R ข้อความแสดงแทน


2
(+1) ฉันให้ลิงก์ไปยังบทความของ Robert Pruzek แต่ฉันไม่รู้ว่ามันมีอยู่ใน R.
chl

10

ตรวจสอบการนำเสนอของ Hadley Wickham ( pdf , mirror ) บน ggplot เริ่มต้นในหน้า 23-40 ของเอกสารนี้เขาอธิบายวิธีการที่น่าสนใจในการแสดงภาพ ANOVAs

* ลิงค์มาจาก: http://had.co.nz/ggplot2/


6

เป็นคำถามที่ดีมาก คุณรู้ไหมว่าฉันได้ดิ้นรนกับการโอบรอบ ANOVA เป็นเวลานานมาก ฉันมักจะพบว่าตัวเองกลับไปที่สัญชาตญาณ "ระหว่างกับภายใน" และฉันก็พยายามจินตนาการอยู่เสมอว่าสิ่งนี้จะเป็นอย่างไรในหัวของฉัน ฉันดีใจที่คำถามนี้เกิดขึ้นและฉันรู้สึกทึ่งกับวิธีการที่หลากหลายในคำตอบข้างต้น

อย่างไรก็ตามเป็นเวลานานหลายปีแล้วที่ฉันต้องการรวบรวมแปลงหลายแห่งในที่เดียวที่ฉันสามารถเห็นสิ่งที่เกิดขึ้นพร้อมกันจากหลายทิศทาง: 1) ประชากรมีความห่างกันอย่างไร 2) ห่างกันข้อมูลที่มี 3) วิธีการใหญ่เป็นระหว่างเมื่อเทียบกับภายในและ 4) วิธีการทำกลางเมื่อเทียบกับnoncentralแจกแจง F เปรียบเทียบ?

ในโลกที่ยิ่งใหญ่อย่างแท้จริงฉันสามารถเล่นกับตัวเลื่อนเพื่อดูว่าขนาดของกลุ่มตัวอย่างเปลี่ยนแปลงไปอย่างไร

ดังนั้นฉันจึงได้เล่นกับmanipulateคำสั่งในRStudioและวัวศักดิ์สิทธิ์มันใช้งานได้! นี่คือหนึ่งในแผนการภาพรวมจริง ๆ :

visualizeANOVA

หากคุณมี RStudio คุณจะได้รับรหัสสำหรับการทำพล็อตข้างต้น (ตัวเลื่อนและทั้งหมด)! บน Github ที่นี่

หลังจากเล่นกับเรื่องนี้ซักพักฉันก็ประหลาดใจที่สถิติ F แตกต่างจากกลุ่มได้ดีถึงขนาดขนาดกลุ่มตัวอย่างที่เล็ก เมื่อฉันดูที่ประชากรพวกเขาไม่ได้อยู่ห่างไกลกันมากนัก (ถึงตาฉัน) แต่แถบ "ภายใน" นั้นถูกแคระโดยแถบ "ระหว่าง" อย่างต่อเนื่อง เรียนรู้บางสิ่งทุกวันฉันเดา


3

เพื่อแสดงให้เห็นถึงสิ่งที่เกิดขึ้นกับการวิเคราะห์ความแปรปรวนแบบทางเดียวในบางครั้งฉันได้ใช้แอปเพล็ตที่ผู้เขียน "แนะนำให้รู้จักกับการปฏิบัติทางสถิติ" ซึ่งช่วยให้นักเรียนสามารถเล่นกับภายในและระหว่างความแปรปรวนและสังเกตเห็นผลกระทบต่อสถิติ F . นี่คือลิงค์ (แอปเพล็ตเป็นอันสุดท้ายในหน้า) ภาพหน้าจอตัวอย่าง:

ป้อนคำอธิบายรูปภาพที่นี่

ผู้ใช้ควบคุมแถบเลื่อนด้านบนที่แตกต่างกันกระจายแนวตั้งของข้อมูลสามกลุ่ม จุดสีแดงที่ด้านล่างเคลื่อนที่ไปตามพล็อตของค่า p ในขณะที่สถิติ F ที่แสดงด้านล่างได้รับการปรับปรุง


2

ดูเหมือนว่าเรือได้แล่นไปแล้วในแง่ของคำตอบ แต่ฉันคิดว่าถ้านี่เป็นหลักสูตรเบื้องต้นที่การจัดแสดงส่วนใหญ่ที่นี่จะยากเกินไปที่จะเข้าใจสำหรับนักเรียนที่เริ่มต้น ... หรืออย่างน้อยที่สุดด้วย ยากที่จะเข้าใจโดยไม่มีหน้าจอเบื้องต้นซึ่งให้คำอธิบายที่ง่ายมากเกี่ยวกับความแปรปรวนของการแบ่ง แสดงให้พวกเขาเห็นว่าการเพิ่มขึ้นของจำนวนรวมของ SST มีจำนวนอาสาสมัครอย่างไร จากนั้นหลังจากแสดงให้เห็นถึงการพองตัวของอาสาสมัครหลายคน (อาจเพิ่มหนึ่งรายการในแต่ละกลุ่มหลาย ๆ ครั้ง) ให้อธิบายว่า SST = SSB + SSW (แม้ว่าฉันชอบที่จะเรียกมันว่า SSE ตั้งแต่เริ่มแรกเพราะหลีกเลี่ยงความสับสน ) จากนั้นแสดงให้พวกเขาเห็นภาพของการแบ่งพาร์ทิชันความแปรปรวนเช่นรหัสสีสี่เหลี่ยมขนาดใหญ่เพื่อให้คุณสามารถดูว่า SST ทำจาก SSB และ SSW ได้อย่างไร จากนั้น


2

นี่คือตัวแทนของสถานการณ์บางคนซึ่งในการวิเคราะห์ความแปรปรวนจะสรุปให้อยู่ในระดับที่แตกต่างกันพอดีระหว่างและXXYX

ป้อนคำอธิบายรูปภาพที่นี่

ป้อนคำอธิบายรูปภาพที่นี่

ป้อนคำอธิบายรูปภาพที่นี่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.