สองวิธีหลักในการทำความเข้าใจปรากฏการณ์การถดถอยดังกล่าวคือพีชคณิต - โดยจัดการกับสมการและสูตรปกติสำหรับการแก้ปัญหาของพวกเขา - และเรขาคณิต พีชคณิตดังที่อธิบายไว้ในคำถามนั้นดี แต่มีสูตรทางเรขาคณิตที่มีประโยชน์หลายอย่างของการถดถอย ในกรณีนี้การแสดงภาพข้อมูลในพื้นที่ข้อมูลเชิงลึก(x,y)(x,x2,y)ที่อาจเป็นเรื่องยากที่จะเกิดขึ้น
เราจ่ายราคาที่จำเป็นต้องดูวัตถุสามมิติซึ่งทำได้ยากบนหน้าจอคงที่ (ฉันพบว่าภาพที่หมุนวนไปเรื่อย ๆ นั้นน่ารำคาญและจะไม่สร้างความเสียหายใด ๆ กับคุณแม้ว่ามันจะมีประโยชน์ก็ตาม) ดังนั้นคำตอบนี้อาจไม่ดึงดูดทุกคน แต่ผู้ที่ต้องการเพิ่มมิติที่สามด้วยจินตนาการของพวกเขาจะได้รับรางวัล ฉันเสนอที่จะช่วยคุณในความพยายามนี้โดยใช้กราฟิกที่คัดสรรมาอย่างดี
เริ่มต้นด้วยการมองเห็นตัวแปรอิสระ ในแบบจำลองสมการถดถอยกำลังสอง
yi=β0+β1(xi)+β2(x2i)+error,(1)
สองคำและสามารถแตกต่างกันระหว่างข้อสังเกต: พวกเขาเป็นตัวแปรอิสระ เราสามารถพล็อตคู่ที่ได้รับคำสั่งทั้งหมดเป็นจุดในระนาบที่มีแกนสอดคล้องกับและ มันยังเผยให้เห็นถึงการพล็อตทุกจุดบนเส้นโค้งของคู่ที่ได้รับคำสั่ง(xi)(x2i)(xi,x2i)xx2.(t,t2):
เห็นภาพการตอบสนอง (ตัวแปรตาม) ในมิติที่สามโดยเอียงตัวเลขนี้กลับมาและใช้ทิศทางแนวตั้งสำหรับมิตินั้น การตอบสนองแต่ละครั้งจะถูกพล็อตเป็นสัญลักษณ์จุด ข้อมูลจำลองเหล่านี้ประกอบด้วยสแต็คสิบคำตอบสำหรับแต่ละตำแหน่งที่แสดงในรูปแรก ระดับความสูงที่เป็นไปได้ของแต่ละสแต็กจะแสดงด้วยเส้นแนวตั้งสีเทา:(x,x2)
การถดถอยแบบสมการกำลังสองเหมาะกับระนาบกับจุดเหล่านี้
(เราจะทราบได้อย่างไรเพราะสำหรับพารามิเตอร์ตัวเลือกใด ๆชุดของจุดในพื้นที่ที่ตรงกับสมการคือชุดศูนย์ของ ฟังก์ชั่นซึ่งกำหนดระนาบตั้งฉากกับเวกเตอร์ เรขาคณิตการวิเคราะห์บิตนี้ ซื้อการสนับสนุนเชิงปริมาณสำหรับรูปภาพด้วยเช่นกัน: เนื่องจากพารามิเตอร์ที่ใช้ในภาพประกอบเหล่านี้คือและและทั้งคู่มีขนาดใหญ่เมื่อเทียบกับระนาบนี้จะเกือบแนวตั้งและวางเชิง ทแยงมุมในระนาบ )( x , x 2 , y(β0,β1,β2),(x,x2,y)(1)−β1(x)−β2(x2)+(1)y−β0,(−β1,−β2,1).β1=−55/8β2=15/2,1,(x,x2)
นี่คือระนาบสี่เหลี่ยมน้อยที่สุดที่พอดีกับจุดเหล่านี้:
บนระนาบซึ่งเราอาจจะมีสมการของรูปแบบฉันได้ "ยก" เส้นโค้งเป็นเส้นโค้งและวาดเป็นสีดำy=f(x,x2),(t,t2)
t→(t,t2,f(t,t2))
ลองเอียงทุกอย่างกลับไปเรื่อย ๆ เพื่อให้เฉพาะแกนและกำลังแสดงอยู่โดยปล่อยแกนเพื่อวางลงจากหน้าจอสุดลูกหูลูกตา:xyx2
คุณสามารถดูได้ว่าเส้นโค้งที่ยกขึ้นนั้นเป็นวิธีการถดถอยกำลังสองที่ต้องการอย่างแม่นยำอย่างไร: มันคือโลคัสของคู่ที่ได้รับคำสั่งทั้งหมดโดยที่เป็นค่าติดตั้งเมื่อตัวแปรอิสระตั้งค่าเป็น(x,y^)y^x.
วงความเชื่อมั่นสำหรับการติดตั้งเส้นโค้งนี้แสดงให้เห็นถึงสิ่งที่สามารถเกิดขึ้นได้พอดีเมื่อจุดข้อมูลมีการเปลี่ยนแปลงแบบสุ่ม โดยไม่ต้องเปลี่ยนมุมมองฉันได้วางแผนห้าเครื่องบินติดตั้ง (และโค้งยกของพวกเขา) เป็นห้าชุดใหม่ของข้อมูลอิสระ (ซึ่งแสดงเพียงหนึ่ง):
เพื่อช่วยให้คุณเห็นสิ่งนี้ดีขึ้นฉันได้ทำให้เครื่องบินเกือบโปร่งใส เห็นได้ชัดว่าเส้นโค้งที่ยกขึ้นมีแนวโน้มที่จะมีทางแยกซึ่งกันและกันอยู่ใกล้กับและx≈1.75x≈3.
ลองดูที่สิ่งเดียวกันโดยวางตัวเหนือพล็อตสามมิติแล้วมองลงไปเล็กน้อยและตามแนวทแยงมุมของระนาบ เพื่อช่วยให้คุณเห็นการเปลี่ยนแปลงของระนาบฉันได้บีบอัดมิติตามแนวตั้ง
รั้วสีทองแนวตั้งแสดงจุดทั้งหมดที่อยู่เหนือเส้นโค้งเพื่อให้คุณสามารถเห็นได้ง่ายขึ้นว่ามันยกขึ้นไปยังระนาบที่ติดตั้งทั้งห้าได้อย่างไร โดยทั่วไปแล้วแถบความเชื่อมั่นนั้นถูกค้นพบโดยการเปลี่ยนแปลงข้อมูลซึ่งทำให้ระนาบที่ติดตั้งนั้นเปลี่ยนแปลงไปซึ่งจะเปลี่ยนเส้นโค้งที่ยกขึ้นซึ่งพวกมันจะติดตามร่องรอยของค่าติดตั้งที่เป็นไปได้ที่แต่ละค่าของ(t,t2)(x,x2).
ตอนนี้ฉันเชื่อว่าคำอธิบายทางเรขาคณิตที่ชัดเจนเป็นไปได้ เนื่องจากคะแนนของแบบฟอร์มเกือบเรียงกันในระนาบของพวกเขาเครื่องบินที่ได้รับการติดตั้งทั้งหมดจะหมุน (และกระตุกเล็กน้อย) รอบ ๆ บางเส้นที่วางอยู่เหนือจุดเหล่านั้น (ให้เป็นเส้นโครงของเส้นนั้นลงไปที่ระนาบ : มันจะใกล้เคียงกับเส้นโค้งในรูปแรกอย่างใกล้ชิด) เมื่อระนาบเหล่านั้นแปรผันจำนวนที่โค้งการยกจะเปลี่ยน ( แนวตั้ง) ที่ตำแหน่งใด ๆจะเป็นสัดส่วนโดยตรงกับระยะทางอยู่ที่(xi,x2i)L(x,x2)(x,x2)(x,x2)L.
รูปนี้กลับสู่มุมมองระนาบดั้งเดิมเพื่อแสดงเทียบกับเส้นโค้งในระนาบของตัวแปรอิสระ จุดสองจุดบนโค้งที่อยู่ใกล้กับถูกทำเครื่องหมายด้วยสีแดง ที่นี่โดยประมาณเป็นที่ซึ่งเครื่องบินที่ถูกดัดแปลงจะมีแนวโน้มที่จะอยู่ใกล้ที่สุดเนื่องจากคำตอบนั้นแตกต่างกันแบบสุ่ม ดังนั้นเส้นโค้งที่ยกขึ้นที่ค่าสอดคล้องกัน(ประมาณและ ) จะมีแนวโน้มที่จะแตกต่างกันเล็กน้อยใกล้กับจุดเหล่านี้Lt→(t,t2)Lx1.72.9
เกี่ยวกับพีชคณิตการหา "จุดสำคัญ" เหล่านั้นเป็นเรื่องของการแก้สมการกำลังสอง: ดังนั้นที่มากที่สุดของพวกเขาทั้งสองจะมีอยู่ ดังนั้นเราจึงสามารถคาดหวังได้ว่าในฐานะข้อเสนอทั่วไปว่าแถบความเชื่อมั่นของข้อมูลกำลังสองที่เหมาะสมกับอาจมีได้ถึงสองแห่งที่พวกเขาเข้ามาใกล้กันมากที่สุด แต่ไม่มากไปกว่านั้น(x,y)
การวิเคราะห์แนวคิดนี้ใช้กับการถดถอยพหุนามระดับสูงเช่นเดียวกับการถดถอยพหุคูณโดยทั่วไป แม้ว่าเราจะไม่สามารถ "เห็น" มากกว่าสามมิติอย่างแท้จริงคณิตศาสตร์ของการถดถอยเชิงเส้นรับประกันว่าสัญชาตญาณที่ได้มาจากแปลงสองและสามมิติของประเภทที่แสดงที่นี่ยังคงแม่นยำในมิติที่สูงขึ้น