การถดถอยเชิงเส้นหลายครั้งใน 3 มิติเป็นระนาบที่พอดีที่สุดหรือเป็นเส้นที่พอดีที่สุดหรือไม่?


11

ศาสตราจารย์ของเราไม่ได้เข้าสู่คณิตศาสตร์หรือแม้แต่การแสดงเชิงเรขาคณิตของการถดถอยเชิงเส้นหลายเส้นและสิ่งนี้ทำให้ฉันสับสนเล็กน้อย

ในอีกด้านหนึ่งก็ยังคงเรียกว่าการถดถอยเชิงเส้นหลายครั้งแม้ในมิติที่สูงขึ้น ในทางกลับกันถ้าเรามีตัวอย่างเช่นY = 0 + 1 X 1 + B 2 X 2และเราสามารถเสียบค่าใด ๆ ที่เราต้องการสำหรับX 1และX 2จะไม่ให้นี้เรา ระนาบของการแก้ปัญหาที่เป็นไปได้และไม่ใช่เส้น?Y^=b0+b1X1+b2X2X1X2

โดยทั่วไปแล้วพื้นผิวของการทำนายของเราจะเป็นไฮเปอร์เพลทมิติสำหรับตัวแปรอิสระkkk

คำตอบ:


12

คุณพูดถูกพื้นผิวการแก้ปัญหาจะเป็นไฮเปอร์เพลนโดยทั่วไป เป็นเพียงว่าคำไฮเปอร์เพลนเป็นคำหนึ่งเครื่องบินสั้นกว่าและเส้นสั้นกว่า เมื่อคุณดำเนินการทางคณิตศาสตร์ต่อไปกรณีมิติเดียวจะถูกกล่าวถึงน้อยลงเรื่อย ๆ

Big words for high dimensional, Small words for small dimensional

เริ่มดูดีย้อนหลัง

Ax=bAx,b

นอกจากนี้ยังเกิดขึ้นกับสัญกรณ์ เคยเห็นคนเขียน

fx=2x

สัญลักษณ์ทางด้านซ้ายนั้นเป็นชื่อของฟังก์ชันดังนั้นเพื่อความเป็นทางการและความคล่องแคล่วคุณควรเขียน

fx(x)=2x

มันแย่กว่าเดิมในหลายมิติเมื่อการอนุมานต้องใช้สองข้อโต้แย้งข้อแรกคือสิ่งที่คุณทำอนุพันธ์และอีกอันอยู่ในทิศทางที่คุณประเมินอนุพันธ์ซึ่งดูเหมือนว่า

xf(v)

แต่ผู้คนขี้เกียจอย่างรวดเร็วและเริ่มทิ้งข้อโต้แย้งหนึ่งข้อใด ๆ ทำให้พวกเขาเข้าใจบริบท

นักคณิตศาสตร์มืออาชีพลิ้นมั่นในแก้มเรียกสิ่งนี้ว่าการละเมิดของสัญกรณ์ มีอาสาสมัครในสิ่งที่มันจะเป็นไปไม่เป็นหลักในการแสดงตัวเองโดยไม่ต้องเหยียดหยามสัญกรณ์ที่รักของฉันเรขาคณิตต่างกันเป็นกรณีในจุด Nicolas Bourbaki ผู้ยิ่งใหญ่แสดงจุดนี้อย่างละเอียด

เท่าที่เป็นไปได้เราได้ให้ความสนใจในข้อความถึงการใช้ภาษาในทางที่ผิดโดยที่ข้อความทางคณิตศาสตร์ใด ๆ มีความเสี่ยงต่อการใช้ภาษาพูดคุยไม่ได้

- Bourbaki (1988)

คุณยังแสดงความคิดเห็นเกี่ยวกับการใช้สัญลักษณ์ในทางที่ผิดที่ฉันตกลงไปโดยที่ไม่ได้สังเกตเห็นด้วยตัวเอง!

ในทางเทคนิคเนื่องจากคุณเขียน df / dx เป็นอนุพันธ์ย่อยบางส่วนถึงแม้ว่าตัวแปรอื่น ๆ จะถือเป็นค่าคงที่ แต่อนุพันธ์ทางเทคนิคบางส่วนจะยังคงเป็นฟังก์ชันของตัวแปรทั้งหมดของฟังก์ชันต้นฉบับเช่นเดียวกับใน df / dx ( x, y, ... )?

คุณถูกต้องอย่างสมบูรณ์และนี่เป็นตัวอย่างที่ดี (โดยไม่ได้ตั้งใจ) ของสิ่งที่ฉันได้รับที่นี่

dfdx

คิดว่าฉันคิดว่ามันเป็นเมื่อเราพูดว่า "ผลรวมไม่มีที่สิ้นสุด" แทน "ขีด จำกัด ของผลรวมเป็นจำนวนคำศัพท์ที่เข้าใกล้อนันต์" วิธีที่ฉันคิดเกี่ยวกับมันก็คือมันเป็นเรื่องดีตราบใดที่ความแตกต่างทางแนวคิดนั้นชัดเจน ในกรณีนี้ (การถดถอยหลายครั้ง) ฉันไม่แน่ใจว่าสิ่งที่เรากำลังพูดถึงในตอนแรก

Σ

ในฐานะคนขี้เกียจเราต้องการประหยัดคำในกรณีทั่วไป

(*) ในอดีตนี่ไม่ใช่วิธีการหาผลรวมจำนวนอนันต์ ข้อ จำกัด ของผลรวมบางส่วนได้รับการพัฒนาด้านหลังเมื่อนักคณิตศาสตร์เริ่มพบกับสถานการณ์ที่จำเป็นต้องให้เหตุผลอย่างแม่นยำ


มันตลกที่คุณให้ตัวอย่างของอนุพันธ์บางส่วนเพราะฉันเคยสงสัยเกี่ยวกับเรื่องนั้นเสมอ (ความสุขของการศึกษาด้วยตนเอง ... ) โดยวิธีการ (ไม่เกี่ยวข้องและไม่ใช่ฉันอวดรู้ แต่เพียงต้องการให้แน่ใจว่าฉันเข้าใจมากที่สุด) ในทางเทคนิคเนื่องจากคุณเขียน df / dx เป็นอนุพันธ์ย่อยบางส่วนถึงแม้ว่าตัวแปรอื่น ๆ จะมีค่าคงที่ เทคนิคอนุพันธ์บางส่วนยังคงเป็นฟังก์ชันของตัวแปรทั้งหมดของฟังก์ชันดั้งเดิมเช่นเดียวกับใน df / dx (x, y, ... )? ฉันเดาว่าคำถามของฉันไม่ใช่อนุพันธ์ย่อยบางส่วนยังคงเป็นฟังก์ชันของตัวแปรทั้งหมดใช่หรือไม่
jeremy radcliff

นอกจากนี้ขอขอบคุณที่อธิบายทั้งหมดนี้ ฉันคิดว่าฉันคิดว่ามันเป็นเมื่อเราพูดว่า "ผลรวมอนันต์" แทน "ขีด จำกัด ของผลรวมเนื่องจากจำนวนคำศัพท์เข้าใกล้อนันต์" วิธีที่ฉันคิดเกี่ยวกับมันก็คือมันเป็นเรื่องดีตราบใดที่ความแตกต่างทางแนวคิดนั้นชัดเจน ในกรณีนี้ (การถดถอยหลายครั้ง) ฉันไม่แน่ใจว่าสิ่งที่เรากำลังพูดถึงในตอนแรก ฉันพยายามจินตนาการถึงเส้นหนึ่งในสามมิติแล้วก็รู้ว่ามันไม่สมเหตุสมผลถ้าเราปล่อยให้ตัวแปรอิสระหลายตัวเปลี่ยนแปลงได้อย่างอิสระดังนั้นฉันแค่ต้องการให้แน่ใจ
jeremy radcliff

+1 คำตอบที่ดี บางครั้งคนขี้เกียจและจะทำให้เกิดความสับสนมาก นั่นคือเหตุผลที่ฉันพยายามถามสัญลักษณ์ในโพสต์นี้ stats.stackexchange.com/questions/216286/…
Haitao Du

@ jeremyradcliff ฉันแก้ไขในความเห็นบางส่วน
Matthew Drury

@ MatthewDrury ขอขอบคุณที่สละเวลาเพื่อแสดงความคิดเห็นของฉัน มันมีประโยชน์มากสำหรับฉันเพราะฉันศึกษาด้วยตนเองส่วนใหญ่ของคณิตศาสตร์ที่ฉันรู้และการขาดวัฒนธรรมโดยรอบและการเข้าถึงนักคณิตศาสตร์ทำให้สถานที่เช่น stackexchange และคำตอบเช่นเดียวกับคุณล้ำค่าสำหรับฉัน
jeremy radcliff

5

"เชิงเส้น" ไม่ได้หมายถึงสิ่งที่คุณคิดว่ามันทำในบริบทนี้ - มันค่อนข้างกว้างกว่าทั่วไป

ประการแรกมันไม่ได้เป็นการอ้างอิงถึงความเป็นเส้นตรงใน x แต่อ้างอิงถึงพารามิเตอร์ * ("เส้นตรงในพารามิเตอร์")

E(Y|X)=Xββ

ดังนั้นระนาบ (หรือไฮเปอร์เพลนมากกว่าปกติ) ที่เหมาะสมที่สุดยังคงเป็น "การถดถอยเชิงเส้น"

1XβXβ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.