การถดถอยเชิงเส้นล้าสมัยหรือไม่ [ปิด]


12

ขณะนี้ฉันอยู่ในชั้นเรียนการถดถอยเชิงเส้น แต่ฉันไม่สามารถสั่นคลอนความรู้สึกว่าสิ่งที่ฉันกำลังเรียนรู้ไม่เกี่ยวข้องในสถิติที่ทันสมัยหรือการเรียนรู้ของเครื่อง เหตุใดจึงใช้เวลามากกับการอนุมานในการถดถอยเชิงเส้นแบบง่าย ๆ หรือหลายครั้งเมื่อชุดข้อมูลที่น่าสนใจมากมายในสมัยนี้ละเมิดข้อสันนิษฐานที่ไม่สมจริงหลายประการของการถดถอยเชิงเส้น ทำไมไม่สอนการอนุมานเกี่ยวกับเครื่องมือที่ทันสมัยและยืดหยุ่นกว่าเช่นการถดถอยโดยใช้เครื่องเวกเตอร์สนับสนุนหรือกระบวนการ Gaussian แม้ว่าจะซับซ้อนกว่าการหาไฮเปอร์เพลนในอวกาศ แต่สิ่งนี้จะไม่ให้ภูมิหลังที่ดีกว่าสำหรับการจัดการปัญหาวันสมัยใหม่หรือไม่?


10
ไขควงทำค้อนล้าสมัยหรือไม่? หรือแต่ละคนทำงานแตกต่างกันอย่างไร
Sycorax พูดว่า Reinstate Monica

6
ฉันมีมัลติทูลที่ทำหน้าที่เป็นมีดเลื่อยไขควงสองอันที่แตกต่างกันคีมหนึ่งคู่และอาจเป็นสองสิ่งอื่น ๆ แต่เมื่อฉันต้องการเครื่องมือเหล่านี้มันเป็นสิ่งสุดท้ายที่ฉันจะทำได้ มันมีประโยชน์ในการเหน็บแนมมันไม่เคยเป็น "เครื่องมือที่ดีที่สุดสำหรับงาน"
Darren

7
หลาย ๆ สถานการณ์ที่คนจริงเผชิญนั้นเกี่ยวข้องกับชุดข้อมูลขนาดเล็กมากที่มีเสียงรบกวนสูง ในหลาย ๆ กรณีแบบจำลองที่ซับซ้อนกว่านั้นไม่สามารถทำได้ในขณะที่อย่างน้อยเศษส่วนของเวลาที่เป็นแบบเชิงเส้นแบบธรรมดาอย่างน้อยก็สามารถใช้การได้ ในขณะที่ชุดข้อมูลขนาดใหญ่ (และปัญหาที่เกี่ยวข้อง) จะยังคงเติบโตตามสัดส่วนของการวิเคราะห์ข้อมูลทั้งหมดที่ดำเนินต่อไป แต่ชุดข้อมูลขนาดเล็กมากและการวิเคราะห์ที่ค่อนข้างง่ายที่พวกเขาพึ่งพาจะไม่มีวันหายไป ยิ่งไปกว่านั้นเครื่องมือที่ซับซ้อนยิ่งขึ้นได้ถูกสร้างขึ้นบนเครื่องมือที่เรียบง่ายไม่ใช่แค่ในอดีต แต่เป็นแนวคิด
Glen_b -Reinstate Monica

6
นอกเหนือจากหลาย ๆ สถานการณ์ที่การถดถอยเชิงเส้นเป็นการใช้งานจริงอย่างต่อเนื่องมันก็คุ้มค่าที่ชี้ให้เห็นว่ามันเป็นพื้นฐานในการเรียนรู้เกี่ยวกับโมเดลเสริมที่ซับซ้อนยิ่งขึ้น ในส่วนนั้นคำถามนี้ก็คล้าย ๆ กับการถามว่าแคลคูลัสทำให้คณิตศาสตร์ล้าสมัยหรือไม่
Jacob Socolar

1
@ Aksakal กรุณาอธิบายอย่างละเอียด สิ่งที่เกี่ยวกับการใช้ในการเพิ่มประสิทธิภาพแบบเบย์?
Mark L. Stone

คำตอบ:


24

มันเป็นความจริงที่สมมติฐานของการถดถอยเชิงเส้นไม่เหมือนจริง อย่างไรก็ตามนี่เป็นความจริงของแบบจำลองทางสถิติทั้งหมด "ทุกรุ่นผิด แต่บางรุ่นก็มีประโยชน์"

ฉันคิดว่าคุณอยู่ภายใต้การแสดงผลที่ไม่มีเหตุผลที่จะใช้การถดถอยเชิงเส้นเมื่อคุณสามารถใช้แบบจำลองที่ซับซ้อนมากขึ้น สิ่งนี้ไม่เป็นความจริงเพราะโดยทั่วไปแล้วโมเดลที่ซับซ้อนกว่านั้นมีความเสี่ยงที่จะเกิดการ overfitting มากขึ้นและพวกเขาใช้ทรัพยากรการคำนวณมากขึ้นซึ่งมีความสำคัญหากเช่นคุณกำลังพยายามทำสถิติบนโปรเซสเซอร์ที่ฝังตัวหรือเว็บเซิร์ฟเวอร์ โมเดลที่เรียบง่ายนั้นง่ายต่อการเข้าใจและตีความ; ในทางตรงกันข้ามโมเดลการเรียนรู้ด้วยเครื่องที่ซับซ้อนเช่นเครือข่ายประสาทมีแนวโน้มที่จะจบลงด้วยกล่องดำไม่มากก็น้อย

แม้ว่าสักวันการถดถอยเชิงเส้นจะไม่มีประโยชน์อีกต่อไปในทางปฏิบัติ (ซึ่งดูเหมือนไม่น่าเป็นไปได้อย่างมากในอนาคตอันใกล้) มันจะยังคงมีความสำคัญทางทฤษฎีเนื่องจากแบบจำลองที่ซับซ้อนมากขึ้นมีแนวโน้มที่จะสร้างการถดถอยเชิงเส้น ตัวอย่างเช่นในการทำความเข้าใจการถดถอยโลจิสติกส์แบบผสมเอฟเฟ็กต์ปกติคุณต้องเข้าใจการถดถอยเชิงเส้นเก่าแบบธรรมดาก่อน

นี่ไม่ได้เป็นการบอกว่าแบบจำลองที่ซับซ้อนใหม่และใหม่กว่านั้นไม่มีประโยชน์หรือสำคัญ หลายคนมี แต่โมเดลที่เรียบง่ายกว่านั้นจะมีการใช้กันอย่างแพร่หลายและมีความสำคัญมากกว่าและชัดเจนกว่าหากคุณจะนำเสนอโมเดลที่หลากหลาย มีการวิเคราะห์ข้อมูลที่ไม่ดีจำนวนมากที่ดำเนินการในวันนี้โดยผู้ที่เรียกตัวเองว่า "นักวิทยาศาสตร์ข้อมูล" หรือบางอย่าง แต่ไม่รู้จักสิ่งที่เป็นรากฐานเช่นช่วงความมั่นใจจริงๆ อย่าเป็นสถิติ!


คุณช่วยอธิบายสิ่งที่คุณหมายถึงโดย "โมเดลที่ซับซ้อน" ได้ไหม? OP หมายถึงสิ่งเดียวกันหรือไม่
Hatshepsut

1
@Hatshepsut แทบทุกอย่างที่ไม่ได้เป็นเพียงแค่การถดถอยเชิงเส้นหรือเป็นกรณีพิเศษ OP ให้รูปแบบ SVM และ Gaussian เป็นตัวอย่าง ฉันพูดถึงแบบผสมการถดถอยโลจิสติกส์และการถดถอยเชิงลงโทษ ตัวอย่างอื่น ๆ ได้แก่ ต้นไม้ตัดสินใจเครือข่ายประสาท MARS แบบจำลองลำดับชั้นแบบเบย์และโมเดลสมการโครงสร้าง หากคุณถามว่าเราตัดสินใจได้อย่างไรว่าแบบจำลองหนึ่งมีความซับซ้อนมากกว่าแบบอื่นหรือสิ่งที่นับว่าเป็นแบบจำลองนั้นเป็นคำถามที่ผ่านการตรวจสอบความถูกต้องแล้ว
ประสาทวิทยา

"อิง"; เหมือนกับการใช้พหุนามลำดับเก้าเพื่อปรับให้เข้ากับบางสิ่งที่กลายเป็นผลรวมของการยกกำลังแบบถ่วงน้ำหนัก มันเหมาะกับการแปลงที่ทำซ้ำความผิดพลาดของเครื่องมือที่อยู่เหนือระดับเสียงรบกวน ฉันยังสงสัยว่าการใช้พหุนามนั้นจะใช้งานได้ดีขึ้นจริงหรือไม่
โจชัว

7

การถดถอยเชิงเส้นโดยทั่วไปจะไม่ล้าสมัย ยังมีคนที่ทำงานวิจัยเกี่ยวกับวิธีการที่เกี่ยวข้องกับ LASSO และวิธีที่พวกเขาเกี่ยวข้องกับการทดสอบหลายรายการ - คุณสามารถ google Emmanuel Candes และ Malgorzata Bogdan

หากคุณกำลังถามเกี่ยวกับอัลกอริทึมของ OLS โดยเฉพาะคำตอบว่าทำไมพวกเขาถึงสอนวิธีนี้ก็คือวิธีการนั้นง่ายมากจนมีวิธีแก้ปัญหาแบบปิด นอกจากนี้มันง่ายกว่าการถดถอยแบบสันหรือรุ่นที่มี lasso / elasticnet คุณสามารถสร้างสัญชาตญาณ / บทพิสูจน์ของคุณเกี่ยวกับวิธีแก้ปัญหาการถดถอยเชิงเส้นอย่างง่ายจากนั้นเสริมโมเดลด้วยข้อ จำกัด เพิ่มเติม


3

ฉันไม่คิดว่าการถดถอยนั้นเก่าไปแล้วมันอาจถูกมองว่าเป็นเรื่องเล็กน้อยสำหรับปัญหาบางอย่างที่นักวิทยาศาสตร์ด้านข้อมูลกำลังเผชิญอยู่ในขณะนี้ แต่ยังคงเป็น ABC ของการวิเคราะห์ทางสถิติ คุณจะเข้าใจได้อย่างไรว่า SVM ทำงานอย่างถูกต้องหากคุณไม่รู้ว่ารุ่นที่ง่ายที่สุดทำงานอย่างไร การใช้เครื่องมือง่ายๆนี้จะสอนวิธีดูข้อมูลก่อนที่จะกระโดดเข้าสู่โมเดลที่ซับซ้อนอย่างบ้าคลั่งและเข้าใจอย่างลึกซึ้งว่าเครื่องมือใดที่สามารถใช้ในการวิเคราะห์ต่อไปและไม่สามารถทำได้ เมื่อมีการสนทนากับอาจารย์และเพื่อนร่วมงานของฉันเธอบอกฉันว่านักเรียนของเธอมีความสามารถในการใช้แบบจำลองที่ซับซ้อน แต่พวกเขาไม่สามารถเข้าใจได้ว่าการใช้ประโยชน์คืออะไรหรืออ่าน qq-plot ง่ายๆเพื่อทำความเข้าใจกับสิ่งที่ผิด บ่อยครั้งในรูปแบบที่ง่ายและอ่านง่ายที่สุดคือความสวยงาม


3

คำตอบสั้น ๆ คือไม่มี ตัวอย่างเช่นหากคุณลองใช้โมเดลเชิงเส้นด้วยข้อมูล MNIST คุณจะยังคงได้รับความแม่นยำประมาณ 90%!

คำตอบที่ยาวจะเป็น "ขึ้นอยู่กับโดเมน" แต่ตัวแบบเชิงเส้นใช้กันอย่างแพร่หลาย

  • ในบางสาขาพูดว่าการศึกษาทางการแพทย์มันแพงมากที่จะได้รับหนึ่งจุดข้อมูล และงานวิเคราะห์ยังคงคล้ายกับเมื่อหลายปีก่อน: การถดถอยเชิงเส้นยังคงมีบทบาทสำคัญมาก

  • ในการเรียนรู้ของเครื่องมอร์เดนพูดการจัดประเภทข้อความแบบจำลองเชิงเส้นยังคงมีความสำคัญมากแม้ว่าจะมีรูปแบบที่นักเล่นอื่น ๆ นี่เป็นเพราะตัวแบบเชิงเส้นนั้น "เสถียร" มากมันจะมีน้อยกว่าที่จะพอดีกับข้อมูล

ในที่สุดโมเดลเชิงเส้นเป็นหน่วยการสร้างจริงสำหรับโมเดลส่วนใหญ่อื่น ๆ การเรียนรู้อย่างดีจะเป็นประโยชน์ต่อคุณในอนาคต


2

ในแง่การปฏิบัติการถดถอยเชิงเส้นมีประโยชน์แม้ว่าคุณจะใช้โมเดลที่ซับซ้อนมากขึ้นสำหรับงานของคุณ กุญแจสำคัญคือการถดถอยเชิงเส้นนั้นง่ายต่อการเข้าใจและใช้งานง่ายเพื่อเข้าใจแนวคิดว่าเกิดอะไรขึ้นในโมเดลที่ซับซ้อนมากขึ้น

ฉันสามารถเสนอตัวอย่างแอปพลิเคชันที่ใช้งานได้จริงจากงานจริงของฉันในฐานะนักวิเคราะห์ทางสถิติ หากคุณพบว่าตัวเองอยู่ในป่าที่ไม่มีผู้ดูแลพร้อมกับชุดข้อมูลขนาดใหญ่และหัวหน้าของคุณขอให้คุณทำการวิเคราะห์เกี่ยวกับมันคุณจะเริ่มต้นที่ไหน ถ้าคุณไม่คุ้นเคยกับชุดข้อมูลและไม่มีความคิดที่ดีว่าคุณลักษณะต่าง ๆ นั้นเกี่ยวข้องกับกันและกันอย่างไรโมเดลที่ซับซ้อนอย่างที่คุณแนะนำคือสถานที่ที่ไม่ดีในการเริ่มตรวจสอบ

จุดเริ่มต้นที่ดีที่สุดคือการถดถอยเชิงเส้นแบบง่าย ๆ ทำการวิเคราะห์การถดถอยดูที่ค่าสัมประสิทธิ์และกราฟส่วนที่เหลือ เมื่อคุณเริ่มเห็นว่าเกิดอะไรขึ้นกับข้อมูลจากนั้นคุณสามารถตัดสินใจบางอย่างเกี่ยวกับวิธีการขั้นสูงที่คุณจะพยายามใช้

ฉันยืนยันว่าถ้าคุณเพิ่งเสียบข้อมูลของคุณลงในกล่องดำแบบขั้นสูงอย่าง sklearn.svm (ถ้าคุณเป็น Python) คุณจะมีความมั่นใจต่ำมากว่าผลลัพธ์ของคุณจะมีความหมาย

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.