สาเหตุหลักที่ใช้การไล่ระดับสีแบบไล่ระดับสำหรับการถดถอยเชิงเส้นคือความซับซ้อนในการคำนวณ: มันถูกกว่าการคำนวณ (เร็วกว่า) เพื่อค้นหาวิธีแก้ปัญหาโดยใช้การไล่ระดับสีแบบลาดชันในบางกรณี
สูตรที่คุณเขียนนั้นดูเรียบง่ายมากแม้กระทั่งการคำนวณเพราะมันใช้ได้กับกรณีที่ไม่แปรเปลี่ยนเช่นเมื่อคุณมีตัวแปรเพียงตัวเดียว ในกรณีที่หลายตัวแปรเมื่อคุณมีตัวแปรหลายสูตรเล็กน้อยที่ซับซ้อนมากขึ้นบนกระดาษและต้องมากการคำนวณมากขึ้นเมื่อคุณใช้มันในซอฟต์แวร์:
นี่คุณ จำเป็นต้องคำนวณเมทริกซ์จากนั้นกลับด้าน (ดูหมายเหตุด้านล่าง) เป็นการคำนวณราคาแพง สำหรับการอ้างอิงของคุณเมทริกซ์ X (ออกแบบ) มี K + 1 คอลัมน์โดยที่ K คือจำนวนของตัวทำนายและแถวการสังเกต N แถว ในอัลกอริทึมการเรียนรู้ของเครื่องคุณสามารถจบด้วย K> 1,000 และ N> 1,000,000 เมทริกซ์ตัวเองใช้เวลาสักครู่ในการคำนวณแล้วคุณจะต้องกลับX ′ X X ′ X K × K
β= ( X'X)- 1X'Y
X'XX'XK× K matrix - มันมีราคาแพง
ดังนั้นการไล่ระดับสีจะช่วยให้ประหยัดเวลาในการคำนวณได้มาก ยิ่งไปกว่านั้นวิธีที่ทำนั้นช่วยให้สามารถทำการขนานได้เล็กน้อยเช่นการกระจายการคำนวณข้ามโปรเซสเซอร์หรือเครื่องจักรหลายเครื่อง วิธีแก้ปัญหาพีชคณิตเชิงเส้นยังสามารถทำให้ขนานกันได้ แต่มันซับซ้อนและมีราคาแพงกว่า
นอกจากนี้ยังมีรุ่นต่างๆของการไล่ระดับสีเมื่อคุณเก็บข้อมูลเพียงส่วนเดียวในหน่วยความจำซึ่งจะลดข้อกำหนดสำหรับหน่วยความจำคอมพิวเตอร์ โดยรวมแล้วสำหรับปัญหาที่มีขนาดใหญ่เป็นพิเศษนั้นจะมีประสิทธิภาพมากกว่าโซลูชันพีชคณิตเชิงเส้น
สิ่งนี้มีความสำคัญมากยิ่งขึ้นเมื่อมิติข้อมูลเพิ่มขึ้นเมื่อคุณมีตัวแปรหลายพันตัวเช่นในการเรียนรู้ของเครื่อง
คำพูด ฉันรู้สึกประหลาดใจที่ได้รับความสนใจจากการไล่ระดับสีในการบรรยายของ Ng เขาใช้เวลาพูดคุยเกี่ยวกับเรื่องแบบไม่สำคัญบางทีอาจเป็น 20% ของหลักสูตรทั้งหมด สำหรับฉันมันเป็นเพียงรายละเอียดการติดตั้งมันเป็นวิธีที่คุณค้นหาสิ่งที่ดีที่สุด กุญแจสำคัญในการกำหนดปัญหาการเพิ่มประสิทธิภาพและวิธีการที่คุณพบว่ามันไม่จำเป็น ฉันจะไม่กังวลเกี่ยวกับมันมากเกินไป ปล่อยให้คนวิทยาศาสตร์คอมพิวเตอร์และมุ่งเน้นไปที่สิ่งที่สำคัญสำหรับคุณในฐานะนักสถิติ
มีกล่าวนี้ฉันจะต้องมีคุณสมบัติโดยบอกว่าเป็นจริงสำคัญที่จะเข้าใจซับซ้อนในการคำนวณตัวเลขและความมั่นคงของขั้นตอนวิธีการแก้ปัญหา ฉันยังไม่คิดว่าคุณต้องรู้รายละเอียดของการติดตั้งและรหัสของอัลกอริทึม มันไม่ใช่การใช้เวลาของคุณอย่างดีที่สุดในฐานะนักสถิติ
หมายเหตุ 1 ฉันเขียนว่าคุณต้องกลับเมทริกซ์เพื่อจุดประสงค์การสอนและไม่ใช่วิธีที่คุณแก้สมการ ในทางปฏิบัติปัญหาพีชคณิตเชิงเส้นได้รับการแก้ไขโดยใช้การแยกตัวประกอบบางอย่างเช่น QR ซึ่งคุณไม่ได้สลับเมทริกซ์โดยตรง แต่ทำกิจวัตรเทียบเท่าคณิตศาสตร์อื่น ๆ คุณทำเช่นนี้เพราะการผกผันของเมทริกซ์เป็นการดำเนินการที่มีราคาแพงและไม่เสถียรในหลายกรณี
สิ่งนี้นำมาซึ่งข้อดีอีกเล็กน้อยของอัลกอริธึมการไล่ระดับสีแบบลาดเอียงเป็นผลข้างเคียง: มันทำงานได้แม้เมื่อเมทริกซ์การออกแบบมีปัญหาเรื่องความเป็นคู่ เส้นทางพีชคณิตเชิงเส้นตามปกติจะระเบิดขึ้นและโคตรลาดชันจะยังคงดำเนินต่อไปแม้กระทั่งสำหรับตัวคาดการณ์ collinear