การรับฟังก์ชั่นต้นทุนการถดถอยเชิงเส้นแบบปกติต่อหลักสูตรการเรียนรู้ของเครื่อง Coursera


12

ฉันใช้หลักสูตร "การเรียนรู้ของเครื่องจักร" ของ Andrew Ng ผ่านทาง Coursera เมื่อไม่กี่เดือนก่อนโดยไม่สนใจวิชาคณิตศาสตร์ / ภาควิชาส่วนใหญ่และมุ่งเน้นไปที่การนำไปใช้และการปฏิบัติจริง ตั้งแต่นั้นมาฉันเริ่มกลับไปศึกษาทฤษฎีพื้นฐานบางอย่างและกลับมาเยี่ยมการบรรยายของศ. อึ้งอีกครั้ง ฉันกำลังอ่านผ่านการบรรยายของเขาใน "Normalized Linear Regression" และเห็นว่าเขาให้ฟังก์ชั่นค่าใช้จ่ายต่อไปนี้:

J(θ)=12m[i=1m(hθ(x(i))y(i))2+λj=1nθj2]

จากนั้นเขาให้การไล่ระดับสีต่อไปนี้สำหรับฟังก์ชันต้นทุนนี้:

θjJ(θ)=1m[i=1m(hθ(x(i))y(i))xj(i)λθj]

ฉันสับสนเล็กน้อยเกี่ยวกับวิธีการที่เขาได้รับจากที่หนึ่งไปยังอีกที่ เมื่อฉันพยายามทำรากศัพท์ของตัวเองฉันได้ผลลัพธ์ดังนี้:

θjJ(θ)=1m[i=1m(hθ(x(i))+y(i))xj(i)+λθj]

ความแตกต่างคือเครื่องหมาย 'บวก' ระหว่างฟังก์ชันต้นทุนดั้งเดิมและพารามิเตอร์การทำให้เป็นมาตรฐานในสูตรของ Prof. Ng เปลี่ยนเป็นเครื่องหมาย 'ลบ' ในฟังก์ชันการไล่ระดับสีของเขาในขณะที่สิ่งนั้นไม่ได้เกิดขึ้นในผลลัพธ์ของฉัน

ฉันเข้าใจว่าทำไมมันถึงเป็นลบ: เรากำลังลดพารามิเตอร์ theta ด้วยตัวเลขการไล่ระดับสีและเราต้องการให้พารามิเตอร์ ฉันแค่ติดแคลคูลัสนิดหน่อยที่หนุนปรีชานี้

FYI คุณสามารถค้นหาสำรับที่นี่บนสไลด์ที่ 15 และ 16


1
ในผลลัพธ์ของคุณคุณมี " + " ก่อนหน้า y ^ (i) - นั่นคือการพิมพ์ผิด?
Steve S

คำตอบ:


12

J(θ)=12m[i=1m(hθ(x(i))y(i))2+λj=1nθj2]

ตอนนี้

θj(hθ(x(i))y(i))2=2[(hθ(x(i))y(i))θj{hθ(x(i))}]

โปรดทราบว่าในรูปแบบเชิงเส้น (ถูกกล่าวถึงในหน้าเว็บที่คุณพูดถึง),θj(hθ(x(i))=[x(i)]j

θjλj=1nθ2=2λθj

ดังนั้นสำหรับกรณีเชิงเส้น

θjJ(θ)=1m[i=1m(hθ(x(i))y(i))xj(i)+λθj]

ดูเหมือนว่าทั้งคุณและแอนดรูว์อาจพิมพ์ผิด อย่างน้อยสองในสามของเราดูเหมือนจะ


มันได้รับการยืนยันเพียงพิมพ์ผิดในบันทึกของแอนดรูมันควรจะเป็นเครื่องหมาย + และศาสตราจารย์อย่างถูกต้องอธิบายทุกอย่างอย่างถูกต้องรวมถึงปรีชาθ (1-α (λ / m)) ความหมายทุกครั้งที่หดตัวนี้θแล้วลบส่วนปกติก่อนที่จะมีการนำมาตรฐาน
Gob00st

4

จริง ๆ แล้วถ้าคุณตรวจสอบบันทึกการบรรยายหลังวิดีโอมันจะแสดงสูตรอย่างถูกต้อง สไลด์ที่คุณจัดเรียงไว้ที่นี่จะแสดงสไลด์ที่แน่นอนของวิดีโอ

ป้อนคำอธิบายรูปภาพที่นี่


coursera.org/learn/machine-learning/supplement/pKAsc/…นี่คือลิงค์ไปยังโน้ตทันทีหลังจากวิดีโอแสดงสูตรที่ถูกต้อง
Gob00st

1

อันที่จริงฉันคิดว่ามันเป็นเพียงการพิมพ์ผิด

บนภาพนิ่ง # 16 เขาเขียนอนุพันธ์ของฟังก์ชั่นค่าใช้จ่าย (ที่มีระยะกู) ในส่วนที่เกี่ยวกับ theta แต่มันอยู่ในบริบทของการไล่โทนสีโคตรอัลกอริทึม ดังนั้นเขายังคูณอนุพันธ์นี้โดย-หมายเหตุ: ในบรรทัดที่สอง (ของภาพนิ่ง 16) เขามี (ตามที่คุณได้เขียน) คูณด้วย-อย่างไรก็ตามในบรรทัดที่สามคำที่คูณจะยังคงเป็นลบแม้ว่า - หากบรรทัดที่สองนั้นถูกต้อง - สัญญาณเชิงลบจะถูกยกเลิกαλθα

ทำให้รู้สึก?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.