วิธีการไล่ระดับสีโดยทั่วไปทำงานได้ดีกว่าการเพิ่มประสิทธิภาพกว่าp ( x )เนื่องจากการไล่ระดับสีของlog p ( x )โดยทั่วไปมีขนาดที่ดีขึ้น นั่นคือมันมีขนาดที่สะท้อนรูปทรงเรขาคณิตของฟังก์ชันวัตถุประสงค์อย่างต่อเนื่องและเป็นประโยชน์ทำให้ง่ายต่อการเลือกขนาดขั้นตอนที่เหมาะสมและเข้าถึงจุดที่เหมาะสมในขั้นตอนที่น้อยลงlogp(x)p(x)logp(x)
เพื่อดูสิ่งที่ผมหมายถึงการเปรียบเทียบการเพิ่มประสิทธิภาพการไล่ระดับสีสำหรับและF ( x ) = log P ( x ) = - x 2 ที่จุดใดxลาดของF ( x )เป็นฉ' ( x ) = - 2 x ถ้าเราคูณโดย1 / 2p(x)=exp(−x2)f(x)=logp(x)=−x2xf(x)
f′(x)=−2x.
1/2เราได้รับขนาดขั้นตอนที่แน่นอนเพื่อให้ได้มาซึ่งจุดกำเนิดที่เหมาะสมที่สุดในโลกไม่ว่า
คืออะไร ซึ่งหมายความว่าเราไม่ต้องทำงานหนักจนเกินไปเพื่อให้ได้ขนาดที่ดี (หรือ "อัตราการเรียนรู้" เป็นศัพท์แสง ML) ไม่ว่าจุดเริ่มต้นของเราจะอยู่ที่ใดเราเพียงแค่ตั้งค่าการไล่ระดับสีครึ่งหนึ่งและเราจะอยู่ที่จุดกำเนิดในขั้นตอนเดียว และหากเราไม่ทราบปัจจัยที่แน่นอนที่เราต้องการเราสามารถเลือกขนาดขั้นตอนประมาณ 1 ทำการค้นหาบรรทัดเล็กน้อยและเราจะพบขนาดขั้นตอนที่ยอดเยี่ยมอย่างรวดเร็วหนึ่งที่ทำงานได้ดีไม่ว่าที่ไหน
xคือ โรงแรมแห่งนี้มีประสิทธิภาพในการแปลและการปรับขนาดของ
F ( x )
ในขณะที่ปรับขนาด
f ( x )xxf(x)f(x)จะทำให้สเกลขั้นตอนที่เหมาะสมแตกต่างจาก 1/2 อย่างน้อยสเกลขั้นตอนจะเหมือนกันไม่ว่า
คืออะไรดังนั้นเราต้องค้นหาพารามิเตอร์เดียวเพื่อให้ได้รูปแบบการเพิ่มประสิทธิภาพที่ใช้การไล่ระดับสีที่มีประสิทธิภาพ
x
p(x)
p′(x)=f′(x)p(x)=−2xexp(−x2).
−2xexp(−x2)xx=5exp(−x2)=1.4⋅10−1110−11∼1011p′(x)p′(x)
logp(x)logp(x)p(x)f′′(x)