xδfxx
ลองนึกภาพคุณมีปัญหาการเพิ่มประสิทธิภาพ:
minimize (over x)subject tof(x)∀j∈{1…k}gj(x)≤0
โดยที่และมีข้อ จำกัดx∈Rnk
Letเป็นเวกเตอร์คอลัมน์แสดงถึงการไล่ระดับสีของประเมิน{x}∇f(x)fx
นำไปใช้กับสถานการณ์เช่นนี้Farkas แทรกระบุว่าสำหรับจุดใด ๆว่าหนึ่งของงบดังต่อไปนี้ถือ:x∈Rn
- มีนั้นและλ∈Rk∑kj=1λj∇gj(x)=−∇f(x)λ≥0
- มีเช่นนั้นและδ∈Rn∀jδ′gj(x)≤0δ′∇f(x)<0
สิ่งนี้หมายความว่า? หมายความว่าสำหรับจุดที่เป็นไปได้อย่างใดอย่างหนึ่ง:x
- เงื่อนไข (1) ถือครองและเงื่อนไข KKT เป็นที่พอใจ
- สภาพ (2) ถือหุ้นและมีอยู่ในทิศทางที่เป็นไปได้ที่ช่วยเพิ่มฟังก์ชั่นวัตถุประสงค์โดยไม่ต้องเพิ่มข้อ จำกัดg_j(เช่นคุณสามารถปรับปรุงโดยย้ายจากเป็น )δfgjfxx+ϵδ
เงื่อนไข (1) ระบุว่ามีตัวคูณที่ไม่ใช่เชิงลบเช่นว่าเงื่อนไข KKT มีความพึงพอใจที่จุด{x} (ทางเรขาคณิตมันบอกว่าอยู่ในกรวยนูนที่กำหนดโดยการไล่ระดับสีของข้อ จำกัด )λx−∇f
เงื่อนไข (2) ระบุว่า ณ จุดมีทิศทางเพื่อย้าย (ภายในเครื่อง) เช่นนั้น:xδ
- การเคลื่อนที่ไปในทิศทางจะลดฟังก์ชั่นวัตถุประสงค์ (เพราะผลคูณของและน้อยกว่าศูนย์)δ∇f(x)δ
- การเคลื่อนที่ไปในทิศทางไม่ได้เพิ่มมูลค่าของข้อ จำกัด (เพราะผลคูณของและน้อยกว่าหรือเท่ากับศูนย์สำหรับทั้งหมด ) ข้อ จำกัดδ∇gj(x)δj
(ทางเรขาคณิตทิศทางที่เป็นไปได้กำหนดไฮเพอร์เพลนแบบแยกระหว่างเวกเตอร์และกรวยนูนที่กำหนดโดยเวกเตอร์ )δ−∇f(x)∇gj(x)
(หมายเหตุ: หากต้องการแมปลงในFarkas Lemmaให้นิยามเมทริกซ์ )A=[∇g1,∇g2,…,∇gk]
อาร์กิวเมนต์นี้ให้ความจำเป็น (แต่ไม่เพียงพอ) ของเงื่อนไข KKT ที่เหมาะสม หากเงื่อนไขของ KKT ไม่เป็นที่พอใจ (และคุณสมบัติของข้อ จำกัด นั้นเป็นที่พอใจ) ก็เป็นไปได้ที่จะปรับปรุงวัตถุประสงค์โดยไม่ละเมิดข้อ จำกัด
บทบาทของคุณสมบัติข้อ จำกัด
มีอะไรผิดพลาด? คุณสามารถรับสถานการณ์ที่เลวลงซึ่งการไล่ระดับสีของข้อ จำกัด ไม่ได้อธิบายทิศทางที่เป็นไปได้อย่างแม่นยำในการเคลื่อนย้าย
มีคุณสมบัติข้อ จำกัด ที่แตกต่างกันมากมายให้เลือกซึ่งจะทำให้อาร์กิวเมนต์ด้านบนทำงานได้
ขั้นต่ำการตีความสูงสุด (ที่ใช้งานง่ายที่สุด)
แบบฟอร์มลากรองจ์
L(x,λ)=f(x)+∑j=1kλjgj(x)
แทนที่จะย่อขนาดไปตามข้อ จำกัดลองจินตนาการว่าคุณกำลังพยายามลดในขณะที่ฝ่ายตรงข้ามบางคนพยายามที่จะขยายให้ใหญ่ที่สุด คุณสามารถตีความตัวคูณเป็นบทลงโทษ (เลือกโดยคู่ต่อสู้บางคน) สำหรับการละเมิดข้อ จำกัด g j L λ ifgjLλi
วิธีการแก้ไขปัญหาการเพิ่มประสิทธิภาพดั้งเดิมเทียบเท่ากับ:
minxmaxλL(x,λ)
นั่นคือ:
- คุณเลือกเพื่อย่อ Lagrangianให้น้อยที่สุดรับรู้ว่า ...xL
- จากนั้นฉันจะเลือกเพื่อเพิ่มลากรองจ์ (ให้คุณเลือก )λx
ตัวอย่างเช่นหากคุณละเมิดข้อ จำกัดฉันสามารถลงโทษคุณได้โดยตั้งค่าเป็นอนันต์!g2λ2
ความอ่อนแอเป็นคู่
สำหรับฟังก์ชันใด ๆสังเกตว่า:f(x,y)
∀x^,y^minxf(x,y^)≤f(x^,y^)≤maxyf(x^,y)
ตั้งแต่นั้นมาสำหรับและมันก็ถือได้ว่า:
x^y^
maxyminxf(x,y)≤minxmaxyf(x,y)
ในการตั้งค่า Langrian ผลลัพธ์นี้ที่เป็นที่รู้จักกันในชื่อคู่อ่อนแอmaxλminxL(x,λ)≤minxmaxλL(x,λ)
ปัญหาคู่ให้ขอบเขตที่ต่ำกว่าในการแก้ปัญหาmaxλminxL(x,λ)
ความเป็นคู่ที่แข็งแกร่ง
ภายใต้เงื่อนไขพิเศษบางประการ (เช่นปัญหานูนที่ซึ่งเงื่อนไขสเลเตอร์เก็บไว้) คุณมีความเป็นสองด้านที่แข็งแกร่ง (เช่นคุณสมบัติจุดอาน)
maxλminxL(x,λ)=minxmaxλL(x,λ)
ผลลัพธ์ที่สวยงามนี้แสดงถึงคุณสามารถกลับลำดับของปัญหาได้
ฉันเลือกบทลงโทษครั้งแรกเพื่อเพิ่มลากรองจ์λ
จากนั้นคุณสามารถเลือกเพื่อลดการลากรองจ์{L}LxL
ตั้งอยู่ในขั้นตอนนี้เป็นราคาสำหรับการละเมิดข้อ จำกัด และราคามีการตั้งค่าดังกล่าวที่คุณจะไม่ละเมิดข้อ จำกัดλ