หลังจากทำให้ปัญหาง่ายขึ้นโดยใช้วิธีการตามปกติมันสามารถแก้ไขได้โดยการแปลงให้เป็นโปรแกรมย่อขนาดคู่ซึ่งมีคำตอบที่รู้จักกันดีพร้อมหลักฐานเบื้องต้น บางทีการทำให้เป็นคู่นี้อาจเป็น "ขั้นตอนที่ละเอียดอ่อน" ที่อ้างถึงในคำถาม ความไม่เท่าเทียมกันยังสามารถสร้างขึ้นในลักษณะเชิงกลอย่างหมดจดโดยการเพิ่มผ่านตัวคูณ Lagrange|Ti|
ก่อนอื่นฉันขอนำเสนอโซลูชันที่สง่างามยิ่งขึ้นโดยยึดตามรูปทรงสี่เหลี่ยมน้อยที่สุด มันไม่จำเป็นต้องมีการทำให้เข้าใจง่ายเบื้องต้นและเกือบจะทันทีโดยให้สัญชาติญาณโดยตรงในผลลัพธ์ ตามที่แนะนำในคำถามปัญหาจะลดความไม่เท่าเทียมกันของ Cauchy-Schwarz
วิธีการแก้ปัญหาทางเรขาคณิต
พิจารณาเป็นเวกเตอร์ -dimensional ในปริภูมิแบบยุคลิดด้วยผลิตภัณฑ์แบบจุดปกติ ปล่อยเป็นเวกเตอร์พื้นฐานและ1) เขียนและสำหรับประมาณการมุมฉากของและเข้ามาเติมเต็มมุมฉากของ{1} (ในทางสถิติคำศัพท์พวกเขาเป็นคนที่เหลือด้วยความเคารพหมายถึง) แล้วตั้งแต่และx=(X1,X2,…,Xn)ny=(0,0,…,0,1,0,…,0)ith1=(1,1,…,1)x^y^xy1Xi−X¯=x^⋅yS=||x^||/n−1−−−−−√ ,
|Ti|=n−1−−−−−√|x^⋅y|||x^||=n−1−−−−−√|x^⋅y^|||x^||
เป็นส่วนประกอบของในทิศทาง โดย Cauchy-Schwarz มันจะถูกขยายให้มากที่สุดเมื่อขนานกับ , ซึ่ง QEDy^x^x^y^=(−1,−1,…,−1,n−1,−1,−1,…,−1)/n
Ti=±n−1−−−−−√y^⋅y^||y^||=±n−1−−−−−√||y^||=±n−1n−−√,
อนึ่งโซลูชันนี้ให้การจำแนกลักษณะเฉพาะของทุกกรณีที่ถูกขยายให้ใหญ่สุด: มันเป็นแบบฟอร์มทั้งหมด|Ti|
x=σy^+μ1=σ(−1,−1,…,−1,n−1,−1,−1,…,−1)+μ(1,1,…,1)
สำหรับจริงทั้งหมด\μ,σ
การวิเคราะห์นี้สรุปได้อย่างง่ายดายในกรณีที่จะถูกแทนที่ด้วยชุด regressors ใด ๆ เห็นได้ชัดว่าสูงสุดของเป็นสัดส่วนกับความยาวของส่วนที่เหลือของ ,.{1}Tiy||y^||
การทำให้เข้าใจง่าย
เพราะคงที่อยู่ภายใต้การเปลี่ยนแปลงของสถานที่ตั้งและขนาดเราอาจคิดกับการสูญเสียของทั่วไปไม่ว่าผลรวมเป็นศูนย์รวมของพวกเขาและสี่เหลี่ยมเพื่อn-1สิ่งนี้จะระบุด้วยตั้งแต่ (ตารางค่าเฉลี่ย) เป็น1เพิ่มมันเป็นประหนึ่งการเพิ่ม 2 ไม่มีการสูญเสียโดยทั่วไปเมื่อใช้เนื่องจากสามารถแลกเปลี่ยนได้TiXin−1|Ti||Xi|S1|Ti|2=T2i=X2ii=1Xi
โซลูชันผ่านการกำหนดสูตรคู่
ปัญหาที่สองคือการแก้ไขค่าของและถามว่าค่าของจะต้องมีอะไรบ้างเพื่อลดผลรวมของกำลังสองที่0 เพราะจะได้รับปัญหานี้เป็นปัญหาของการลดกำหนดว่า-X_1X21Xj,j≠1∑nj=1X2j∑nj=1Xj=0X1∑nj=2X2j∑nj=2Xj=−X1
การแก้ปัญหาสามารถพบได้ง่ายในหลาย ๆ หนึ่งในขั้นพื้นฐานที่สุดคือการเขียน
Xj=−X1n−1+εj, j=2,3,…,n
ที่0 การขยายฟังก์ชั่นวัตถุประสงค์และใช้ข้อมูลประจำตัวแบบรวมถึงศูนย์เพื่อทำให้การสร้างง่ายขึ้น∑nj=2εj=0
∑j=2nX2j=∑j=2n(−X1n−1+εj)2=∑(−X1n−1)2−2X1n−1∑εj+∑ε2j=Constant+∑ε2j,
ทันทีที่แสดงให้เห็นถึงวิธีการแก้ปัญหาที่ไม่ซ้ำกันคือสำหรับทุกJสำหรับวิธีนี้εj=0j
(n−1)S2=X21+(n−1)(−X1n−1)2=(1+1n−1)X21=nn−1X21
และ
|Ti|=|X1|S=|X1|n(n−1)2X21−−−−−−−√=n−1n−−√,
QED
โซลูชันผ่านเครื่องจักร
กลับไปที่โปรแกรมง่าย ๆ ที่เราเริ่มต้นด้วย:
Maximize X21
ภายใต้
∑i=1nXi=0 and ∑i=1nX2i−(n−1)=0.
วิธีการของตัวคูณลากรองจ์ (ซึ่งเกือบจะเป็นกลไกเชิงกลและตรงไปตรงมา) เท่ากับการรวมกันเชิงเส้นที่ไม่เกี่ยวข้องของการไล่ระดับสีของฟังก์ชันทั้งสามนี้ให้เป็นศูนย์:
(0,0,…,0)=λ1D(X21)+λ2D(∑i=1nXi)+λ3D(∑i=1nX2i−(n−1)).
ส่วนประกอบโดยส่วนประกอบสมการเหล่านี้คือn
0000=2λ1X1+==⋯=λ2λ2λ2+2λ3X1+2λ3X2+2λ3Xn.
สุดท้ายของพวกเขาบ่งบอกทั้งหรือ 0 (เราอาจออกกฎกรณีหลังแล้วเพราะสมการแรกหมายถึง . trivializing การผสมผสานเชิงเส้น) ผลรวมการศูนย์ จำกัด ผลิต- ข้อ จำกัด ผลรวมของกำลังสองให้โซลูชันทั้งสองn−1X2=X3=⋯=Xn=−λ2/(2λ3)λ2=λ3=0λ1=0X1=−(n−1)X2
X1=±n−1n−−√; X2=X3=⋯=Xn=∓1n−−√.
พวกเขาทั้งสองให้ผลผลิต
|Ti|=|X1|≤|±n−1n−−√|=n−1n−−√.