ลดผลรวมของส่วนเบี่ยงเบนสัมบูรณ์ ( ระยะทาง


15

ฉันมีชุดข้อมูลx1,x2,,xkและต้องการค้นหาพารามิเตอร์mเพื่อลดผลรวม

i=1k|mxi|.
นั่นคือ

minmi=1k|mxi|.

2
คุณอธิบายรายละเอียดเล็กน้อยได้ไหม?
Geoff Oxberry

ในกรณีนั้นการแก้ปัญหาจะไม่ใช่จุดกึ่งกลางระหว่างค่าสูงสุดและค่าต่ำสุดหรือไม่
เปาโล

@ พอลมัธยฐานอาจทำให้ผลรวมลดลง แต่ต้องการทราบว่ามันสามารถทำการวิเคราะห์ได้อย่างไรโดยเฉพาะอย่างยิ่งการลดขนาด l1
พฤษภาคม

@kadu ถูกต้องค่ามัธยฐานเป็นวิธีแก้ปัญหา การคำนวณค่ามัธยฐานเป็นเรื่องเล็กน้อย เพียงเรียงลำดับจากนั้นรับค่ากลาง
David Ketcheson

คำตอบ:


22

เป็นไปได้ไหมที่คุณจะขอหลักฐานว่าคนกลางแก้ปัญหาได้หรือไม่? อย่างนี้สามารถทำได้เช่นนี้:

วัตถุประสงค์คือค่เชิงเส้นและอนุพันธ์จึงยกเว้นจุดmความชันของวัตถุประสงค์คือบางจุดคืออะไร? ความชันคือผลรวมของความชันของการแมปและนี่คือ (สำหรับ ) หรือ (สำหรับ ) ดังนั้นความลาดชันแสดงจำนวน 's มีขนาดเล็กกว่าเมตรคุณเห็นว่าความชันเป็นศูนย์ถ้ามีน้อยกว่าและใหญ่กว่าเท่า ๆ กัน(สำหรับและจำนวนของเท่ากัน) หากมีจำนวนคี่ m x ฉัน m | m - x j | + 1 m > x j - 1 m < x j x i m x i m x i x i - 1 + 1m=ximxim|mxj|+1m>xj1m<xjximximxixiดังนั้นความชันคือด้านซ้ายของ "มิดเดิ้ล" หนึ่งอันและของมันดังนั้นอันมิดเดิ้ลจึงน้อยที่สุด1+1


16

ลักษณะทั่วไปของปัญหานี้ไปหลายมิติที่เรียกว่าปัญหาแบ่งเรขาคณิต ดังที่เดวิดชี้ให้เห็นว่าค่ามัธยฐานเป็นวิธีแก้ปัญหาสำหรับคดี 1-D; คุณสามารถใช้อัลกอริธึมการเลือกค่ามัธยฐานซึ่งมีประสิทธิภาพมากกว่าการเรียงลำดับ การเรียงลำดับเป็นในขณะที่อัลกอริทึมการเลือกเป็น ; การเรียงลำดับจะมีประสิทธิภาพมากขึ้นถ้าต้องการการเลือกหลายอย่างเท่านั้นซึ่งในกรณีนี้คุณสามารถเรียงลำดับ (ราคาแพง) หนึ่งครั้งแล้วเลือกซ้ำจากรายการที่เรียงลำดับO ( n )O(nเข้าสู่ระบบn)O(n)

ลิงก์ไปยังปัญหาค่ามัธยฐานทางเรขาคณิตกล่าวถึงวิธีแก้ปัญหาสำหรับกรณีหลายมิติ


6

วิธีแก้ปัญหาที่ชัดเจนในแง่ของค่ามัธยฐานนั้นถูกต้อง แต่ในการตอบสนองต่อความคิดเห็นโดย mayenew นี่เป็นอีกวิธีหนึ่ง

เป็นที่ทราบกันดีว่าปัญหาการย่อเล็กสุดโดยทั่วไปและปัญหาที่โพสต์โดยเฉพาะสามารถแก้ไขได้ด้วยการโปรแกรมเชิงเส้น1

การกำหนด LP ต่อไปนี้จะใช้สำหรับแบบฝึกหัดที่กำหนดโดยไม่ทราบค่า :zi,m

minzi
เช่นนั้น:
zimxi
zixim

อย่างชัดเจนต้องเท่ากับอย่างน้อยที่สุดดังนั้นสิ่งนี้จึงขอให้ผลรวมของค่าสัมบูรณ์ของข้อผิดพลาดลดลงzi|xim|


2

วิธีการวิเคราะห์นูนที่ใช้กำลังเกินกว่าที่จะแสดงได้นั้นเป็นเพียงการใช้ subgradients ในความเป็นจริงนี้เทียบเท่ากับเหตุผลที่ใช้ในคำตอบอื่น ๆ ที่เกี่ยวข้องกับความลาดชัน

ปัญหาการหาค่าเหมาะที่สุดนั้นเป็นแบบนูน (เพราะวัตถุประสงค์เป็นแบบนูนและไม่มีข้อ จำกัด ) นอกจากนี้ subgradient ของคือ|mxi|

-1 ถ้าm<xi

[-1,1] ถ้าm=xi

+1 ถ้าม>m>xi

เนื่องจากฟังก์ชั่นนูนจะลดลงถ้าหาก subgradient มีศูนย์และ subgradient ของผลรวมของฟังก์ชั่นนูนคือผลรวม (ชุด) ของ subgradients คุณจะได้รับ 0 อยู่ใน subgradient ถ้าเป็นค่ามัธยฐาน ของx_kx 1 , x kmx1,xk


0

argminmi=1N|mxi|

เราควรสังเกตว่า (การเข้มงวดมากขึ้นจะบอกว่ามันคือการไล่ระดับย่อยของฟังก์ชันที่ไม่ราบรื่น Norm) ดังนั้นสืบมาข้างต้นรวมผลผลิตขวา) นี่เท่ากับศูนย์เมื่อจำนวนรายการบวกเท่ากับจำนวนลบซึ่งเกิดขึ้นเมื่อ\}L1 N ฉัน= 1สัญญาณ(m-xi)m=ค่ามัธยฐาน{x1,x2,,xN}d|x|dx=sign(x)L1
i=1Nsign(mxi)
m=median{x1,x2,,xN}

หนึ่งควรสังเกตว่าmedianกลุ่มไม่ต่อเนื่องไม่ได้กำหนดไว้ไม่ซ้ำกัน
ยิ่งกว่านั้นมันไม่จำเป็นต้องเป็นรายการภายในกลุ่ม

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.