ตัวอย่างของเล่นสำหรับตัวแก้ Plotkin-Shmoys-Tardos และ Arora-Kale


34

ฉันต้องการที่จะเข้าใจว่าตัวแก้ปัญหา SDP ของ Arora-Kale นั้นใกล้เคียงกับการผ่อนคลายของ Goemans-Williamson ในเวลาเกือบเป็นเส้นตรงอย่างไร Plotkin-Shmoys-Tardos Solver แก้ปัญหา "การบรรจุ" และ "ครอบคลุม" ในเวลาเชิงเส้นได้อย่างไร เป็นการยกตัวอย่างของกรอบนามธรรม "การเรียนรู้จากผู้เชี่ยวชาญ"

วิทยานิพนธ์ของ Kale มีการนำเสนอที่ยอดเยี่ยม แต่ฉันคิดว่ามันยากมากที่จะกระโดดเข้าไปในกรอบนามธรรมโดยตรงและฉันต้องการเริ่มต้นจากตัวอย่างของปัญหาง่าย ๆ ที่เห็นได้ชัดว่าควรทำอะไรแล้วย้ายไปที่ปัญหาทั่วไปมากขึ้น เพิ่ม "ฟีเจอร์" ให้กับอัลกอริธึมและการวิเคราะห์

ตัวอย่างเช่น:

Plotkin-Shmoys แก้ปัญหาการเขียนโปรแกรมเชิงเส้นของฝาครอบจุดสุดยอดที่ไม่ถ่วงได้อย่างไร จุดสุดยอดถ่วงน้ำหนักครอบคลุม? ตั้งฝาครอบหรือไม่ การจับคู่สองฝ่าย?

ตัวอย่างที่ง่ายที่สุดที่อัลกอริทึม Arora-Kale กำลังทำสิ่งที่น่าสนใจคืออะไร มันคำนวณค่าลักษณะเฉพาะที่ใหญ่ที่สุดของ Laplacian ของกราฟได้อย่างไร

(การคำนวณค่าลักษณะเฉพาะที่ใหญ่ที่สุดของ Laplacian เทียบเท่ากับปัญหาในการแก้การผ่อนคลายแบบย่อของ Goemans-Williamson SDP ของ Max Cut ซึ่งแทนที่จะต้องให้แต่ละเวกเตอร์มีความยาวหนึ่งคุณต้องการผลรวมของกำลังสอง ของบรรทัดฐานที่จะ | V |.)


2
นั่นเป็นคำถามที่ดี
Suresh Venkat

4
เพื่อให้เข้าใจถึงอัลกอริธึมสไตล์ PST สำหรับปัญหาการบรรจุมันเป็นเรื่องดีที่จะดูอัลกอริธึมสำหรับการแก้ปัญหาการไหลของสินค้าหลากหลายซึ่งเป็นที่ที่ PST พัฒนามา กระดาษของ Neal Young อธิบายรายละเอียดชุดฝาครอบ Ihttp: //www.cs.ucr.edu/~neal/non_arxiv/SODA_1995_170.pdf ฉันคิดว่าการสำรวจของ Arora-Kale-Hazan ทำให้การเชื่อมต่อระหว่างกรอบผู้เชี่ยวชาญและการบรรจุ / ครอบคลุมนักแก้ปัญหาชัดเจน
Chandra Chekuri

1
@ChandraChekuri: มันค่อนข้างล่าช้า แต่ฉันสงสัยว่าคุณควรตอบคำถามนี้หรือไม่?
Suresh Venkat

2
FWIW สำหรับบันทึกบางส่วนขยายบนกระดาษโซดา @ChandraChekuri กล่าวเห็นgreedyalgs.info/blog/about
Neal Young

อัปเดตลิงก์: algnotes.info/on/obliv
Neal Young

คำตอบ:


26

Luca ตั้งแต่หนึ่งปีผ่านไปคุณอาจค้นคว้าคำตอบของคุณเอง ฉันตอบคำถามของคุณที่นี่เพียงเพื่อบันทึก ฉันทบทวนอัลกอริทึมการผ่อนคลายของลากรองจ์สำหรับปัญหาที่คุณพูดถึงและร่างการเชื่อมต่อกับการเรียนรู้ (โดยเฉพาะอย่างยิ่งตามคำแนะนำจากผู้เชี่ยวชาญ) ฉันไม่ได้แสดงความคิดเห็นที่นี่ในอัลกอริทึม SDP

โปรดทราบว่าอัลกอริทึมเฉพาะที่คุณพูดถึงไม่ทำงานในเวลาเกือบเป็นเชิงเส้น (มีขั้นตอนวิธีการเชิงเส้นเกือบไทม์สำหรับเป็น อย่างชัดเจนบรรจุที่กำหนดหรือครอบคลุมปัญหา. ดู ตี Simplex สำหรับบรรจุ Fractional และครอบคลุมโปรแกรมเชิงเส้น .) ขั้นตอนวิธีการที่คุณมีในใจมักจะมีสายพันธุ์วิ่งในจำนวนเกือบเชิงเส้นของที่ซ้ำแต่ในแต่ละ การวนซ้ำโดยทั่วไปต้องใช้เวลาเชิงเส้นอย่างน้อยเช่นกัน ฉันพูดถึงบางส่วนของอัลกอริทึมเหล่านี้ด้านล่าง

ฟังก์ชั่นที่มีประโยชน์บางอย่าง

ก่อนที่เราจะเริ่มนี่คือฟังก์ชั่นบางอย่างที่เราจะใช้ในภาพร่างหลักฐาน (ถ้าคุณมีความสนใจในขั้นตอนวิธีการ แต่ไม่ได้รายละเอียดหลักฐานคุณสามารถข้ามไปข้างหน้า.) สำหรับเวกเตอร์กำหนดจะเป็น(y_i) ฟังก์ชั่นนี้มีขอบเขตบนสำหรับ : analogously กำหนดจะเป็นเป็นขอบเขตล่างบนy_iyLmax(y)lniexp(yi)maxiyi

maxiyi  Lmax(y)  maxiyi+lnm.
Lmin(y)Lmax(y)miniyi

เพื่อความสะดวกในสิ่งต่อไปนี้เราใช้เพื่อแสดงการไล่ระดับสีของ Lmin เราใช้เพื่อแสดงการไล่ระดับสีของ Lmaxg(y)Lmin(y)G(y)Lmax(y)

อย่างชัดเจนคือ ในขณะที่คือ'})gi(y)exp(yi)/iexp(yi)Gi(y)exp(yi)/iexp(yi)

Lmin และ Lmax ราบรื่นในแง่ต่อไปนี้: สำหรับเวกเตอร์ใด ๆและ , และ d[0,ε]nyRn

Lmin(y+d)  Lmin(y) + (1O(ε))dg(y)
Lmax(y+d)  Lmax(y) + (1+O(ε))dG(y).

โปรดทราบว่าการไล่ระดับสีทั้งสองมี 1-norm เท่ากับ 1: 1 (ตลอดเราใช้เพื่อแสดงถึง 1-norm)|G(y)|=|g(y)|=1|z|

ยังทราบว่าสำหรับเมทริกซ์ลาดของฟังก์ชั่นด้วยความเคารพ เป็น (โดยกฎลูกโซ่) (gเพิ่มเติมอย่างชัดเจนอนุพันธ์บางส่วนของฟังก์ชั่นที่เกี่ยวกับ มีx) ในทำนองเดียวกันอนุพันธ์บางส่วนของ Lmax ด้วยความเคารพมีx)AxLmin(Ax)x(g(Ax))TAxjiAijexp(Aix)/iexp(Aix)(Ax)xjiAijexp(Aix)/iexp(Aix)

Fractional Set Cover

แก้ไขอินสแตนซ์ Set-Cover Let แสดงองค์ประกอบ / ชุดเมทริกซ์อุบัติการณ์ ดังนั้นถ้าอื่น 0 และเป็นขอบเขตที่เศษส่วนปกครอบคลุมองค์ประกอบอีAอีs = 1 อีs E x x อีAes=1esAexxe

LP คือ\} รับอัลกอริทึมคือmin{|x|:Ax1;x0}ε(0,1)


  1. เริ่มต้นทั้งหมด0 ให้N xs=0N=log(n)/ε
  2. ทำซ้ำจนกระทั่ง : mineAexN

    2.1 เลือกเพิ่มอนุพันธ์บางส่วนของ Lmin WRT x_s (อย่างชัดเจนเลือกการเพิ่มประสิทธิภาพ .) s(Ax)xs s e s exp ( - s e x s )
    sesexp(sexs)

    2.2 เพิ่มโดย\ xsε

  3. ย้อนกลับxx/mineAex


อัลกอริทึมส่งกลับค่าประมาณวิธีแก้ปัญหาโดยประมาณในการทำซ้ำโดยที่คือจำนวนองค์ประกอบและเป็นวิธีที่ดีที่สุด ฝาครอบชุดเศษส่วน (เล็กน้อย ) (อัลกอริทึมที่คล้ายกันปรากฏในกระดาษจันทราที่กล่าวถึง Vertex Cover นั้นเป็นกรณีพิเศษ)(1+O(ε))O(|x|log(n)/ε2)nx|x|n

( หมายเหตุ:โปรดทราบว่าขอบเขตการวนซ้ำไม่ได้ขึ้นอยู่กับจำนวนชุดเพียงจำนวนองค์ประกอบดังนั้นอัลกอริทึมสามารถใช้กับระบบชุดที่กำหนดโดยปริยายตราบใดที่ให้น้ำหนักกับองค์ประกอบ หาชุดน้ำหนักรวมสูงสุด (หรือใกล้เคียงกับค่าสูงสุด) oracle ชนิดนี้เหมือนกับ oracle แยกที่ต้องใช้อัลกอริทึมทรงรีกับปัญหาสองประการสำหรับปัญหาการบรรจุเช่น set packing คุณต้องมี oracle ที่, กำหนดน้ำหนักให้กับองค์ประกอบส่งคืนชุดการลดน้ำหนักรวมให้น้อยที่สุดสำหรับปัญหาเช่นการไหลของสินค้าหลายชุดคุณอาจจำเป็นต้องค้นหาเส้นทางที่จะลดผลรวมของน้ำหนักขอบบางส่วนที่กำหนด)

นี่คือภาพร่างหลักฐานการรับประกันประสิทธิภาพ ในแต่ละซ้ำที่ WRT อนุพันธ์บางส่วนได้รับการแต่งตั้ง อย่างน้อยโดยที่เป็นชุดฝาครอบเศษส่วนที่ดีที่สุดs1/|x|x

(เพื่อดูว่าทำไมจำได้ว่าการไล่ระดับสีของ Lminเทียบกับคือหากเราต้องเลือกเซตโดยการสุ่มจากการแจกแจง , ค่าคาดหวังของอนุพันธ์บางส่วนที่เกี่ยวกับ จึงเป็นตั้งแต่ , นี่คือ เป็นอย่างน้อยตั้งแต่นี่คืออย่างน้อยดังนั้นจึงต้องมีบางส่วนให้อนุพันธ์บางส่วนเป็นอย่างน้อยเนื่องจากอัลกอริทึมเลือก(Ax)x(g(Ax))TAsx/|x|xs(g(Ax))TAx/|x|Ax1|g(Ax)|/|x||g(Ax)|=11/|x|s1/|x|xsในการทำซ้ำแต่ละครั้งเพื่อเพิ่ม อนุพันธ์บางส่วนให้ได้มากที่สุดจะได้รับอนุพันธ์บางส่วนอย่างน้อย.) 1 / | x |1/|x|

จากนั้นขั้นตอนขนาดถูกเลือกมากพอขนาดเล็กเพียงเพื่อให้ไม่มีการประสานงานของเพิ่มขึ้นมากกว่า\ดังนั้นเนื่องจากความราบรื่นของ Lmin การเพิ่ม ถึงเพิ่มอย่างน้อย .εx ε x s x s + ε Lmin ( x ) ( 1 - O ( ε ) ) ε / | x |Axεxsxs+εLmin(Ax)(1O(ε))ε/|x|

ด้วยวิธีนี้อัลกอริทึมจะรักษาที่ไม่แปรเปลี่ยน (โปรดทราบว่า Lminเท่ากับ .)

Lmin(Ax)(1O(ε))|x|/|x|lnn.
(0¯)lnn

ณ การสิ้นสุดในค่าคงที่คำว่าคือคูณกับด้านซ้ายมือดังนั้นการคำนวณหนึ่งจะได้รับ. หลังจากการทำให้เป็นมาตรฐานในบรรทัดสุดท้ายของอัลกอริธึมแล้วนี่หมายถึง.lnnO(ε)mineAex(1O(ε))|x|/|x||x|(1+O(ε))|x|

FWIW ความไม่เท่าเทียมกันที่เกี่ยวข้องในการพิสูจน์ค่าคงที่เป็นหลักเช่นเดียวกับที่เกี่ยวข้องกับการพิสูจน์ Chernoff ที่ถูกผูกไว้ (ในความเป็นจริงขั้นตอนวิธีนี้สามารถจะได้มาโดยการใช้วิธีการของความน่าจะเป็นเงื่อนไขที่จะเป็นโครงการที่สุ่ม-ปัดเศษที่ซ้ำ ๆ ชุดตัวอย่างจากการกระจาย (ด้วยการเปลี่ยน) เพิ่มขึ้นสำหรับแต่ละตัวอย่างชุดการทำให้กระจัดกระจายของสิ่งนี้ให้อัลกอริธึม: ค่าคงที่ที่แฝงอยู่เพียงว่าตัวประมาณในแง่ร้ายอยู่ต่ำกว่า 1 การลงโทษเชิงทวีคูณในตัวประมาณในแง่ร้ายนั้นมาจากการใช้เชอร์อฟในการวิเคราะห์แผนการปัดเศษ ในกระดาษจันทราที่กล่าวถึง )x/|x|xss

ฝาครอบชุดเศษส่วนถ่วงน้ำหนัก (และการครอบเศษส่วนทั่วไป)

เพื่อจัดการปัญหาต่าง ๆ เช่น Weighted Set Cover ได้อย่างมีประสิทธิภาพเราปรับเปลี่ยนอัลกอริทึมเพื่อใช้การเพิ่มขึ้นที่ไม่สม่ำเสมอ (แนวคิดเนื่องจากGarg และ Konemann )

แผ่นเสียงเป็นที่ช่วงกว่าองค์ประกอบช่วงกว่าชุดและตัวแปรทั้งหมดจะไม่ เชิงลบ เพื่อนำเสนออัลกอริทึมขั้นแรกให้เขียนปัญหาใหม่เป็นปัญหาที่ครอบคลุมทั่วไป ให้สำหรับและอย่างอื่น จากนั้น (ด้วยการเปลี่ยนแปลงของตัวแปรปรับขนาดโดย ) LP คือซึ่งเราสามารถดูเป็นแผ่นปิดทั่วไปได้ นี่คืออัลกอริทึม:min{cx:(e)sexs1}esอีs = 1 / C sอีs อีs = 0 x s sนาที{ | x | : A x 1 ; x 0 }Aes=1/csesAes=0xscsmin{|x|:Ax1;x0}


  1. เริ่มต้นทั้งหมด0 ให้Nxs=0N=log(n)/ε

  2. ทำซ้ำจนกว่าข้อ จำกัด ที่ครอบคลุมทั้งหมดจะถูกลบ:

    2.1 เลือกเพิ่มอนุพันธ์บางส่วนของ Lmin WRT x_s (อย่างชัดเจนเลือกการเพิ่มประสิทธิภาพ .)s(Ax)xs s e s exp ( - s e x s ) / c s
    sesexp(sexs)/cs

    2.2 เพิ่มโดยที่ได้รับการแต่งตั้งดังกล่าวว่าที่สุดสำหรับทุกเหลือครอบคลุม จำกัดเพิ่มขึ้นในมีที่มากที่สุด\xsδδeอีx εAexε

    2.3 ลบทั้งหมด จำกัด ครอบคลุมดังกล่าวว่าNeAexN

  3. กลับxx/mineAex


อัลกอริทึมส่งกลับค่า - การแก้ปัญหาที่เหมาะสมในการทำซ้ำโดยที่คือจำนวนข้อ จำกัด ที่ครอบคลุม (การวนซ้ำแต่ละครั้งจะเพิ่มที่เหลือโดย ; สิ่งนี้สามารถเกิดขึ้นได้เพียงกับข้อ จำกัด ก่อนที่จะถูกลบ) การพิสูจน์ความถูกต้องนั้นผ่านค่าคงที่เดียวกับ Set Cover(1+O(ε))O(nlog(n)/ε2)nAexεN/ε

ฝาครอบน้ำหนัก Vertex เป็นกรณีพิเศษ

การจับคู่ Bipartite เศษส่วนสูงสุด

รับกราฟ LP ธรรมชาติสำหรับปัญหาคือ\}G=(U,W,E)max{|x|:v.evxe1}

ในการเป็นตัวแทนเมทริกซ์นี่คือการบรรจุ LP มีค่าสัมประสิทธิ์ 0-1 (ถ้า ) ปัญหาดังกล่าวไม่ต้องการการเพิ่มขึ้นที่ไม่สม่ำเสมอดังนั้นอัลกอริทึมแบบง่ายคล้ายกับอัลกอริธึม Set Cover ที่ไม่ถ่วงน้ำหนักmax{|x|:Ax1;x0}Ave=1ve


  1. เริ่มต้นทั้งหมด0 ให้Nxe=0N=log(n)/ε
  2. ในขณะที่ :Ax<N

    2.1 เลือกลดอนุพันธ์บางส่วนของ Lmax WRT x_e (อย่างชัดเจนเลือกเพื่อย่อ )e(Ax)xe e v e exp ( e v x e )
    eveexp(evxe)

    2.2 เพิ่มโดย\ xeε

  3. ย้อนกลับxx/maxvAvx


อัลกอริทึมส่งกลับค่า - การแก้ปัญหาที่เหมาะสมในการทำซ้ำ (นี่เป็นเพราะการทำซ้ำแต่ละครั้งเพิ่มโดยและในที่สุดก่อนการทำให้เป็นมาตรฐาน, )(1O(ε))O(nlog(n)/ε2)|x|ε|x|=O(Nn)

เพื่อความสนุกนี่คืออัลกอริธึมทางเลือกที่น่าสนใจสำหรับการจับคู่ Bipartite ที่สมบูรณ์แบบ จำได้ว่าE) ให้.G=(U,W,E)n=|U|=|W|


  1. เริ่มต้นทั้งหมด0 ให้N xe=0N=4ln(n)/ε
  2. ทำซ้ำครั้ง:nN

    2.1 เลือกสม่ำเสมอโดยการสุ่มจากU 2.2 เลือกดังกล่าวว่าลดx_e 2.3 เพิ่มโดย\ uUW ( U , W ) E Σ อีW x x U W ε
    w(u,w)Eewxe
    xuwε

  3. ย้อนกลับ Nx/N


ถ้ามีการจับคู่ที่สมบูรณ์แบบอัลกอริทึมจะคืนค่าซึ่งและมีความน่าจะเป็นสูงสำหรับทุกจุดยอด ,และสำหรับทุกจุด ,varepsilon) หากคุณสนใจในรายละเอียดของหลักฐานโปรดถาม ...Gx|x|=nuU1O(ε)euxe1+O(ε)wWewxe1+O(ε)

บรรจุผสมและครอบคลุม

คุณอาจถามเกี่ยวกับการจับคู่สองฝ่ายโดยหวังว่าจะเป็นตัวอย่างของการบรรจุแบบผสมและครอบคลุมปัญหานั่นคือหนึ่งในรูปแบบ นี่คืออัลกอริทึมหนึ่งสำหรับปัญหาดังกล่าว ครั้งแรกปกติเพื่อให้และ1

x? Pxp;Cxc;x0.
p=1¯c=1¯

ให้เป็นจำนวนข้อ จำกัด (แถวในบวกแถวใน )mPC


  1. เริ่มต้นทั้งหมด0 ให้Nxj=0N=2ln(m)/ε
  2. ในขณะที่ :Px<N

    2.1 เลือกเพื่อให้อนุพันธ์บางส่วนของ Lmaxเกี่ยวกับนั้นเป็นอนุพันธ์ของบางส่วนของ Lminเกี่ยวกับมากที่สุด (อย่างชัดเจนให้เลือกเช่นj(Px)xj(Cx)xjj

    iPijexp(Pix)iexp(Pix)iCijexp(Cix)iexp(Cix).)

    2.2 เพิ่มโดยที่ได้รับการแต่งตั้งที่สุดเช่นว่าไม่มีข้อ จำกัดหรือข้อ จำกัด ที่เหลือเพิ่มขึ้นมากกว่า\xjδδPixCixε

    2.3 ลบข้อ จำกัด ครอบคลุมทุกเช่นว่าNiCixN

  3. กลับxx/maxiPix


สมมติว่าปัญหาได้รับเป็นไปได้อัลกอริทึมกลับดังกล่าวว่า และvarepsilon) จำนวนการวนซ้ำคือเนื่องจากการวนซ้ำแต่ละครั้งจะเพิ่มข้อ จำกัด บางอย่างโดยและสิ่งนี้สามารถเกิดขึ้นได้สำหรับข้อ จำกัด แต่ละครั้งที่ครั้งมากที่สุดxPx1Cx1O(ε)O(mln(m)/ε2)εN

การพิสูจน์ความถูกต้องคือผ่านค่าคงที่ ค่าคงที่หมายถึง ทางด้านซ้ายมือจะมีเพื่อพิสูจน์การรับประกันประสิทธิภาพ

Lmax(Px)2ln(m)+(1+O(ε))Lmin(Cx).
maxPx2ln(m)+(1+O(ε))minCx.
Ω(log(m)/ε)

ในขั้นตอนที่ 2.1 ต้องมีที่ต้องการตราบใดที่ปัญหาดั้งเดิมเป็นไปได้ (นี่เป็นเพราะสำหรับเป็นไปได้และใด ๆหากเราเลือกสุ่มจากการแจกแจงค่าคาดหวังของอนุพันธ์บางส่วนของ Lmaxด้วยความเคารพ จะมากที่สุด (ดูภาพร่างหลักฐานก่อนหน้าสำหรับ Set Cover) ในทำนองเดียวกันค่าคาดหวังของอนุพันธ์บางส่วนของ Lminเทียบกับ จะต้องมีอย่างน้อยดังนั้นจึงมีj xxjx/|x|(Px)xj1/|x|(Cx)xj1/|x|jเช่นนั้นอนุพันธ์บางส่วนของ Lmaxเกี่ยวกับ เป็นอนุพันธ์ของ Lminใหญ่(Px)xj(Cx)

จากนั้นคงที่จะยังคงอยู่ในแต่ละซ้ำเพราะโดยทางเลือกของและและเรียบเนียนของ Lmin และ Lmax เพิ่มเพื่อ เพิ่ม Lmax โดยที่มากที่สุด ครั้ง เพิ่มขึ้นใน Lmin (Cx)xjδxjxj+δ(Px)1+O(ε)(Cx)

การเรียนรู้ (ติดตามผู้เชี่ยวชาญ / การส่งเสริม)

อ้างอิงหนึ่งสำหรับการทำความเข้าใจการเชื่อมต่อนี้เป็น เกมการเล่นการปรับเปลี่ยนการใช้น้ำหนักคูณโดย Freund และ Schapire นี่คือการสรุปอย่างย่อเพื่อให้แนวคิดทางเทคนิค

พิจารณาเกมที่ซ้ำกันดังต่อไปนี้ ในแต่ละรอบ : t

  1. คุณเลือกการแจกแจงความน่าจะเป็นบน ( ผู้เชี่ยวชาญที่เรียกว่า ) pt[n]n
  2. รู้ศัตรูแล้วเลือกผลตอบแทนเวกเตอร์{n} ptat[0,1]n
  3. คุณได้รับผลตอบแทนสำหรับรอบ ptat

เกมหยุดหลังจากผ่านไปหลายรอบ เป้าหมายของคุณคือการลดความเสียใจของคุณในการเปรียบเทียบกับผู้เชี่ยวชาญเดียวใด ๆ (เช่นกลยุทธ์บริสุทธิ์) ฉันนั่นคือเป้าหมายของคุณคือการลด Ti(maxitait)tptat

แก้ไขใด ๆ 0 ให้เวกเตอร์แสดงว่า , ที่อยู่, ครั้งรวมเวกเตอร์ของเวกเตอร์ผลตอบแทนถึงเวลาทีจำได้ว่าคือการไล่ระดับสีของ Lmax (y)ε>0ytεstasεtG(y)(y)

นี่คือกลยุทธ์พื้นฐานเราจะวิเคราะห์: ในรอบเลือกจะเป็น{t-1})tptG(yt1)

โดยการตรวจสอบนี้จะช่วยให้คุณ payoffในรอบทีatG(yt1)t

เนื่องจากคุณสมบัติความนุ่มนวลของ , นั่นคือในแต่ละรอบไม่สามารถเพิ่มได้มากกว่าคูณผลตอบแทนของคุณ เนื่องจากสิ่งนี้จะรักษาค่าคงที่ที่ เป็นค่าตอบแทนรวมของคุณมากที่สุด , บวกบนมืออื่น ๆ , ความเสียใจของคุณในการเปรียบเทียบกับผู้เชี่ยวชาญที่ดีที่สุด. เป็นคือF

Lmax(yt)Lmax(yt1)+(1+O(ε))εatG(yt1).
Lmax(yt)ε(1+O(ε))Lmax(0¯)=lnnLmax(yt)ε(1+O(ε)ln(n)imaxitaitε1maxiyitซึ่งเป็นในทางกลับกันที่มากที่สุดT)ε1Lmax(yt)

ดังนั้นความเสียใจของคุณคือมากที่สุด , บวกกับผลตอบแทนรวมของคุณε1ln(n)O(ε)

หมายเหตุ:ฉันคิดว่าในขณะที่ Freund และ Schapire ชี้ให้เห็นว่าอัลกอริทึม "การส่งเสริม" (ในทฤษฎีการเรียนรู้) ก็มีส่วนในการวิเคราะห์นี้เช่นกัน ดูกระดาษสำหรับรายละเอียดเพิ่มเติม

ลดผลตอบแทนรวมให้น้อยที่สุด

คุณสามารถได้รับกลยุทธ์ที่คล้ายกันสำหรับการตั้งค่าที่เป้าหมายคือการย่อให้เล็กสุดแทนที่จะได้รับผลรวมสูงสุด ความเสียใจของคุณซึ่งคุณยังคงต้องการที่จะลดความเป็นa ในกรณีที่ว่ากลยุทธ์ที่สอดคล้องกันคือการเลือกที่จะไล่ระดับสีของT) ด้วยกลยุทธ์นี้คุณต้องเสียใจอย่างมาก บวกกับผลตอบแทนรวมของคุณtptatminiaitptLmin(yt)ε1lnnO(ε)

การเชื่อมต่อกับอัลกอริทึมการผ่อนคลายลากรองจ์

หากต้องการดูการเชื่อมต่อกับอัลกอริทึมการผ่อนคลายลากรองจ์ให้แก้ไขอินสแตนซ์ของชุดคลุม พิจารณาเกมประเภทหลัง (โดยมีเป้าหมายเพื่อลดการจ่ายผลตอบแทนให้น้อยที่สุด) ซึ่งผู้เชี่ยวชาญนั้นสอดคล้องกับองค์ประกอบของระบบที่คุณตั้งไว้ ในแต่ละรอบให้เลือกการแจกแจงความน่าจะเป็น เพื่อไล่ระดับสีของ Lminดังที่กล่าวมาแล้วและให้ฝ่ายตรงข้ามเลือกเวกเตอร์ผลตอบแทนเป็นฟังก์ชันของดังนี้: เลือกชุดการเพิ่มประสิทธิภาพแล้วให้ถ้าและมิฉะนั้นept(yt)atptstespetaet=1estaet=0

ด้วยเงื่อนไขการหยุดที่ถูกต้อง (อธิบายไว้ด้านล่าง) กระบวนการนี้จะให้อัลกอริทึม Set-Cover ตรงตามที่กล่าวไว้ในตอนเริ่มต้น

รับประกันประสิทธิภาพของอัลกอริทึมดังต่อไปนี้จากความเสียใจที่ถูกผูกไว้ดังต่อไปนี้ ให้เป็นจำนวนครั้งที่คู่ต่อสู้เลือกเซ็ตระหว่างการเล่น ให้เป็นฝาครอบชุดเศษส่วนที่ดีที่สุด ให้เป็นจำนวนรอบที่เล่น ความเสียใจที่ถูกหมายถึง XssxT=|Xs|

tatptε1ln(m)+minetaet.

การใช้ความหมายของที่ TH ผลตอบแทน (คนระยะ TH ในผลรวมด้านซ้าย) เท่ากับP ฝ่ายตรงข้ามเลือกเพื่อลดการจ่ายเงินนี้ให้น้อยที่สุด หากฝ่ายตรงข้ามได้เลือกสุ่มจากการแจกแจงความคาดหวังของผลตอบแทนจะเป็น (ข้างต้นเราใช้สำหรับทั้งหมดและ ) เนื่องจากการจ่ายเงินแต่ละครั้งเป็นอย่างน้อยatttestpetststx/|x|

sxs|x|espet = 1|x|epetsexs  1|x|epet = 1|x|.
sexs1e|pt|=11/|x|ความเสียใจที่แสดงนัย โดยนิยามของเรามี (แต่ละรอบเลือกหนึ่งชุด) และให้ เราทำให้กระบวนการหยุดทำงานเมื่อดังนั้น (จัดเรียงคำศัพท์ใหม่) นั่นคือ normalizingให้ขนาดชุดเศษส่วนที่ครอบคลุมมากที่สุดเวลาที่เหมาะสม
T|x|ε1ln(m)+minetaet.
X|X|=Ttaet=e[est]=seXs
|X||x|ε1ln(m)+mineseXs.
mineseXs=Ω(ε2lnm)
|X|mineseXs  (1+O(ε)|x|.
X(1+O(ε))

ข้อสังเกต:ในแง่หนึ่งการตีความทฤษฎีการเรียนรู้นี้ทำให้การตีความแบบอัลกอริทึมเป็นเรื่องทั่วไป อย่างไรก็ตามเทคนิคอัลกอริทึมบางอย่างที่จำเป็นสำหรับประสิทธิภาพ (เช่นการเพิ่มขึ้นที่ไม่สม่ำเสมอและการลดความพึงพอใจที่ครอบคลุมข้อ จำกัด ) ดูเหมือนจะไม่นำไปสู่ทฤษฎีการเรียนรู้ตามธรรมชาติ อัลกอริธึมสำหรับ การบรรจุแบบผสมและครอบคลุม LP (เช่นนี้ ) ดูเหมือนจะไม่มีสัญญาณอะนาล็อกตามธรรมชาติในการตั้งค่าการเรียนรู้ทฤษฎี


8
นั่นเป็นคำตอบที่ค่อนข้าง !!
Suresh Venkat

1
ขอบคุณ อาจจะเกินขนาดมัน ฉันสนใจความคิดเห็น: ทำอย่างไรจึงจะนำเสนอแนวคิดเหล่านี้อย่างเข้าถึงได้สิ่งอื่น ๆ ที่จะรวม ...
Neal Young
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.