ฉันจะพยายามแก้ไขข้อผิดพลาดก่อนหน้าโดยแสดงสิ่งที่ตรงกันข้าม - นั่นตัวอย่างเพียงพอ (ขอบเขตล่างของเกือบจะแน่น)! ดูว่าคุณคิดอย่างไร1/ϵ2Θ~(1ϵ2)1/ϵ2
สัญชาตญาณที่สำคัญเริ่มต้นจากการสังเกตสองครั้ง อันดับแรกเพื่อให้การแจกแจงมีระยะทางของจะต้องมีจุดที่มีความน่าจะเป็นสูง ( ) ตัวอย่างเช่นถ้าเรามีความน่าจะเป็นจุดเราจะมี<\ ε โอห์ม( ε 2 ) 1 / ε 3 ε 3 ‖ D 1 - D 2 ‖ 2 ≤ √L2ϵΩ(ϵ2)1/ϵ3ϵ3∥D1−D2∥2≤1ϵ3(ϵ3)2−−−−−−√=ϵ3/2<ϵ
ประการที่สองพิจารณาการกระจายสม่ำเสมอกับระยะทาง\ถ้าเรามีจุดที่น่าจะเป็นแล้วพวกเขาแต่ละคนจะแตกต่างกันโดยและตัวอย่างจะพอเพียง ในทางตรงกันข้ามถ้าเรามีคะแนนพวกเขาแต่ละคนจะต้องแตกต่างกันโดยและอีกตัวอย่าง (จำนวนคงที่ต่อ จุด) พอเพียง ดังนั้นเราอาจหวังว่าในบรรดาคะแนนความน่าจะเป็นสูงที่กล่าวถึงก่อนหน้านี้มักจะมีบางจุดที่แตกต่างกัน "พอ" ที่ดึงความแตกต่างออกมา ϵ O ( 1 ) O ( 1 ) O ( ϵ ) 1 / ϵ 2 O ( 1 / ϵ 2 ) O ( ϵ 2 ) O ( 1 / ϵ 2 ) O ( 1 / ϵ 2 )L2ϵO(1)O(1)O(ϵ)1/ϵ2O(1/ϵ2)O(ϵ2)O(1/ϵ2)O(1/ϵ2)
ขั้นตอนวิธี ได้รับและความเชื่อมั่นพารามิเตอร์ให้2) วาดตัวอย่างจากการแจกแจงแต่ละครั้ง ให้จะสูงขึ้นตามลำดับลดจำนวนตัวอย่างสำหรับการจุดฉันหากมีประเด็นใดที่ซึ่งและให้ประกาศ การแจกแจงที่แตกต่างกัน มิฉะนั้นให้ประกาศเหมือนกันM X = บันทึกM ( 1 / ϵ 2 ) XϵMX=Mlog(1/ϵ2) aฉัน,ขฉันฉันฉัน∈[n]aฉัน≥XXϵ2ai,biii∈[n]ฉัน-ขฉัน≥√ai≥X8ai−bi≥ai−−√X√4
ความถูกต้องและความเชื่อมั่นของขอบเขต ( ) ขึ้นอยู่กับการแทรกต่อไปนี้ที่บอกว่าทั้งหมดของการเบี่ยงเบนในระยะทางมาจากจุดที่มีความน่าจะแตกต่างกันโดย2) L 2 Ω ( ϵ 2 )1−e−Ω(M)L2Ω(ϵ2)
ข้อเรียกร้อง สมมติว่า\ Let. ให้\} จากนั้น
δ i = | D 1 ( i ) - D 2 ( i ) | S k = { i : δ i > ϵ 2∥D1−D2∥2≥ϵδi=|D1(i)−D2(i)|∑ฉัน∈ S k δ 2 ฉัน ≥ϵ2(1-2Sk={i:δi>ϵ2k}
∑i∈Skδ2i≥ϵ2(1−2k).
พิสูจน์ เรามี
ขอให้เรา จำกัด ผลรวมที่สอง เราต้องการที่จะขยายภายใต้2 ตั้งแต่ฟังก์ชั่นเป็นอย่างเคร่งครัดนูนและเพิ่มขึ้นเราสามารถเพิ่มวัตถุประสงค์โดยการใด ๆและเพิ่มโดยลดลงในขณะโดย\ดังนั้นเป้าหมายจะถูกขยายให้มากที่สุดโดยมีคำให้มากที่สุดเท่าที่จะเป็นไปได้ที่ค่าสูงสุดและที่เหลือคือΣฉัน∉ S k δ 2 ฉัน Σฉัน∉ S k δฉัน≤2x↦x2δฉัน≥δเจδฉันγδเจγ0 ε 2
∑i∈Skδ2i + ∑i∉Skδ2i≥ϵ2.
∑i∉Skδ2i∑i∉Skδi≤2x↦x2δi≥δjδiγδjγ0. ค่าสูงสุดของแต่ละเทอมคือและมีจำนวนมากที่สุดข้อกำหนดของค่านี้ (เนื่องจากผลรวมสูงสุด ) ดังนั้น
2kϵ2k 2∑ฉัน∉Skδ 2 ฉัน ≤2k2kϵ22∑i∉Skδ2i≤2kϵ2(ϵ2k)2=2ϵ2k. □
ข้อเรียกร้อง ให้\} ถ้ามีอยู่อย่างน้อยหนึ่งจุดด้วยและ{2}‖ D 1 - D 2 ‖ 2 ≥ ε ฉัน∈ [ n ] หน้าฉัน > ε 2pi=max{D1(i),D2(i)}∥D1−D2∥2≥ϵi∈[n]pi>ϵ24δi≥ϵpi√2
พิสูจน์ ขั้นแรกคะแนนทั้งหมดในมีตามคำจำกัดความ (และไม่สามารถว่างสำหรับโดยการอ้างสิทธิ์ก่อนหน้า)Skpi≥δi>ϵ2kSkk>2
ที่สองเนื่องจากเรามี
หรือจัดเรียงใหม่
ดังนั้นความไม่เท่าเทียม
ถือสำหรับอย่างน้อยหนึ่งจุดในS_kตอนนี้รับ 4 ∑ipi≤2
∑i∈Skδ2i≥ϵ2(12−1k)∑i∈Skpi,
∑i∈Sk(δ2i−piϵ2(12−1k))≥0,
δ2i≥piϵ2(12−1k)
Skk=4□
การเรียกร้อง (บวกเท็จ) หากอัลกอริทึมของเราบอกพวกเขาแตกต่างกับความน่าจะเป็นที่มากที่สุด(M)}D1=D2e−Ω(M)
ร่าง พิจารณาสองกรณีและ\ ในกรณีแรกจำนวนตัวอย่างของจะไม่เกินจากการแจกแจง: จำนวนเฉลี่ยของตัวอย่างคือและหางผูกบอกว่าด้วยความน่าจะเป็น , 's ตัวอย่างไม่เกินค่าเฉลี่ยของพวกเขาโดยสารเติมแต่ง ; หากเราระมัดระวังที่จะเก็บค่าไว้ในหางที่ถูกผูกไว้เราสามารถรวมเข้าด้วยกันได้ไม่ว่าจะมีกี่จุดเช่นนั้น (โดยสังหรณ์ใจpi<ϵ2/16pi≥ϵ2/16iX/8<X/16e−Ω(X/pi)=ϵ2e−Ω(M/pi)iX/16pi
ในกรณีเราสามารถใช้ขอบเขตเชอร์นอฟ: มันบอกว่าเมื่อเราใช้เวลาตัวอย่างและเป็นจุดที่ถูกวาดด้วยความน่าจะน่าจะเป็นของที่แตกต่างจากค่าเฉลี่ยของโดยที่มากที่สุด2)} นี่ให้ดังนั้นความน่าจะเป็นที่สิ้นสุดโดย(M)}pi≥ϵ2/16mppmcpm−−−√e−Ω((cpm√)2/pm)=e−Ω(c2)c=X√16e−Ω(X)=ϵ2e−Ω(M)
ดังนั้นด้วยความน่าจะเป็น , (สำหรับการแจกแจงทั้งคู่) จำนวนตัวอย่างของอยู่ภายในค่าเฉลี่ยของ2} ดังนั้นการทดสอบของเราจะไม่จับประเด็นเหล่านี้ (พวกเขาอยู่ใกล้กันมาก) และเราสามารถรวมกันทั้งหมดของพวกเขา 1−ϵ2e−Ω(M)ipiXϵ2−−−−√X√16piXϵ216/ϵ2□
การเรียกร้อง (เชิงลบเท็จ) หากอัลกอริทึมของเราบอกพวกเขาเหมือนกันกับความน่าจะเป็นที่มากที่สุด(M)}∥D1−D2∥2≥ϵϵ2e−Ω(M)
ร่าง มีบางประเด็นก็คือกับและ 2 Chernoff เดียวกันกับที่กล่าวอ้างก่อนหน้านี้ว่าด้วยความน่าจะเป็นจำนวนตัวอย่างของแตกต่างจากค่าเฉลี่ยโดยมากที่สุด{16} นั่นคือการแจกแจง (WLOG)ซึ่งมี ; แต่มีความน่าจะเป็นที่ลดลงของจำนวนตัวอย่างของจากการแจกแจงipi>ϵ2/4δi≥ϵpi−−√/21−ϵ2e−Ω(M)ipimpim−−−√X√161pi=D1(i)=D2(i)+δii2 แตกต่างจากค่าเฉลี่ยของจำนวนสารเติมแต่งนี้ (เนื่องจากค่าเฉลี่ยและความแปรปรวนต่ำกว่า)
ดังนั้นด้วยความน่าจะเป็นสูงจำนวนตัวอย่างของจากการแจกแจงแต่ละครั้งจะอยู่ภายในของค่าเฉลี่ย; แต่ความน่าจะเป็นของพวกเขาแตกต่างกันโดยดังนั้นวิธีการของพวกเขาจึงแตกต่างกันโดย
ipiXϵ2−−−√X√16δi
Xϵ2δi≥Xpi−−√2ϵ=piXϵ2−−−−√X−−√2.
ดังนั้นมีโอกาสสูงสำหรับจุดจำนวนของกลุ่มตัวอย่างแตกต่างกันโดยอย่างน้อย{4} i#samples(1)−−−−−−−−−−−√X√4□
เพื่อให้ร่างภาพสมบูรณ์เราจะต้องแสดงให้เห็นอย่างจริงจังว่าสำหรับใหญ่พอจำนวนตัวอย่างของใกล้เคียงกับค่าเฉลี่ยของมันเมื่ออัลกอริทึมใช้มากกว่ามันไม่เปลี่ยนแปลงอะไรเลย (ซึ่งควรจะตรงไปตรงมาโดยออกจากห้องเลื้อยในค่าคงที่)Mi#samples−−−−−−−−√mean−−−−−√