การประมาณที่ดีที่สุดสำหรับการลงคะแนนเสียงข้างมากคืออะไร?


18

การลงคะแนนเสียงส่วนใหญ่เกิดขึ้นค่อนข้างบ่อยในการยอมรับข้อผิดพลาด (และไม่ต้องสงสัยเลยว่าที่อื่น) ซึ่งฟังก์ชั่นเอาต์พุตบิตเท่ากับที่เคยปรากฏตามตัวอักษรบ่อยที่สุดในมูลค่าของบิตอินพุต เพื่อความง่ายสมมติว่าเมื่อใดก็ตามที่อินพุตมีจำนวนบิตเท่ากับในสถานะ 0 และสถานะ 1 มันจะส่งออก 0

สิ่งนี้สามารถสรุปเป็น dits ที่มีความเป็นไปได้มากกว่า 2 รายการสำหรับแต่ละอินพุตโดยส่งคืนค่าที่เกิดขึ้นบ่อยที่สุดในอินพุตและในกรณีของการผูกให้คืนค่าที่พบบ่อยที่สุดซึ่งมาจากพจนานุกรมแรก มาเรียกฟังก์ชั่นนี้ว่า

ฉันสนใจในผลลัพธ์ของฟังก์ชันดังกล่าวเมื่อแต่ละอินพุทมีการแจกแจงความน่าจะเป็นคงที่ (และการแจกแจงจะเหมือนกันสำหรับดิจิตแต่ละตัวในอินพุต) โดยเฉพาะฉันสนใจคำถามต่อไปนี้

ได้รับชุดS={S1,S2,...,Sn} , ถ้าเซตสุ่มตัวอย่างอิสระNครั้ง, ด้วยความน่าจะเป็นpiเลือก องค์ประกอบithของSทุกครั้ง, สำหรับการเลือกคงที่ของvคือความน่าจะเป็นที่คะแนนส่วนใหญ่ของผลลัพธ์เหล่านี้คือSv ?

ตอนนี้มันเป็นเรื่องตรงไปตรงมาที่จะคำนวณคำตอบที่ถูกต้องสำหรับคำถามข้างต้นซึ่งเป็นผลรวมของการแจกแจงแบบหลายส่วน อย่างไรก็ตามสำหรับจุดประสงค์ของฉันสิ่งนี้ไม่เหมาะอย่างยิ่งและการปิดเพื่อการประมาณจะดีกว่า ดังนั้นคำถามของฉันคือ:

การประมาณรูปแบบปิดใด ๆ กับความน่าจะเป็นข้างต้นมีขอบเขตที่แคบที่สุดในระยะทางสูงสุดจากค่าที่แน่นอน?


ฉันไม่รู้ แต่ฉันขอแนะนำวลีค้นหา "ฉันทามติทฤษฎีการควบคุม" หรือ "ปัญหาฉันทามติทฤษฎีการควบคุม" มันเป็นปัญหาที่แตกต่างจากปัญหาฉันทามติการคำนวณแบบกระจายและอาจเป็นสิ่งที่คุณต้องการ
แอรอนสเตอร์ลิง

คุณกำลังมองหาค่าประมาณที่ใช้งานได้ดีเมื่อ N มีขนาดใหญ่เมื่อเทียบกับ n หรือไม่? ถ้าเป็นเช่นนั้นกฎการผูกไทม์จะต้องไม่เกี่ยวข้อง
Tsuyoshi Ito

@TsuyoshiIto: ใช่ฉันและแน่นอนว่ากฎนั้นไม่เกี่ยวข้อง แต่ฉันต้องการที่จะทำให้แน่ใจว่าคำถามนั้นถูกวางไว้อย่างดี ฉันไม่สนใจเลยว่าความสัมพันธ์จะแตกอย่างไรเพราะมันเป็นเรื่องง่ายที่จะจำกัดความคลาดเคลื่อน
Joe Fitzsimons

1
ดีนี่กลับมาของประมาณการซองจดหมาย ... Let เป็นจำนวนครั้งที่คุณเลือกชุดSฉัน นี่คือตัวแปรทวินาม แกล้งพวกเขาเป็นอิสระ ทีนี้สำหรับค่าคงที่ของY v , คุณสามารถคำนวณความน่าจะเป็นที่จะได้ค่านี้เป็นY v , และสำหรับค่านี้คำนวณความน่าจะเป็นที่มันชนะเหนือตัวแปรอื่น ๆ ทั้งหมด นี่น่าจะเป็นขอบเขตที่ดีสำหรับความน่าจะเป็น แน่นอนว่ามันไม่รัดกุม - ยิ่งคุณพึ่งพามากเท่าไรคุณก็ยิ่งต้องพึ่งพาการคาดการณ์ของคุณมากขึ้นเท่านั้น แต่ยิ่งคุณต้องคำนวณมากขึ้นเท่าไหร่ YiSiYvYv
Sariel Har-Peled

คำตอบ:


1

ถ้าสำหรับทุกฉันวีแล้วpv>piiv

Pr[outcome is different from v]minT(Pr[B(N,pv)T]+Pr[ivB(N,pi)T]),

โดยที่คือการแจกแจงทวินามและTเป็นเกณฑ์โดยพลการ เสียบT = N ( พีวี + สูงสุดฉันวีพีวี ) / 2และการใช้ Chernoff ตัวหนึ่งสามารถบนผูกพันนี้น่าจะเป็นอี- Ω ( N )B(n,p)TT=N(pv+maxivpv)/2eΩ(N)

แน่นอนถ้าไม่สูงสุดคุณก็จะได้ภาพที่ตรงกันข้าม ด้วยความน่าจะเป็นที่vไม่เป็นผลpvv


1
ขอบคุณที่คิดถึงปัญหา แต่นี่ไม่ใช่สิ่งที่ฉันกำลังมองหา มันไม่ใช่แบบฟอร์มปิด ฉันจะต้องรวมจำนวนเอ็กซ์โปเนนเชียลที่ไม่ จำกัด จำนวน ฉันรู้วิธีเขียนคำตอบที่ถูกต้องแล้วและฉันรู้ว่ามีการประมาณจำนวนมากสำหรับคำศัพท์แต่ละคำ แต่นั่นไม่ใช่สิ่งที่ฉันต้องการ ฉันกำลังมองหาวิธีการแก้ปัญหาแบบปิดโดยประมาณไม่ใช่คำศัพท์เฉพาะ ฉันยังต้องการข้อผิดพลาดที่เหมาะสม
Joe Fitzsimons

1
คุณสามารถปิดฟอร์มโดยใช้วิธีเดียวกัน (ถ้าคุณพอใจกับปัจจัยเพิ่มเติม ) และเพื่อผูกข้อผิดพลาดคุณสามารถใช้ทฤษฎีบท Berry-Eseen แทนการผูกไว้กับ Chernoff n
ilyaraz

@ilyaraz ฉันพยายามเข้าใจความไม่สมดุลครั้งแรกของคุณ คุณช่วยอธิบายฉันได้ดีกว่าเพราะเหตุใด ฉันคิดว่าคุณเคยใช้สหภาพในบางด้าน แต่ฉันไม่เข้าใจ ขอบคุณ :)
AntonioFa
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.