ขอบเขตของช่วงเวลาความถี่โดยประมาณ


11

ให้เป็นลำดับของจำนวนเต็มซึ่งแต่ละ\} สำหรับให้. TH ขณะความถี่ถูกกำหนดให้เป็นเจ{ 1 , 2 , ... , n } ฉัน{ 1 , 2 , ... , n } m ฉัน = | { j : a j = i } | ka1,a2,,amaj{1,2,,n}i{1,2,,n}mi=|{j:aj=i}|k

Fk=i=1nmik.

ในกระดาษที่รู้จักกันดีความซับซ้อนของพื้นที่ในการประมาณช่วงเวลาของความถี่ Alon และคณะ ให้ขั้นตอนวิธีการสตรีมมิ่งที่ใกล้เคียงกับใช้ประมาณพื้นที่ พวกเขายังใช้เทคนิคการสื่อสารความซับซ้อนเพื่อให้ได้ขอบเขตล่างของสำหรับ5 สำหรับจะให้การจับคู่ส่วนบนและส่วนล่างที่ตรงกันมากหรือน้อย O ( n 1 - 1)FkΩ(n1-5O(n11k(logn+logm))k>5k=0,1,2Ω(n15k)k>5k=0,1,2

มีการปรับปรุงขอบเขตเหล่านี้ตั้งแต่นั้นมาและมีความคืบหน้าสำหรับ ?k=3,4,5

คำตอบ:


14

มีความคืบหน้าพอสมควร ในการแก้ปัญหาที่เฉพาะเจาะจงของมีการจับคู่บนและล่างผูกพันของสำหรับ2 ขอบเขตบนมาจากกระดาษนี้โดย Indyk และดุจดัง (ซึ่งปรากฏใน STOC 2005) และขอบเขตล่างผ่านกรอบข้อมูลซับซ้อนเนื่องจากBar-Yossef et al,และChakrabarti et al,n 1 - 2 / k k > 2Fkn12/kk>2


3
สิ่งนี้เกี่ยวข้องด้วย: arxiv.org/abs/1011.1263
Mahdi Cheraghchi

1
ตรวจสอบลิงค์ @MCH ที่ส่งมาทำให้ขั้นตอนวิธีและการวิเคราะห์แบบลีนและค่าเฉลี่ย แต่บางทีวิทยานิพนธ์ของดาวิดอาจมีประโยชน์สำหรับการหยั่งรู้และอภิปรายเช่นกัน: almaden.ibm.com/cs/people/dpwoodru/phdFinal.pdf
Sasho Nikolov

3

สำหรับ k <= 2

1) k = 0 ผูกพันเป็นจากhttp://people.seas.harvard.edu/~minilek/papers/f0.pdfO(1/ϵ2+log(n))

2) k = 1, กระดาษโดย Alon และทั้งหมดให้การอ้างอิงถึงกระดาษโดย Morris ซึ่งใช้พื้นที่ พื้นที่O~(log(log(n))

3) k = 2 ฉันคิดว่าร่าง AMS จากกระดาษของพวกเขาเหมาะสมที่สุด


1

สิ่งที่เกี่ยวข้อง

ฉันคิดว่ามีบางงานที่เกี่ยวข้องกับการประมาณค่าโดยที่ไม่จำเป็นต้องเป็นจำนวนเต็ม http://www.stat.cornell.edu/~li/SODA09_CC.pdfเป็นสิ่งที่ฉันรู้ ผมไม่ได้สมบูรณ์คุ้นเคยกับการนี้ แต่ผมคิดว่าจุดหลักของพวกเขาที่น่าสนใจคือการพึ่งพาและไม่nอัลฟ่าε nFααϵn


1
หมายเหตุนี่สำหรับเมื่อการพึ่งพาเป็นที่ทราบกันว่าเป็น polylog ดังนั้นจึงกลายเป็นคอขวดn εα(1,2)nϵ
Sasho Nikolov
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.