พิสูจน์ว่าแผนภูมิการค้นหาแบบไบนารีที่สร้างแบบสุ่มมีความสูงลอการิทึม

คุณจะพิสูจน์ได้อย่างไรว่าความสูงที่คาดหวังของแผนภูมิการค้นหาแบบไบนารีที่สร้างแบบสุ่มด้วย $n$ โหนดคือ ? มีหลักฐานใน CLRS รู้เบื้องต้นเกี่ยวกับอัลกอริทึม (บทที่ 12.4) แต่ฉันไม่เข้าใจ $O(\log n)$

— user1675999
แหล่งที่มา

คำถามไหน? ตัวอย่างอะไร โปรดแก้ไขและให้รายละเอียดทั้งหมด

— Ran G.

โปรดหลีกเลี่ยงการใช้ตัวย่อ (เช่น BST) และคิดว่าพวกเราส่วนใหญ่ไม่มีหนังสือ CLRS หากคุณสามารถคัดลอกทฤษฎีบทที่นี่และอธิบายว่าอะไรที่คุณไม่เข้าใจคุณจะได้รับคำตอบเพิ่มเติม

— Ran G.

สิ่งนี้จะขึ้นอยู่กับวิธีสร้างแผนภูมิการค้นหาแบบไบนารี (แม้ว่าผลลัพธ์จะไม่ได้ผลการพิสูจน์จะมี) รายละเอียดเพิ่มเติมบางอย่างจะเป็นประโยชน์

— Peter Shor

ก่อนอื่นเรามาคิดถึงเรื่องนี้กันก่อน ในสถานการณ์ที่ดีที่สุดต้นไม้มีความสมดุลอย่างสมบูรณ์ ในสถานการณ์ที่เลวร้ายที่สุดทรีจะไม่สมดุลกันทั้งหมด:

แผนภูมิการค้นหาแบบไบนารีที่มีความสูง แผนผังการค้นหาไบนารีที่แย่ที่สุด

เริ่มต้นจากรูตโหนดต้นไม้ที่เหลือนี้มีสองเท่าของโหนดจำนวนมากที่แต่ละระดับความลึกที่สำเร็จเช่นต้นไม้มีโหนดและความสูง (ซึ่งอยู่ใน กรณีนี้ 3) ด้วยคณิตศาสตร์น้อย $p$ $n=\sum_{i=0}^{h}2^i =2^{h+1}-1$ $h$ ซึ่งจะบอกว่ามันมีความสูงสำหรับต้นไม้ที่ไม่สมดุลทั้งความสูงของต้นไม้เป็นเพียง )ดังนั้นเราจึงมีขอบเขตของเรา $n\le2^{h+1}-1\rightarrow h\le\lceil\log_2(n+1)-1\rceil\le\lfloor log_2 n\rfloor$ $O(\log n)$ $n-1\rightarrow O(n)$

หากเราสร้างต้นไม้ที่สมดุลจากรายการที่สั่งเราจะเลือกองค์ประกอบกลางให้เป็นรูตโหนดของเรา ถ้าเราจะแทนการสุ่มสร้างต้นไม้ใด ๆ ของโหนดได้อย่างเท่าเทียมกันมีแนวโน้มที่จะได้รับเลือกและความสูงของต้นไม้ของเราคือ $\{ 1,2,\dots,n\}$ $n$ เรารู้ว่าในต้นไม้ค้นหาไบนารีทรีย่อยทางซ้ายจะต้องมีคีย์น้อยกว่าโหนดราก ดังนั้นถ้าเราสุ่มเลือกองค์ประกอบ , ทรีย่อยด้านซ้ายมีองค์ประกอบและทรีย่อยด้านขวามีองค์ประกอบดังนั้นจึงมีขนาดกะทัดรัดมากขึ้น:

h e i g h t_{t r e e} = 1 + max (h e i g h t_{l e f t s u b t r e e}, h e i g h t_{r i g h t s u b t r e e})

$height_{tree}=1+\max (height_{left\space subtree}, height_{right\space subtree})$

i^{t h}

$i^{th}$

i - 1

$i-1$

n - i

$n-i$

)

จากที่นั่นจะทำให้รู้สึกว่าถ้าเลือกองค์ประกอบแต่ละอย่างเท่า ๆ กันค่าที่คาดหวังเป็นเพียงค่าเฉลี่ยของทุกกรณี (แทนที่จะเป็นค่าเฉลี่ยถ่วงน้ำหนัก) ดังนั้น:

h_{n} = 1 + max (h_{i - 1}, h_{n - i})

$h_n=1+\max (h_{i-1},h_{n-i})$

E [h_{n}] = \frac{1}{n} \sum_{i = 1}^{n} [1 + max (h_{i - 1}, h_{n - i})]

$\operatorname{E}[h_n]=\frac{1}{n}\sum_{i=1}^{n}[1+\max (h_{i-1},h_{n-i})]$

ในขณะที่ฉันแน่ใจว่าคุณสังเกตเห็นฉันได้เบี่ยงเบนไปเล็กน้อยจากวิธีการที่ CLRS พิสูจน์สิ่งนี้เพราะ CLRS ใช้เทคนิคการพิสูจน์ที่ค่อนข้างธรรมดาสองอย่างที่ไม่น่าไว้วางใจสำหรับมือใหม่ สิ่งแรกคือการใช้เลขชี้กำลัง (หรือลอการิทึม) ของสิ่งที่เราต้องการค้นหา (ในกรณีนี้ความสูง) ซึ่งทำให้คณิตศาสตร์คำนวณออกมาได้สะอาดมากขึ้นเล็กน้อย ที่สองคือการใช้ฟังก์ชั่นตัวบ่งชี้ (ซึ่งฉันจะไม่สนใจที่นี่) CLRS กำหนดความสูงแบบเอ็กซ์โพเนนเชียลเมื่อดังนั้นการเกิดซ้ำแบบอะนาล็อกคือ $Y_n=2^{h_n}$ $Y_n=2\times\max (Y_{i-1},Y_{n-i})$ .

สมมติว่าเป็นอิสระ (แต่ละองค์ประกอบของการดึง (จากองค์ประกอบที่มีอยู่) จะเป็นรากของทรีย่อยโดยไม่คำนึงถึงการดึงก่อนหน้านี้ทั้งหมด) เรายังคงมีความสัมพันธ์: ซึ่งฉันได้ทำสองขั้นตอน: (1) ย้าย

E [Y_{n}] = Σ_{ผม = 1}^{n} \frac{1}{n} E [2 \times สูงสุด (Y_{ผม - 1}, Y_{n - ผม})] = \frac{2}{n} Σ_{ผม = 1}^{n} E [สูงสุด (Y_{ผม - 1}, Y_{n - ผม})]

$\operatorname{E}[Y_n]=\sum_{i=1}^{n}\frac{1}{n}\operatorname{E}[2\times\max (Y_{i-1},Y_{n-i})]=\frac{2}{n}\sum_{i=1}^{n}\operatorname{E}[\max (Y_{i-1},Y_{n-i})]$

นอกเพราะมันเป็นอย่างต่อเนื่องและเป็นหนึ่งในคุณสมบัติของ summations คือว่า

และ (2) การเคลื่อนย้าย 2 นอกเพราะมันยังเป็นอย่างต่อเนื่องและเป็นหนึ่งในคุณสมบัติของค่าที่คาดว่าจะเป็น

]

ตอนนี้เรากำลังจะแทนที่ฟังก์ชั่น

ด้วยบางสิ่งที่ใหญ่กว่าเพราะการทำอย่างง่ายนั้นเป็นเรื่องยาก หากเราโต้แย้งว่าไม่เป็นลบ

\frac{1}{n}

$\frac{1}{n}$

\sum_{i} c i = c \sum_{i} i

$\sum_i ci=c\sum_i i$

E [a x] = a E [x]

$\operatorname{E}[ax]=a\operatorname{E}[x]$

max

$\max$

X

$X$

Y

$Y$

จากนั้น:

E [max (X, Y)] \leq E [max (X, Y) + min (X, Y)] = E [X] + E [Y]

$\operatorname{E}[\max(X,Y)]\le\operatorname{E}[\max(X,Y)+\min(X,Y)]=\operatorname{E}[X]+\operatorname{E}[Y]$

ซึ่งขั้นตอนสุดท้ายนั้นตามมาจากการสังเกตว่าสำหรับ

และ

และไปทั้งหมด วิธี

และ

E [Y_{n}] \leq \frac{2}{n} Σ_{ผม = 1}^{n} (E [Y_{ผม - 1}] + E [Y_{n - ผม}]) = \frac{2}{n} Σ_{ผม = 0}^{n - 1} 2 E [Y_{ผม}]

$\operatorname{E}[Y_n]\le\frac{2}{n}\sum_{i=1}^{n}(\operatorname{E}[Y_{i-1}]+\operatorname{E}[Y_{n-i}])=\frac{2}{n}\sum_{i=0}^{n-1}2\operatorname{E}[Y_{i}]$

i = 1

$i=1$

Y_{i - 1} = Y_{0}

$Y_{i-1}=Y_{0}$

Y_{n - i} = Y_{n - 1}

$Y_{n-i}=Y_{n-1}$

i = n

$i=n$

Y_{i - 1} = Y_{n - 1}

$Y_{i-1}=Y_{n-1}$

ดังนั้นทุกเทอม

ถึง

จะปรากฏสองครั้งดังนั้นเราสามารถแทนที่ผลรวมทั้งหมดด้วยแบบอะนาล็อก ข่าวดีก็คือเรามีการกลับเป็นซ้ำ

Y_{n - i} = Y_{0}

$Y_{n-i}=Y_{0}$

Y_{0}

$Y_0$

Y_{n - 1}

$Y_{n-1}$

; ข่าวร้ายก็คือเราไม่ได้มากไปกว่าที่เราเริ่มต้น

E [Y_{n}] \leq \frac{4}{n} \sum_{i = 0}^{n - 1} E [Y_{i}]

$\operatorname{E}[Y_n]\le\frac{4}{n}\sum_{i=0}^{n-1}\operatorname{E}[Y_{i}]$

ณ จุดนี้ CLRS จะดึงการเหนี่ยวนำ $\operatorname{E}[Y_n]\le\frac{1}{4}\binom{n+3}{3}$ $\sum_{i=0}^{n-1}\binom{i+3}{3}=\binom{n+3}{4}$ $n^3$ $Y_n=2^{h_n}$ $h_n=\log_2n^3=3\log_2n\rightarrow O(\log n)$ $n^k$ $k$

2^{E [X_{n}]} \leq E [Y_{n}] \leq \frac{4}{n} Σ_{ผม = 0}^{n - 1} E [Y_{ผม}] \leq \frac{1}{4} (\binom{n + 3}{3}) = \frac{(n + 3) (n + 2) (n + 1)}{24} \to E [{ชั่วโมง}_{n}] = O (เข้าสู่ระบบ n)

$2^{\operatorname{E}[X_n]}\le \operatorname{E}[Y_n]\le \frac{4}{n}\sum_{i=0}^{n-1}\operatorname{E}[Y_i]\le\frac{1}{4}\binom{n+3}{3}=\frac{(n+3)(n+2)(n+1)}{24}\rightarrow \operatorname{E}[h_n]=O(\log n)$

— Merbs
แหล่งที่มา

ว้าวขอบคุณ !!!! แม้ว่าฉันไม่รู้เกี่ยวกับค่าที่คาดหวัง แต่มันก็สมเหตุสมผลดี ฉันไม่ได้เรียนวิชาคณิตศาสตร์อย่างรอบคอบก่อนจะทำอัลกอริธึม ฉันจะโพสต์ความคิดเห็นเพิ่มเติมหากฉันมีข้อสงสัย ขอบคุณ Merbs

— user1675999

แต่ทำไมความสูงของเลขชี้กำลังจึงน้อยกว่าหรือเท่ากับทวินามที่เลือก ฉันยังไม่เข้าใจว่าทำไมเราไม่สามารถเลือกทวินามอื่นที่มีเทอมใหญ่ที่สุดต่างกันและทำคณิตศาสตร์แบบเดียวกัน ... อาจจะเป็นคนงี่เง่า แต่ฉันก็ไม่สามารถมองเห็นได้ว่าทำไม ... และจนถึงตอนนี้ ทำให้รู้สึกที่สมบูรณ์แบบแล้วพวกเขาก็ต้องดึงบางสิ่งบางอย่างออกมาจากสีน้ำเงินและไม่มีคำอธิบายบอกเราว่า "พิสูจน์" พวกเขาถูก ...

— Zeks

@ Zeks ดังนั้นเราสามารถเลือก binomials อื่น ๆ ที่มีเงื่อนไขขนาดใหญ่ หากคำนั้นยังคงเป็นพหุนาม ( n^k) ข้อสรุปจะเหมือนกันเพราะคำเหล่าkนี้จะถูกทิ้งไว้ในสัญกรณ์ O ขนาดใหญ่ (วิธีที่ 3 ถูกทิ้ง) แต่ถ้าเราแทนในบางสิ่งบางอย่างที่ชี้แจง ( e^n) ก็จะยังคงเป็นที่ถูกต้องบนผูกพันเพียงไม่แน่นหนึ่ง เรารู้ว่าความสูงที่คาดไว้นั้นเป็นอย่างน้อยลอการิทึมดังนั้นการพิจารณาว่าเป็นลอการิทึมส่วนใหญ่ทำให้แน่น

— Merbs

@ DavidNathan ฉันไม่เข้าใจข้อกังวลของคุณ - คุณสงสัยหรือไม่ว่า 1 / n นั้นเป็นค่าคงที่หรือว่ามันสามารถถูกย้ายออกนอกการรวมตัวได้หรือไม่? มันเหมือนกับค่าคงที่ 2 ส่วนใหญ่ถูกนำไปใช้เพื่อจุดประสงค์ในการอธิบายเพื่อทำให้การพิสูจน์ที่เหลือง่ายขึ้น

— Merbs