เหตุใด Quickized Quicksort จึงมีค่าใช้จ่ายรันไทม์ที่แย่ที่สุดในกรณี O (n log n)

18

การจัดเรียงแบบด่วนแบบสุ่มเป็นส่วนขยายของการเรียงแบบด่วนซึ่งองค์ประกอบของเดือยจะถูกเลือกแบบสุ่ม สิ่งที่สามารถซับซ้อนเวลากรณีที่เลวร้ายที่สุดของอัลกอริทึมนี้ ตามที่ผมมันควรจะเป็น $O(n^2)$ เป็นกรณีที่เลวร้ายที่สุดที่เกิดขึ้นเมื่อหมุนสุ่มเลือกถูกเลือกในเรียงหรือเรียงย้อนกลับการสั่งซื้อ แต่ในบางตำรา [1] [2]ความซับซ้อนของเวลากรณีที่เลวร้ายที่สุดถูกเขียนเป็น $O(n\log{n})$

ถูกต้องอะไร

— Atinesh
แหล่งที่มา

3

คุณควร "ข้อความบางส่วน" ที่คุณกำลังพูดถึง มีบางอย่างซ่อนอยู่ที่นั่น คุณจะพบว่าถ้าคุณอ่าน "ข้อความ" นี้อีกครั้ง

— AJed

หมายเหตุ: ลิงค์ [1] นั้นตาย ลิงก์ [2] ระบุอย่างชัดเจนว่าอัลกอริทึมนั้นถูกสุ่มดังนั้นสำหรับอินพุตใด ๆ ที่คุณไม่มี "รันไทม์" แต่ "รันไทม์ที่คาดหวัง" และรันไทม์ที่คาดไว้สำหรับอินพุตที่แย่ที่สุดคือ O (n log n)

— gnasher729

18

ทั้งสองของแหล่งที่มาของคุณดูที่ "เลวร้ายที่สุดกรณีที่คาดว่าเวลาทำงาน" ของฉันเดาว่านี่หมายถึงความต้องการเวลาที่คาดหวังซึ่งแตกต่างจากกรณีที่เลวร้ายที่สุด $O(n \log n).$

quicksort มักจะมีความต้องการเวลาที่เลวร้ายที่สุดกรณีที่แน่นอนของ )กรณีที่เลวร้ายที่สุดเกิดขึ้นเมื่อในทุกขั้นตอนขั้นตอนพาร์ทิชันแยกมีความยาวอาร์เรย์ลงในอาร์เรย์ขนาดและ 1การเลือกองค์ประกอบ "โชคร้าย" นี้ต้องใช้โทรซ้ำเพื่อนำไปสู่กรณีที่เลวร้ายที่สุด $O(n^2)$ $n$ $1$ $n-1$ $O(n)$ $O(n^2)$

การเลือก pivot การสุ่มแบบสุ่มหรือการสับแบบอาเรย์ก่อนการเรียงมีผลกระทบของการเรนเดอร์ตัวพิมพ์เล็กที่สุดที่ไม่น่าเป็นไปได้โดยเฉพาะอย่างยิ่งสำหรับอาร์เรย์ขนาดใหญ่ ดูวิกิพีเดียเพื่อพิสูจน์ว่าที่คาดว่าต้องการเวลา )แหล่งอ้างอิงอื่นกล่าวว่า "ความน่าจะเป็นที่ quicksort จะใช้การเปรียบเทียบเป็นกำลังสองเมื่อเรียงลำดับอาร์เรย์ขนาดใหญ่บนคอมพิวเตอร์ของคุณน้อยกว่าความน่าจะเป็นที่คอมพิวเตอร์ของคุณจะถูกฟ้าผ่า" $O(n\log n)$

แก้ไข:

ตามความคิดเห็นของ Bangye คุณสามารถกำจัดลำดับการเลือกเดือยที่แย่ที่สุดโดยเลือกองค์ประกอบค่ามัธยฐานเป็นเดือย เนื่องจากการหาค่ามัธยฐานนั้นใช้เวลาสิ่งนี้จะทำให้ประสิทธิภาพของกรณีที่แย่ที่สุดอย่างไรก็ตามเนื่องจาก quicksort แบบสุ่มไม่น่าจะสะดุดกับกรณีที่เลวร้ายที่สุดดังนั้นตัวแปร Quicksort แบบหาค่ามัธยฐานที่กำหนดได้ของไม่ค่อยมีการใช้บ่อยนัก $O(n)$ $\Theta(n \log n)$

— เจมส์อีแวนส์
แหล่งที่มา

ดังนั้นโดยทั่วไปเราสามารถพูดได้ว่ามันทำงานเป็นกำลังสองในกรณีที่เลวร้ายที่สุด

— Atinesh

@Atinesh ไม่อย่างน้อยถ้าคุณหมายถึง

โดยที่

Θ

$\Theta$

— กราฟิลส์

ฉันคิดว่ามันถูกต้องที่จะบอกว่าประสิทธิภาพการทำงานที่เลวร้ายที่สุดกรณีของ quicksort สุ่มคือ

O (n^{2}) .

$O(n^2).$

— James Evans

4

Quicksort อาจใช้เวลาเพียง

ในกรณีที่แย่ที่สุดหากมีขั้นตอนวิธีเชิงเส้นตรงเพื่อค้นหาค่ามัธยฐานเป็นเดือย แน่นอน quicksort แบบสุ่มมีประสิทธิภาพที่ดีกว่าปกติ

Θ (n \log n)

$\Theta(n\log n)$

— Bangye

6

คุณพลาดที่ข้อความเหล่านี้พูดถึง " เวลาที่คาดว่าจะเกิดกรณีเลวร้ายที่สุด" ไม่ใช่ "รันไทม์กรณีที่แย่ที่สุด"

พวกเขากำลังพูดถึงการใช้งาน Quicksort ที่เกี่ยวข้องกับองค์ประกอบแบบสุ่ม โดยปกติคุณมีอัลกอริทึมแบบกำหนดค่าได้ซึ่งเป็นอัลกอริทึมที่อินพุตที่กำหนดจะสร้างขั้นตอนเดียวกันเสมอ ในการพิจารณา "runtime case ที่แย่ที่สุด" คุณจะตรวจสอบอินพุตที่เป็นไปได้ทั้งหมดและเลือกอินพุตที่สร้าง runtime ที่แย่ที่สุด

แต่ที่นี่เรามีปัจจัยสุ่ม เมื่อป้อนข้อมูลแล้วอัลกอริทึมจะไม่ทำตามขั้นตอนเดียวกันเสมอเนื่องจากมีการสุ่มเลือกบางส่วน แทนที่จะมีรันไทม์สำหรับแต่ละอินพุตคงที่เรามี "รันไทม์ที่คาดหวัง" - เราตรวจสอบแต่ละค่าที่เป็นไปได้ของการตัดสินใจแบบสุ่มและความน่าจะเป็นของพวกเขาและ "รันไทม์ที่คาดหวัง" เป็นค่าเฉลี่ยถ่วงน้ำหนักของรันไทม์ แต่ยังคงเป็นอินพุตที่แน่นอน

ดังนั้นเราจึงคำนวณ "runtime ที่คาดไว้" สำหรับแต่ละอินพุตที่เป็นไปได้และเพื่อให้ได้ "runtime case ที่แย่ที่สุดที่คาดหวัง" เราจะค้นหาอินพุตที่เป็นไปได้หนึ่งตำแหน่ง และเห็นได้ชัดว่าพวกเขาแสดงให้เห็นว่ากรณีที่เลวร้ายที่สุดสำหรับ "รันไทม์ที่คาดหวัง" เป็นเพียง O (n log n) ฉันจะไม่แปลกใจถ้าเพียงแค่เลือกเดือยแรกที่สุ่มจะเปลี่ยนกรณีที่เลวร้ายที่สุดที่คาดว่าจะรันไทม์เป็น o (n ^ 2) (เล็ก ๆ น้อย ๆ แทน Big O) เพราะเพียงไม่กี่ pivots จะนำไปสู่กรณีที่เลวร้ายที่สุด พฤติกรรม.

— gnasher729
แหล่งที่มา

2

โปรดทราบว่ามีสองสิ่งที่จะคาดหวัง / เฉลี่ยมากกว่า: การเปลี่ยนแปลงอินพุตและ pivots (หนึ่งรายการต่อการแบ่งพาร์ติชัน)

สำหรับปัจจัยการผลิตบางส่วนและการใช้งานของ Quicksort ทั้งหมด pivots ที่ไม่ดี ( เท่าของจำนวนเดียวกันบางครั้งทำงาน) เพื่อให้สุ่มไม่ได้ช่วย ในกรณีเช่นนี้เวลาที่คาดหวัง (ค่าเฉลี่ยของตัวเลือกเดือย) สามารถเป็นกำลังสองในกรณีที่เลวร้ายที่สุด (อินพุตที่ไม่ดี) อย่างไรก็ตามเวลาที่คาดหวัง "โดยรวม" (ค่าเฉลี่ยของทั้งอินพุตและตัวเลือกเดือย) ยังคงเป็นสำหรับการใช้งานที่เหมาะสม $n$ $\Theta(n \log n)$

การใช้งานอื่น ๆ มี runtime-case ที่แย่ที่สุดที่เป็นจริงใน $\Theta(n \log n)$

บรรทัดล่างตรวจสอบแหล่งที่มาของคุณว่ามีการนำไปใช้งานใดและปริมาณใดที่พวกเขาพิจารณาถึงการตอบสนองแบบสุ่ม คงที่ในการวิเคราะห์ของพวกเขา

— กราฟิลส์
แหล่งที่มา

ลองพิจารณาคำถามนี้ postimg.org/image/fiurc4z87ที่ฉันถามในการสอบ คำตอบที่เหมาะสมที่คุณจะแนะนำฉันคิดว่า (c)

— Atinesh

1

@Atinesh ฉันคิดว่าคำตอบของฉันให้ข้อมูลเพียงพอกับคุณ

— กราฟิลส์

-1

$O(n^2)$

กรณีที่เลวร้ายที่สุดสำหรับ quicksort แบบสุ่มคือองค์ประกอบเดียวกับอินพุต เช่น 2,2,2,2,2,2

$T(n) = T(n-1) + n$ $O(n^2)$

— pratyay
แหล่งที่มา

นั่นคือถ้าคุณมีการดำเนินการอย่างรวดเร็วเกินความเป็นจริง การนำไปปฏิบัติที่เหมาะสมจะเกิดขึ้นในการแลกเปลี่ยนพาร์ติชั่นแรก # 1 และ # 6, # 2 และ # 5, # 3 และ # 4 และจากนั้นจะเรียงลำดับสอง subarrays ที่มีความยาว 3

— gnasher729

ฉันเดาว่าคุณมี <= เช่นเดียวกับ> = ทั้งตัวชี้ที่สแกนจาก LHS และ RHS นั่นเป็นเหตุผลที่คุณพูดอย่างนั้น '=' เชื่อมโยงกับพอยน์เตอร์ตัวใดตัวหนึ่งไม่ใช่ทั้งคู่ ในกรณีนั้นทรีเรียกซ้ำจะเติบโตจนถึง n

— pratyay

และนั่นคือสิ่งที่ฉันเรียกว่าการนำไปปฏิบัติอย่างบ้าคลั่ง การใช้งานใด ๆ ที่ใช้รันไทม์กำลังสองสำหรับกรณี "องค์ประกอบทั้งหมดเท่ากัน" นั้นเป็นอาชญากรที่โง่ มีการใช้งานจริงที่ใช้เวลาเชิงเส้นในกรณีนี้ (O (n) ไม่ใช่ O (n log n))

— gnasher729