ฉันจะใช้อะไรในการนำ max-heap ไปใช้ใน Python


คำตอบ:


243

วิธีที่ง่ายที่สุดคือการกลับค่าของคีย์และใช้ heapq ตัวอย่างเช่นเปลี่ยน 1,000.0 เป็น -1000.0 และ 5.0 เป็น -5.0


38
มันเป็นโซลูชันมาตรฐาน
Andrew McGregor

44
uggh; กากตะกอนรวม ฉันประหลาดใจheapqไม่ได้ให้สิ่งที่ตรงกันข้าม
shabbychef

40
ว้าว. ฉันประหลาดใจที่ไม่มีให้บริการheapqและไม่มีทางเลือกที่ดี
ire_and_curses

23
@gatoatigrado: หากคุณมีบางอย่างที่ไม่ง่ายในการจับคู่กับint/ floatคุณสามารถสลับการสั่งซื้อโดยห่อพวกมันในชั้นเรียนด้วยตัว__lt__ดำเนินการคว่ำ
Daniel Stutzbach

5
@Aerovistae ใช้คำแนะนำเดียวกัน: กลับค่า (เช่นสลับเครื่องหมาย) โดยไม่คำนึงว่าจะเริ่มต้นด้วยค่าบวกหรือค่าลบ
Dennis

234

คุณสามารถใช้ได้

import heapq
listForTree = [1,2,3,4,5,6,7,8,9,10,11,12,13,14,15]    
heapq.heapify(listForTree)             # for a min heap
heapq._heapify_max(listForTree)        # for a maxheap!!

ถ้าคุณต้องการที่จะปรากฏองค์ประกอบให้ใช้:

heapq.heappop(minheap)      # pop from minheap
heapq._heappop_max(maxheap) # pop from maxheap

34
ดูเหมือนว่ามีบางฟังก์ชั่นที่ไม่มีเอกสารสำหรับกองสูงสุด: _heapify_max, _heappushpop_max, และ_siftdown_max _siftup_max
ziyuang

127
ว้าว. ฉันประหลาดใจว่ามีISเช่นตัวในการแก้ปัญหาใน heapq แต่ก็ไม่มีเหตุผลทั้งหมดที่ไม่ได้กล่าวถึงเพียงเล็กน้อยในเอกสารทางการ! WTF!
RayLuo

27
ฟังก์ชันป๊อป / พุชใด ๆ ทำลายโครงสร้างสูงสุดของฮีปดังนั้นวิธีนี้จึงไม่สามารถทำได้
Siddhartha

22
อย่าใช้มัน ในขณะที่ LinMa และ Siddhartha สังเกตเห็นว่าการกด / ป๊อปแตกลำดับ
Alex Fedulov

13
วิธีการเริ่มต้นด้วยการขีดเส้นใต้เป็นส่วนตัวและสามารถถอดออกได้โดยไม่ต้องแจ้งให้ทราบล่วงหน้า อย่าใช้พวกเขา
user4815162342

66

วิธีแก้คือลบล้างค่าของคุณเมื่อคุณเก็บไว้ในกองหรือกลับการเปรียบเทียบวัตถุของคุณเช่น:

import heapq

class MaxHeapObj(object):
  def __init__(self, val): self.val = val
  def __lt__(self, other): return self.val > other.val
  def __eq__(self, other): return self.val == other.val
  def __str__(self): return str(self.val)

ตัวอย่างของ max-heap:

maxh = []
heapq.heappush(maxh, MaxHeapObj(x))
x = maxh[0].val  # fetch max value
x = heapq.heappop(maxh).val  # pop max value

แต่คุณต้องจำไว้ว่าให้ห่อและแกะค่าของคุณซึ่งต้องรู้ว่าคุณกำลังทำอะไรอยู่หรือไม่

MinHeap, คลาส MaxHeap

การเพิ่มคลาสMinHeapและMaxHeapวัตถุสามารถทำให้รหัสของคุณง่ายขึ้น:

class MinHeap(object):
  def __init__(self): self.h = []
  def heappush(self, x): heapq.heappush(self.h, x)
  def heappop(self): return heapq.heappop(self.h)
  def __getitem__(self, i): return self.h[i]
  def __len__(self): return len(self.h)

class MaxHeap(MinHeap):
  def heappush(self, x): heapq.heappush(self.h, MaxHeapObj(x))
  def heappop(self): return heapq.heappop(self.h).val
  def __getitem__(self, i): return self.h[i].val

ตัวอย่างการใช้งาน:

minh = MinHeap()
maxh = MaxHeap()
# add some values
minh.heappush(12)
maxh.heappush(12)
minh.heappush(4)
maxh.heappush(4)
# fetch "top" values
print(minh[0], maxh[0])  # "4 12"
# fetch and remove "top" values
print(minh.heappop(), maxh.heappop())  # "4 12"

ดี ฉันได้ดำเนินการนี้และเพิ่มlistพารามิเตอร์ที่ไม่จำเป็นลงใน __init__ ในกรณีที่ฉันโทรheapq.heapifyและยังเพิ่มheapreplaceวิธีการ
Booboo

1
แปลกใจที่ไม่มีใครจับตัวพิมพ์นี้: MaxHeapInt -> MaxHeapObj มิฉะนั้นทางออกที่สะอาดมากแน่นอน
Chiraz BenAbdelkader

@ChirazBenAbdelkader คงที่ขอบคุณ
Isaac Turner

39

ทางออกที่ง่ายและเหมาะที่สุด

คูณค่าด้วย -1

ไปแล้ว ตัวเลขที่สูงที่สุดทั้งหมดอยู่ในระดับต่ำสุดและในทางกลับกัน

เพียงจำไว้ว่าเมื่อคุณเปิดองค์ประกอบเพื่อคูณด้วย -1 เพื่อรับค่าเดิมอีกครั้ง


ยอดเยี่ยม แต่โซลูชันส่วนใหญ่สนับสนุนคลาส / ประเภทอื่น ๆ และจะไม่เปลี่ยนแปลงข้อมูลจริง คำถามที่เปิดอยู่คือถ้าค่าการคูณด้วย -1 จะไม่เปลี่ยนแปลง (ลอยอย่างแม่นยำมาก)
Alex Baranowski

1
@AlexBaranowski นั่นเป็นเรื่องจริง แต่ได้รับการตอบสนองจากผู้ดูแล: bugs.python.org/issue27295
Flair

ผู้ดูแลมีสิทธิ์ที่จะไม่ใช้ฟังก์ชันบางอย่าง แต่ IMO อันนี้มีประโยชน์จริง ๆ
Alex Baranowski

7

ฉันใช้ heapq รุ่นสูงสุดแล้วส่งไปยัง PyPI (การเปลี่ยนแปลงเล็กน้อยมากของรหัส CPython โมดูล heapq)

https://pypi.python.org/pypi/heapq_max/

https://github.com/he-zhe/heapq_max

การติดตั้ง

pip install heapq_max

การใช้

tl; dr: เหมือนกับโมดูล heapq ยกเว้นการเพิ่ม '_max' ให้กับทุกฟังก์ชั่น

heap_max = []                           # creates an empty heap
heappush_max(heap_max, item)            # pushes a new item on the heap
item = heappop_max(heap_max)            # pops the largest item from the heap
item = heap_max[0]                      # largest item on the heap without popping it
heapify_max(x)                          # transforms list into a heap, in-place, in linear time
item = heapreplace_max(heap_max, item)  # pops and returns largest item, and
                                    # adds new item; the heap size is unchanged

4

หากคุณกำลังแทรกคีย์ที่เปรียบเทียบ แต่ไม่เหมือน int คุณสามารถแทนที่โอเปอเรเตอร์การเปรียบเทียบกับมัน (เช่น <= กลายเป็น> และ> กลายเป็น <=) มิฉะนั้นคุณสามารถแทนที่ heapq._siftup ในโมดูล heapq (เป็นเพียงรหัส Python ในตอนท้าย)


9
“ มันเป็นเพียงรหัสงูหลาม”: ขึ้นอยู่กับเวอร์ชั่นและการติดตั้ง Python ของคุณ ตัวอย่างเช่น heapq.py ที่ติดตั้งไว้ของฉันมีรหัสบางส่วนหลังบรรทัด 309 ( # If available, use C implementation) ที่ทำสิ่งที่ความคิดเห็นอธิบาย
tzot

3

ช่วยให้คุณสามารถเลือกรายการที่ใหญ่ที่สุดหรือเล็กที่สุดได้ตามต้องการ

import heapq
heap = [23, 7, -4, 18, 23, 42, 37, 2, 8, 2, 23, 7, -4, 18, 23, 42, 37, 2]
heapq.heapify(heap)
print(heapq.nlargest(3, heap))  # [42, 42, 37]
print(heapq.nsmallest(3, heap)) # [-4, -4, 2]

3
คำอธิบายจะอยู่ในลำดับ
Peter Mortensen

ชื่อของฉันคือคำอธิบายของฉัน
jasonleonhard

1
คำตอบของฉันยาวกว่าคำถาม คุณต้องการเพิ่มคำอธิบายอะไร
jasonleonhard

wikipedia.org/wiki/Min-max_heapและdocs.python.org/3.0/library/heapq.htmlอาจช่วยได้เช่นกัน
jasonleonhard

2
สิ่งนี้ให้ผลลัพธ์ที่ถูกต้อง แต่ไม่ได้ใช้ฮีปเพื่อทำให้มีประสิทธิภาพ เอกสารระบุว่า nlargest และ nsmallest เรียงลำดับรายการในแต่ละครั้ง
RossFabricant

3

การขยายคลาส int และการเอาชนะ__lt__เป็นวิธีหนึ่ง

import queue
class MyInt(int):
    def __lt__(self, other):
        return self > other

def main():
    q = queue.PriorityQueue()
    q.put(MyInt(10))
    q.put(MyInt(5))
    q.put(MyInt(1))
    while not q.empty():
        print (q.get())


if __name__ == "__main__":
    main()

เป็นไปได้ แต่ฉันรู้สึกว่ามันจะช้าลงมากและใช้หน่วยความจำเพิ่มเติมมากมาย MyInt ไม่สามารถใช้ภายนอกโครงสร้างกองได้เช่นกัน แต่ขอบคุณสำหรับการพิมพ์ตัวอย่างมันน่าสนใจที่จะเห็น
Leo Ufimtsev

ฮะ! วันหนึ่งหลังจากที่ฉันแสดงความคิดเห็นฉันวิ่งเข้าไปในสถานการณ์ที่ฉันจำเป็นต้องใส่วัตถุที่กำหนดเองลงในกองและต้องการกองสูงสุด ฉันจริง googled โพสต์นี้อีกครั้งและพบคำตอบของคุณและตามโซลูชันของฉันออกจากมัน (วัตถุที่กำหนดเองเป็นจุดที่มี x, y และพิกัดltแทนที่ระยะทางจากจุดศูนย์กลาง) ขอบคุณสำหรับการโพสต์นี้ฉัน upvoted!
Leo Ufimtsev

1

ฉันได้สร้าง wrapper heap ที่แปลงค่าเพื่อสร้าง max-heap รวมถึงคลาส wrapper สำหรับ min-heap เพื่อทำให้ไลบรารี่เป็นเหมือน OOP นี่คือส่วนสำคัญ มีสามชั้น; ฮีป (คลาสนามธรรม), HeapMin และ HeapMax

วิธีการ:

isempty() -> bool; obvious
getroot() -> int; returns min/max
push() -> None; equivalent to heapq.heappush
pop() -> int; equivalent to heapq.heappop
view_min()/view_max() -> int; alias for getroot()
pushpop() -> int; equivalent to heapq.pushpop

0

ในกรณีที่คุณต้องการได้องค์ประกอบ K ที่ใหญ่ที่สุดโดยใช้ max heap คุณสามารถทำตามเคล็ดลับต่อไปนี้:

nums= [3,2,1,5,6,4]
k = 2  #k being the kth largest element you want to get
heapq.heapify(nums) 
temp = heapq.nlargest(k, nums)
return temp[-1]

1
น่าเสียดายที่ความซับซ้อนของเวลาสำหรับเรื่องนี้คือ O (MlogM) โดยที่ M = len (จำนวน) ซึ่งเอาชนะวัตถุประสงค์ของ heapq ดูการนำไปใช้และความคิดเห็นได้nlargestที่นี่ -> github.com/python/cpython/blob/…
Arthur S

1
ขอบคุณสำหรับความคิดเห็นข้อมูลของคุณจะให้แน่ใจว่าได้ตรวจสอบลิงค์ที่แนบมา
RowanX

0

ติดตามคำตอบที่ยอดเยี่ยมของ Isaac Turner ฉันต้องการยกตัวอย่างจากคะแนน K ที่ใกล้เคียงที่สุดกับ Originโดยใช้ heap สูงสุด

from math import sqrt
import heapq


class MaxHeapObj(object):
    def __init__(self, val):
        self.val = val.distance
        self.coordinates = val.coordinates

    def __lt__(self, other):
        return self.val > other.val

    def __eq__(self, other):
        return self.val == other.val

    def __str__(self):
        return str(self.val)


class MinHeap(object):
    def __init__(self):
        self.h = []

    def heappush(self, x):
        heapq.heappush(self.h, x)

    def heappop(self):
        return heapq.heappop(self.h)

    def __getitem__(self, i):
        return self.h[i]

    def __len__(self):
        return len(self.h)


class MaxHeap(MinHeap):
    def heappush(self, x):
        heapq.heappush(self.h, MaxHeapObj(x))

    def heappop(self):
        return heapq.heappop(self.h).val

    def peek(self):
        return heapq.nsmallest(1, self.h)[0].val

    def __getitem__(self, i):
        return self.h[i].val


class Point():
    def __init__(self, x, y):
        self.distance = round(sqrt(x**2 + y**2), 3)
        self.coordinates = (x, y)


def find_k_closest(points, k):
    res = [Point(x, y) for (x, y) in points]
    maxh = MaxHeap()

    for i in range(k):
        maxh.heappush(res[i])

    for p in res[k:]:
        if p.distance < maxh.peek():
            maxh.heappop()
            maxh.heappush(p)

    res = [str(x.coordinates) for x in maxh.h]
    print(f"{k} closest points from origin : {', '.join(res)}")


points = [(10, 8), (-2, 4), (0, -2), (-1, 0), (3, 5), (-2, 3), (3, 2), (0, 1)]
find_k_closest(points, 3)

0

หากต้องการอธิบายอย่างละเอียดเกี่ยวกับhttps://stackoverflow.com/a/59311063/1328979ที่นี่มีการจัดทำเอกสารประกอบคำอธิบายประกอบและการทดสอบ Python 3 สำหรับเอกสารทั่วไป

from __future__ import annotations  # To allow "MinHeap.push -> MinHeap:"
from typing import Generic, List, Optional, TypeVar
from heapq import heapify, heappop, heappush, heapreplace


T = TypeVar('T')


class MinHeap(Generic[T]):
    '''
    MinHeap provides a nicer API around heapq's functionality.
    As it is a minimum heap, the first element of the heap is always the
    smallest.
    >>> h = MinHeap([3, 1, 4, 2])
    >>> h[0]
    1
    >>> h.peek()
    1
    >>> h.push(5)  # N.B.: the array isn't always fully sorted.
    [1, 2, 4, 3, 5]
    >>> h.pop()
    1
    >>> h.pop()
    2
    >>> h.pop()
    3
    >>> h.push(3).push(2)
    [2, 3, 4, 5]
    >>> h.replace(1)
    2
    >>> h
    [1, 3, 4, 5]
    '''
    def __init__(self, array: Optional[List[T]] = None):
        if array is None:
            array = []
        heapify(array)
        self.h = array
    def push(self, x: T) -> MinHeap:
        heappush(self.h, x)
        return self  # To allow chaining operations.
    def peek(self) -> T:
        return self.h[0]
    def pop(self) -> T:
        return heappop(self.h)
    def replace(self, x: T) -> T:
        return heapreplace(self.h, x)
    def __getitem__(self, i) -> T:
        return self.h[i]
    def __len__(self) -> int:
        return len(self.h)
    def __str__(self) -> str:
        return str(self.h)
    def __repr__(self) -> str:
        return str(self.h)


class Reverse(Generic[T]):
    '''
    Wrap around the provided object, reversing the comparison operators.
    >>> 1 < 2
    True
    >>> Reverse(1) < Reverse(2)
    False
    >>> Reverse(2) < Reverse(1)
    True
    >>> Reverse(1) <= Reverse(2)
    False
    >>> Reverse(2) <= Reverse(1)
    True
    >>> Reverse(2) <= Reverse(2)
    True
    >>> Reverse(1) == Reverse(1)
    True
    >>> Reverse(2) > Reverse(1)
    False
    >>> Reverse(1) > Reverse(2)
    True
    >>> Reverse(2) >= Reverse(1)
    False
    >>> Reverse(1) >= Reverse(2)
    True
    >>> Reverse(1)
    1
    '''
    def __init__(self, x: T) -> None:
        self.x = x
    def __lt__(self, other: Reverse) -> bool:
        return other.x.__lt__(self.x)
    def __le__(self, other: Reverse) -> bool:
        return other.x.__le__(self.x)
    def __eq__(self, other) -> bool:
        return self.x == other.x
    def __ne__(self, other: Reverse) -> bool:
        return other.x.__ne__(self.x)
    def __ge__(self, other: Reverse) -> bool:
        return other.x.__ge__(self.x)
    def __gt__(self, other: Reverse) -> bool:
        return other.x.__gt__(self.x)
    def __str__(self):
        return str(self.x)
    def __repr__(self):
        return str(self.x)


class MaxHeap(MinHeap):
    '''
    MaxHeap provides an implement of a maximum-heap, as heapq does not provide
    it. As it is a maximum heap, the first element of the heap is always the
    largest. It achieves this by wrapping around elements with Reverse,
    which reverses the comparison operations used by heapq.
    >>> h = MaxHeap([3, 1, 4, 2])
    >>> h[0]
    4
    >>> h.peek()
    4
    >>> h.push(5)  # N.B.: the array isn't always fully sorted.
    [5, 4, 3, 1, 2]
    >>> h.pop()
    5
    >>> h.pop()
    4
    >>> h.pop()
    3
    >>> h.pop()
    2
    >>> h.push(3).push(2).push(4)
    [4, 3, 2, 1]
    >>> h.replace(1)
    4
    >>> h
    [3, 1, 2, 1]
    '''
    def __init__(self, array: Optional[List[T]] = None):
        if array is not None:
            array = [Reverse(x) for x in array]  # Wrap with Reverse.
        super().__init__(array)
    def push(self, x: T) -> MaxHeap:
        super().push(Reverse(x))
        return self
    def peek(self) -> T:
        return super().peek().x
    def pop(self) -> T:
        return super().pop().x
    def replace(self, x: T) -> T:
        return super().replace(Reverse(x)).x


if __name__ == '__main__':
    import doctest
    doctest.testmod()

https://gist.github.com/marccarre/577a55850998da02af3d4b7b98152cf4


0

นี้เป็นที่เรียบง่ายการดำเนินการบนพื้นฐานของMaxHeap heapqแม้ว่ามันจะใช้ได้เฉพาะกับค่าตัวเลข

import heapq
from typing import List


class MaxHeap:
    def __init__(self):
        self.data = []

    def top(self):
        return -self.data[0]

    def push(self, val):
        heapq.heappush(self.data, -val)

    def pop(self):
        return -heapq.heappop(self.data)

การใช้งาน:

max_heap = MaxHeap()
max_heap.push(3)
max_heap.push(5)
max_heap.push(1)
print(max_heap.top())  # 5
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.