การเรียงลำดับรายการแบบไม่คำนึงถึงตัวพิมพ์เล็กและใหญ่โดยไม่ลดขนาดผลลัพธ์?


135

ฉันมีรายการสตริงดังนี้:

['Aden', 'abel']

ฉันต้องการจัดเรียงรายการโดยไม่คำนึงถึงตัวพิมพ์เล็กและใหญ่ ดังนั้นฉันต้องการรับ:

['abel', 'Aden']

แต่ฉันกลับตรงกันข้ามกับsorted()หรือlist.sort()เพราะตัวพิมพ์ใหญ่ปรากฏก่อนตัวพิมพ์เล็ก

จะเพิกเฉยต่อคดีได้อย่างไร? ฉันเคยเห็นวิธีแก้ปัญหาที่เกี่ยวข้องกับการลดขนาดรายการทั้งหมด แต่ฉันไม่ต้องการเปลี่ยนกรณีของรายการ


บทช่วยสอนนี้มีประโยชน์มาก: docs.python.org/3/howto/sorting.html#sortinghowto
ady

คำตอบ:


195

ใน Python 3.3+ มีstr.casefoldวิธีการที่ออกแบบมาโดยเฉพาะสำหรับการจับคู่แบบไม่มีตัวพิมพ์:

sorted_list = sorted(unsorted_list, key=str.casefold)

ใน Python 2 ใช้lower():

sorted_list = sorted(unsorted_list, key=lambda s: s.lower())

ใช้ได้กับทั้งสตริงปกติและสตริงยูนิโคดเนื่องจากทั้งสองมีlowerวิธีการ

ใน Python 2 ใช้งานร่วมกันระหว่างสตริงปกติและสตริง Unicode เนื่องจากค่าของทั้งสองประเภทสามารถเปรียบเทียบกันได้ Python 3 ไม่ทำงานเช่นนั้น: คุณไม่สามารถเปรียบเทียบสตริงไบต์กับสตริงยูนิโคดได้ดังนั้นใน Python 3 คุณควรทำสิ่งที่มีเหตุผลและจัดเรียงรายการสตริงประเภทเดียวเท่านั้น

>>> lst = ['Aden', u'abe1']
>>> sorted(lst)
['Aden', u'abe1']
>>> sorted(lst, key=lambda s: s.lower())
[u'abe1', 'Aden']

11
หนึ่งสามารถหลีกเลี่ยงการบินฟังก์ชั่นแลมบ์ดาโดย(งูใหญ่ 3)ใช้ทั่วไปstr.lowerฟังก์ชั่นเป็นsorted(lst, key=str.lower)หรือ(งูหลาม 2)โดยใช้lowerวิธีการของstringโมดูลsorted(lst, key=string.lower)เป็น นอกจากนี้ยังสามารถใช้str.lowerสำหรับสตริงใน Python 2 แต่จะต้องใช้unicode.lowerสำหรับunicodeอ็อบเจ็กต์ในขณะที่string.lowerยอมรับทั้งสองอย่าง (ซึ่งตามที่คุณวางไว้อาจไม่ใช่โหมดการทำงานที่ "มีเหตุผล" จริงๆ)
Daniel Andersson

ซึ่งจะใช้ไม่ได้กับรายการเช่น ['Z', 'B', 'a', 'b', 'A'] ซึ่งเรียงลำดับเป็น ['a', 'A', 'B', 'b', 'Z'] ตัวพิมพ์ใหญ่ 'B' ปรากฏก่อนตัวพิมพ์เล็ก 'b' เนื่องจากการเรียงลำดับของ Python () และ sorted () รักษาลำดับเดิมเมื่อสตริงตรงกัน ในกรณีนี้ทุน 'B' จะถือว่าตรงกับตัวพิมพ์เล็ก 'b' เมื่อใช้ casefold สิ่งนี้จะเกิดขึ้นเสมอหากคุณแปลง case เพื่อเปรียบเทียบ: sorted (spam, key = str.lower) หรือ sorted (spam, key = str.upper) หรือ sorted (spam, key = str.casefold)
PJ Singh

พยายามแก้ปัญหานี้แทน: stackoverflow.com/a/1098160/10668287 มันจะจัดเรียง ['Aden', 'aden'] ให้ถูกต้องเป็น ['aden', 'Aden']
PJ Singh

46
>>> x = ['Aden', 'abel']
>>> sorted(x, key=str.lower) # Or unicode.lower if all items are unicode
['abel', 'Aden']

ใน Python 3 strเป็น Unicode แต่ใน Python 2 คุณสามารถใช้วิธีการทั่วไปที่ใช้ได้กับทั้งสองอย่างstrและunicode:

>>> sorted(x, key=lambda s: s.lower())
['abel', 'Aden']

ขอบคุณ. ฉันรู้ว่าฉันควรจะพูดถึงสิ่งนี้มาก่อน แต่ฉันได้ยินมาว่ามีปัญหาในการใช้วิธีนี้กับสตริงยูนิโคด (Py2) คุณรู้อะไรเกี่ยวกับเรื่องนี้หรือไม่?

พวกเขาทั้งหมดเป็น Unicode ขอบคุณ! อีกหนึ่งคำถามวิธีทำในรายการเช่นนี้:[['Aden'], ['abel']]

แต่ละรายการมีเพียงรายการเดียวหรือไม่? หากเป็นเช่นนั้นให้ปรับเปลี่ยนเล็กน้อยเป็น:sorted(x,key=lambda i:i[0].lower())
jamylak

มันอาจมีของอย่างอื่นด้วยซึ่งไม่ควรใช้ในการจัดเรียง

1
ไม่เป็นไรดูเหมือนว่าฉันผิดการเรียงลำดับใช้งานได้กับทั้งสตริงและยูนิโค้ดฉันสับสนกับคำถามก่อนหน้าซึ่งรวมสิ่งที่รวมอยู่ในการจัดเรียงด้วย
jamylak

10

คุณยังสามารถลองวิธีนี้เพื่อจัดเรียงรายการในตำแหน่ง:

>>> x = ['Aden', 'abel']
>>> x.sort(key=lambda y: y.lower())
>>> x
['abel', 'Aden']



1

ฉันทำแบบนี้สำหรับ Python 3.3:

 def sortCaseIns(lst):
    lst2 = [[x for x in range(0, 2)] for y in range(0, len(lst))]
    for i in range(0, len(lst)):
        lst2[i][0] = lst[i].lower()
        lst2[i][1] = lst[i]
    lst2.sort()
    for i in range(0, len(lst)):
        lst[i] = lst2[i][1]

จากนั้นคุณก็สามารถเรียกใช้ฟังก์ชันนี้:

sortCaseIns(yourListToSort)

0

การจัดเรียงแบบไม่คำนึงถึงตัวพิมพ์เล็กและใหญ่การเรียงลำดับสตริงใน Python 2 หรือ 3 (ทดสอบใน Python 2.7.17 และ Python 3.6.9):

>>> x = ["aa", "A", "bb", "B", "cc", "C"]
>>> x.sort()
>>> x
['A', 'B', 'C', 'aa', 'bb', 'cc']
>>> x.sort(key=str.lower)           # <===== there it is!
>>> x
['A', 'aa', 'B', 'bb', 'C', 'cc']

ที่สำคัญคือkey=str.lower. คำสั่งเหล่านี้มีลักษณะเป็นเพียงคำสั่งเพื่อให้คัดลอกวางได้ง่ายเพื่อให้คุณสามารถทดสอบได้:

x = ["aa", "A", "bb", "B", "cc", "C"]
x.sort()
x
x.sort(key=str.lower)
x

โปรดทราบว่าหากสตริงของคุณเป็นสตริง Unicode อย่างไรก็ตาม (เช่นu'some string') ดังนั้นใน Python 2 เท่านั้น (ไม่ใช่ใน Python 3 ในกรณีนี้) x.sort(key=str.lower)คำสั่งด้านบนจะล้มเหลวและแสดงข้อผิดพลาดต่อไปนี้:

TypeError: descriptor 'lower' requires a 'str' object but received a 'unicode'

หากคุณได้รับข้อผิดพลาดนี้ให้อัปเกรดเป็น Python 3 ซึ่งจัดการการเรียงลำดับ Unicode หรือแปลงสตริง Unicode ของคุณเป็นสตริง ASCII ก่อนโดยใช้การทำความเข้าใจรายการดังนี้:

# for Python2, ensure all elements are ASCII (NOT unicode) strings first
x = [str(element) for element in x]  
# for Python2, this sort will only work on ASCII (NOT unicode) strings
x.sort(key=str.lower)

อ้างอิง:

  1. https://docs.python.org/3/library/stdtypes.html#list.sort
  2. แปลงสตริง Unicode เป็นสตริงใน Python (มีสัญลักษณ์พิเศษ)
  3. https://www.programiz.com/python-programming/list-comprehension

-3

ลองทำตามนี้

def cSort(inlist, minisort=True):
    sortlist = []
    newlist = []
    sortdict = {}
    for entry in inlist:
        try:
            lentry = entry.lower()
        except AttributeError:
            sortlist.append(lentry)
        else:
            try:
                sortdict[lentry].append(entry)
            except KeyError:
                sortdict[lentry] = [entry]
                sortlist.append(lentry)

    sortlist.sort()
    for entry in sortlist:
        try:
            thislist = sortdict[entry]
            if minisort: thislist.sort()
            newlist = newlist + thislist
        except KeyError:
            newlist.append(entry)
    return newlist

lst = ['Aden', 'abel']
print cSort(lst)

เอาท์พุต

['abel', 'Aden']


9
โซลูชันนี้ใช้งานมากเกินไปและไม่สามารถอ่านได้เมื่อมีซับเดียวเพียงพอ สิ่งนี้อาจเป็นที่ยอมรับในภาษาอื่นที่ไม่ใช่ Python
IceArdor
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.