กรณีตายแทน

173

วิธีที่ง่ายที่สุดในการเปลี่ยนสตริงตัวพิมพ์เล็กและใหญ่ใน Python คืออะไร?

python string case-insensitive

217

stringประเภทไม่สนับสนุนเรื่องนี้ คุณน่าจะดีที่สุดโดยใช้วิธีการย่อยนิพจน์ปกติด้วยตัวเลือกre.IGNORECASE

>>> import re
>>> insensitive_hippo = re.compile(re.escape('hippo'), re.IGNORECASE)
>>> insensitive_hippo.sub('giraffe', 'I want a hIPpo for my birthday')
'I want a giraffe for my birthday'

— แบลร์คอนราด
แหล่งที่มา

11

หากคุณทำการแทนที่เพียงครั้งเดียวหรือต้องการบันทึกบรรทัดโค้ดมันจะมีประสิทธิภาพมากกว่าในการใช้การแทนที่แบบเดี่ยวด้วย re.sub และการตั้งค่าสถานะ (? i): re.sub ('(? i)' + re .escape ('hippo'), 'giraffe', 'ฉันต้องการ hIPpo สำหรับวันเกิดของฉัน')

— D Coetzee

3

ทำไมต้องรีสเคปสำหรับเฉพาะตัวอักษร? ขอบคุณ

— Elena

8

@Elena ไม่จำเป็นสำหรับ'hippo'แต่จะมีประโยชน์หากค่า to-replace ถูกส่งผ่านไปยังฟังก์ชันดังนั้นจึงเป็นตัวอย่างที่ดีกว่าสิ่งอื่น

— แบลร์คอนราด

2

นอกจากre.escapeเข็มของคุณแล้วยังมีกับดักอื่นที่นี่ซึ่งคำตอบนี้ไม่สามารถหลีกเลี่ยงได้ซึ่งตั้งข้อสังเกตไว้ในstackoverflow.com/a/15831118/1709587 : เนื่องจากre.subกระบวนการลำดับวนตามที่ระบุไว้ในdocs.python.org/library/re.html#re .subคุณจะต้องหลีกเลี่ยงแบ็กสแลชทั้งหมดในสตริงการแทนที่ของคุณหรือใช้แลมบ์ดา

— Mark Amery

84

import re
pattern = re.compile("hello", re.IGNORECASE)
pattern.sub("bye", "hello HeLLo HELLO")
# 'bye bye bye'

— ไม่ทราบ
แหล่งที่มา

17

หรือสายการบินre.sub('hello', 'bye', 'hello HeLLo HELLO', flags=re.IGNORECASE)

— หลุยส์หยาง

โปรดทราบว่าre.subรองรับเฉพาะการตั้งค่าสถานะนี้ตั้งแต่ Python 2.7

— fuenfundachtzig

47

ในบรรทัดเดียว:

import re
re.sub("(?i)hello","bye", "hello HeLLo HELLO") #'bye bye bye'
re.sub("(?i)he\.llo","bye", "he.llo He.LLo HE.LLO") #'bye bye bye'

หรือใช้อาร์กิวเมนต์ "ค่าสถานะ" ที่เป็นตัวเลือก:

import re
re.sub("hello", "bye", "hello HeLLo HELLO", flags=re.I) #'bye bye bye'
re.sub("he\.llo", "bye", "he.llo He.LLo HE.LLO", flags=re.I) #'bye bye bye'

— viebel
แหล่งที่มา

14

ต่อไปกับคำตอบของ bFloch ฟังก์ชั่นนี้จะไม่เปลี่ยนไป แต่อย่างใดอย่างหนึ่ง แต่สิ่งเก่าที่เกิดขึ้นใหม่ทั้งหมด - ในกรณีที่ไม่รู้สึกตัว

def ireplace(old, new, text):
    idx = 0
    while idx < len(text):
        index_l = text.lower().find(old.lower(), idx)
        if index_l == -1:
            return text
        text = text[:index_l] + new + text[index_l + len(old):]
        idx = index_l + len(new) 
    return text

— rsmoorthy
แหล่งที่มา

ทำได้ดีมาก ดีกว่า regex มันจัดการกับตัวละครทุกชนิดในขณะที่ regex ยุ่งมากเกี่ยวกับสิ่งที่ไม่ใช่ตัวอักษรและตัวเลข IMHO คำตอบที่ต้องการ

— fyngyrz

สิ่งที่คุณต้องทำคือหลบหนี regex คำตอบที่ยอมรับนั้นสั้นกว่าและอ่านง่ายกว่านี้มาก

— นักฟิสิกส์บ้า

Escape ใช้งานได้สำหรับการจับคู่เท่านั้นแบ็กสแลชในปลายทางสามารถทำสิ่งต่างๆ

— ideasman42

4

เช่นเดียวกับแบลร์คอนราดกล่าวว่า string.replace ไม่สนับสนุนสิ่งนี้

ใช้ regex re.subแต่โปรดจำไว้ว่าให้หลีกเลี่ยงสตริงแทนที่ก่อน โปรดทราบว่าไม่มีตัวเลือกการตั้งค่าสถานะใน 2.6 สำหรับre.subดังนั้นคุณจะต้องใช้ตัวดัดแปลงที่ฝังตัว'(?i)'(หรือวัตถุ RE ดูที่คำตอบของ Blair Conrad) นอกจากนี้ข้อผิดพลาดอีกอย่างคือย่อยจะประมวลผลแบ็กสแลชในข้อความแทนที่หากมีการกำหนดสตริง เพื่อหลีกเลี่ยงสิ่งนี้สามารถส่งผ่านแลมบ์ดาแทน

นี่คือฟังก์ชั่น:

import re
def ireplace(old, repl, text):
    return re.sub('(?i)'+re.escape(old), lambda m: repl, text)

>>> ireplace('hippo?', 'giraffe!?', 'You want a hiPPO?')
'You want a giraffe!?'
>>> ireplace(r'[binfolder]', r'C:\Temp\bin', r'[BinFolder]\test.exe')
'C:\\Temp\\bin\\test.exe'

— johv
แหล่งที่มา

4

ฟังก์ชั่นนี้ใช้ทั้งstr.replace()และre.findall()ฟังก์ชั่น มันจะแทนที่การเกิดขึ้นทั้งหมดของpatternในstringด้วยreplในกรณีที่ไม่สำคัญ

def replace_all(pattern, repl, string) -> str:
   occurences = re.findall(pattern, string, re.IGNORECASE)
   for occurence in occurences:
       string = string.replace(occurence, repl)
       return string

— นิโก้บาโก
แหล่งที่มา

3

สิ่งนี้ไม่ต้องการ RegularExp

def ireplace(old, new, text):
    """ 
    Replace case insensitive
    Raises ValueError if string not found
    """
    index_l = text.lower().index(old.lower())
    return text[:index_l] + new + text[index_l + len(old):]

— bFloch
แหล่งที่มา

3

สิ่งที่ดี แต่สิ่งนี้ไม่ได้เปลี่ยนการเกิดขึ้นเก่าทั้งหมดด้วยสิ่งใหม่ แต่จะเกิดขึ้นครั้งแรกเท่านั้น

— rsmoorthy

5

มันอ่านได้น้อยกว่ารุ่น regex ไม่จำเป็นต้องบูรณาการล้อที่นี่

— Johannes Bittner

มันน่าสนใจที่จะทำการเปรียบเทียบประสิทธิภาพระหว่างสิ่งนี้กับเวอร์ชั่นที่อัปโหลดแล้วซึ่งอาจเร็วกว่าซึ่งมีความสำคัญสำหรับบางแอปพลิเคชัน หรือมันอาจช้าลงเพราะมันทำงานได้ดีขึ้นในการตีความ Python

— D Coetzee

2

ข้อสังเกตที่น่าสนใจเกี่ยวกับรายละเอียดของไวยากรณ์และตัวเลือก:

Python 3.7.2 (แท็ก / v3.7.2: 9a3ffc0492, 23 ธันวาคม 2018, 23:09:28) [MSC v.1916 64 บิต (AMD64)] บน win32

import re
old = "TREEROOT treeroot TREerOot"
re.sub(r'(?i)treeroot', 'grassroot', old)

'รากหญ้ารากหญ้ารากหญ้า'

re.sub(r'treeroot', 'grassroot', old)

'TREEROOT Grassroot TREerOot'

re.sub(r'treeroot', 'grassroot', old, flags=re.I)

'รากหญ้ารากหญ้ารากหญ้า'

re.sub(r'treeroot', 'grassroot', old, re.I)

'TREEROOT Grassroot TREerOot'

ดังนั้นคำนำหน้า (? i) ในนิพจน์การจับคู่หรือการเพิ่ม "ค่าสถานะ = re.I" เป็นอาร์กิวเมนต์ที่สี่จะส่งผลให้เกิดการจับคู่แบบตัวพิมพ์เล็กและตัวพิมพ์ใหญ่ แต่ใช้เพียงแค่ "re.I" เป็นอาร์กิวเมนต์ที่สี่ไม่ได้ส่งผลให้การแข่งขันตรงตามตัวพิมพ์เล็กและใหญ่

สำหรับการเปรียบเทียบ

re.findall(r'treeroot', old, re.I)

['TREEROOT', 'treeroot', 'TREerOot']

re.findall(r'treeroot', old)

[ 'treeroot']

— เมอเรย์
แหล่งที่มา

สิ่งนี้ไม่ได้ให้คำตอบสำหรับคำถาม โปรดแก้ไขคำตอบของคุณเพื่อให้แน่ใจว่าจะได้รับการปรับปรุงตามคำตอบอื่น ๆ ที่มีอยู่แล้วในคำถามนี้

— hongsy

1

ฉันได้รับการ \ t ถูกแปลงเป็นลำดับการหลบหลีก (เลื่อนลงเล็กน้อย) ดังนั้นฉันสังเกตว่าre.subแปลงแบ็กสแลชที่หลบหลีกอักขระที่จะหลบหนีลำดับ

เพื่อป้องกันไม่ให้ฉันเขียนต่อไปนี้:

แทนที่ตัวพิมพ์เล็กและใหญ่

import re
    def ireplace(findtxt, replacetxt, data):
        return replacetxt.join(  re.compile(findtxt, flags=re.I).split(data)  )

นอกจากนี้หากคุณต้องการให้แทนที่ด้วยอักขระเลี่ยงเช่นคำตอบอื่น ๆ ที่นี่ซึ่งรับอักขระ bashslash ความหมายพิเศษที่แปลงเป็น escape sequences เพียงแค่ถอดรหัสการค้นหาและหรือแทนที่สตริง ใน Python 3 อาจต้องทำอะไรเช่น. decode ("unicode_escape") # python3

findtxt = findtxt.decode('string_escape') # python2
replacetxt = replacetxt.decode('string_escape') # python2
data = ireplace(findtxt, replacetxt, data)

ทดสอบใน Python 2.7.8

หวังว่าจะช่วย

— สแตนเอส
แหล่งที่มา

0

ไม่เคยโพสต์คำตอบมาก่อนและหัวข้อนี้เก่ามาก แต่ฉันมาพร้อมกับการแก้ปัญหาและคิดอื่นฉันสามารถได้รับการตอบสนองของคุณฉันไม่ได้ปรุงรสในการเขียนโปรแกรม Python ดังนั้นหากมีข้อบกพร่องปรากฏให้โปรดชี้พวกเขาออกมา )

i='I want a hIPpo for my birthday'
key='hippo'
swp='giraffe'

o=(i.lower().split(key))
c=0
p=0
for w in o:
    o[c]=i[p:p+len(w)]
    p=p+len(key+w)
    c+=1
print(swp.join(o))

— anddan
แหล่งที่มา

2

เพื่อการเรียนรู้: โดยทั่วไปเมื่อคุณทำการค้นหาและแทนที่สตริงมันจะดีกว่าถ้าคุณไม่ต้องแปลงให้เป็นอาร์เรย์ก่อน นั่นเป็นเหตุผลที่คำตอบแรกน่าจะดีที่สุด ในขณะที่ใช้งานโมดูลภายนอกจะถือว่าสตริงเป็นทั้งสตริง มันค่อนข้างชัดเจนว่าเกิดอะไรขึ้นในกระบวนการ

— isaaclw

สำหรับการเรียนรู้: เรื่องยากมากสำหรับนักพัฒนาที่มีบริบทในการอ่านรหัสและถอดรหัสสิ่งที่ทำมัน :)

— ทอดด์