การเขียนโปรแกรม difflib

การเปรียบเทียบสตริงฟัซซีประสิทธิภาพสูงใน Python ให้ใช้ Levenshtein หรือ difflib [ปิด]

ปิด . คำถามนี้เป็นคำถามความคิดเห็นตาม ขณะนี้ยังไม่ยอมรับคำตอบ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้สามารถตอบได้ด้วยข้อเท็จจริงและการอ้างอิงโดยแก้ไขโพสต์นี้ ปิดให้บริการใน5 ปีที่ผ่านมา ปรับปรุงคำถามนี้ ฉันกำลังทำการฟื้นฟูข้อความทางคลินิก (ตรวจการสะกด) ซึ่งฉันตรวจสอบแต่ละคำเทียบกับพจนานุกรมทางการแพทย์ 900,000 คำ ฉันกังวลมากขึ้นเกี่ยวกับความซับซ้อนของเวลา / ประสิทธิภาพ ฉันต้องการเปรียบเทียบสตริงที่คลุมเครือ แต่ฉันไม่แน่ใจว่าควรใช้ไลบรารีใด ตัวเลือกที่ 1: import Levenshtein Levenshtein.ratio('hello world', 'hello') Result: 0.625 ทางเลือกที่ 2: import difflib difflib.SequenceMatcher(None, 'hello world', 'hello').ratio() Result: 0.625 ในตัวอย่างนี้ทั้งสองให้คำตอบเดียวกัน คุณคิดว่าทั้งคู่ทำงานเหมือนกันในกรณีนี้หรือไม่?

130 python string-matching levenshtein-distance difflib

คำถามติดแท็ก difflib