ฉันมีหลายพันรายการของสตริงและแต่ละรายการมีประมาณ 10 สาย สตริงส่วนใหญ่ในรายการที่กำหนดจะคล้ายกันมากแม้ว่าบางสตริงจะไม่ค่อยเกี่ยวข้องกับสตริงอื่นและบางคำมีคำที่ไม่เกี่ยวข้อง พวกเขาอาจถูกพิจารณาว่าเป็นความแปรปรวนของสตริงที่ยอมรับได้ ฉันกำลังมองหาอัลกอริทึมหรือไลบรารีที่จะแปลงแต่ละรายการเป็นสตริงที่ยอมรับได้
นี่คือหนึ่งในรายการดังกล่าว
- Star Wars: Episode IV ความหวังใหม่ StarWars.com
- Star Wars Episode IV - ความหวังใหม่ (1977)
- Star Wars: Episode IV - ความหวังใหม่ - มะเขือเทศเน่า
- ดู Star Wars: Episode IV - ความหวังใหม่ออนไลน์ฟรี
- Star Wars (1977) - ภาพยนตร์ยอดเยี่ยม
- [REC] โปสเตอร์ 4 ใบรับประกันความตายโดย Outboard Motor - SciFiNow
สำหรับรายการนี้สตริงใด ๆ ที่ตรงกับนิพจน์ทั่วไป^Star Wars:? Episode IV (- )?A New Hope$
จะยอมรับได้
ฉันได้ดูหลักสูตรการเรียนรู้ของ Machine Ng บน Coursera แล้ว แต่ฉันไม่พบปัญหาที่คล้ายกัน