ฉันมีสตริงที่ดูเหมือน:
6Â 918Â 417Â 712
วิธีตัดที่ชัดเจนในการตัดแต่งสตริงนี้ (ตามที่ฉันเข้าใจ Python) คือการบอกว่าสตริงอยู่ในตัวแปรที่เรียกว่าs
เราได้รับ:
s.replace('Â ', '')
ที่ควรทำเคล็ดลับ แต่แน่นอนมันบ่นว่าอักขระที่ไม่ใช่ ASCII '\xc2'
ในไฟล์ blabla.py ไม่ได้เข้ารหัส
ฉันไม่เคยเข้าใจวิธีการสลับระหว่างการเข้ารหัสต่างๆ
นี่คือรหัสจริงๆมันเหมือนกับด้านบน แต่ตอนนี้มันอยู่ในบริบท ไฟล์จะถูกบันทึกเป็น UTF-8 ในแผ่นจดบันทึกและมีส่วนหัวต่อไปนี้:
#!/usr/bin/python2.4
# -*- coding: utf-8 -*-
รหัส:
f = urllib.urlopen(url)
soup = BeautifulSoup(f)
s = soup.find('div', {'id':'main_count'})
#making a print 's' here goes well. it shows 6Â 918Â 417Â 712
s.replace('Â ','')
save_main_count(s)
ไม่ไกลเกินs.replace
...