ฉันใช้BeautifulSoupและแยกวิเคราะห์ HTML บางส่วน
ฉันได้รับข้อมูลบางอย่างจากแต่ละ HTML (ใช้สำหรับลูป)และเพิ่มข้อมูลนั้นลงในรายการบางรายการ
ปัญหาคือบางส่วนของ HTMLs มีรูปแบบที่แตกต่างกัน(และพวกเขาไม่ได้มีข้อมูลที่ฉันต้องการในพวกเขา)
ดังนั้นฉันจึงพยายามใช้การจัดการข้อยกเว้นและเพิ่มมูลค่าnull
ให้กับรายการ(ฉันควรทำเช่นนี้เนื่องจากลำดับของข้อมูลมีความสำคัญ)
ตัวอย่างเช่นฉันมีรหัสเช่น:
soup = BeautifulSoup(links)
dlist = soup.findAll('dd', 'title')
# I'm trying to find content between <dd class='title'> and </dd>
gotdata = dlist[1]
# and what i want is the 2nd content of those
newlist.append(gotdata)
# and I add that to a newlist
และบางลิงค์ไม่มีเลย<dd class='title'>
สิ่งที่ฉันต้องการทำคือเพิ่มสตริงnull
เข้าไปในรายการแทน
ข้อผิดพลาดปรากฏขึ้น:
list index out of range.
สิ่งที่ฉันได้ลองแล้วคือการเพิ่มบรรทัดเช่นนี้:
if not dlist[1]:
newlist.append('null')
continue
แต่มันไม่ได้ผล มันยังคงแสดงข้อผิดพลาด:
list index out of range.
ฉันควรทำอย่างไรกับเรื่องนี้? ฉันควรใช้การจัดการข้อยกเว้นหรือไม่? หรือมีวิธีไหนที่ง่ายกว่านี้?
ข้อเสนอแนะใด ๆ ? ความช่วยเหลือใด ๆ จะดีมาก!
None
สะอาดกว่าอย่างชัดเจน OP ต้องการ'null'
ในกรณีนี้