มีสองวิธีที่แตกต่างกันเพื่อเอาเป็นHTML tagsจากในNSStringCocoa
วิธีหนึ่งคือการแสดงผลสตริงเป็นNSAttributedStringแล้วจับข้อความที่แสดงผล
อีกวิธีหนึ่งคือการใช้NSXMLDocument's- objectByApplyingXSLTStringวิธีใช้การXSLTแปลงที่ทำได้
น่าเสียดายที่ iPhone ไม่รองรับNSAttributedStringหรือNSXMLDocument. มีเคสขอบมากเกินไปและHTMLเอกสารที่มีรูปแบบไม่ถูกต้องเพื่อให้ฉันรู้สึกสบายใจในการใช้ regex หรือNSScanner. ใครมีวิธีแก้ปัญหานี้หรือไม่?
คำแนะนำอย่างหนึ่งคือเพียงแค่มองหาอักขระแท็กเปิดและปิดวิธีนี้จะใช้ไม่ได้ยกเว้นกรณีที่ไม่สำคัญมาก
ตัวอย่างเช่นกรณีเหล่านี้ (จากบท Perl Cookbook ในเรื่องเดียวกัน) จะทำลายวิธีนี้:
<IMG SRC = "foo.gif" ALT = "A > B">
<!-- <A comment> -->
<script>if (a<b && a>c)</script>
<![INCLUDE CDATA [ >>>>>>>>>>>> ]]>