วิธีการดึงข้อมูลโดยอัตโนมัติเมื่อได้รับหมายเลขชิ้นส่วน Digi-Key ข้อมูลเช่นผู้ผลิตหมายเลขชิ้นส่วนของผู้ผลิตรายละเอียด ฯลฯ อาจแยกวิเคราะห์ GET http ที่เกี่ยวข้องกับ:
http://search.digikey.com/scripts/DkSearch/dksus.dll?Detail&name=DK_PART_NUMBER
(ขอบคุณ Angry สำหรับพารามิเตอร์ที่ถูกต้อง)
ที่ DK_PART_NUMBER คือหมายเลขชิ้นส่วน Digikey
ใครบ้างรู้ว่าพวกเขามีบริการเว็บหรือเพียงแค่อินเทอร์เฟซที่ดีกว่าสำหรับเรื่องนี้?
หลังจากถามคำถามนี้ฉันตัดสินใจไปข้างหน้าและเขียนสิ่งที่ดึงข้อมูลเบื้องต้นจาก Digikey:
dk_pn = '587-1962-1-ND'
from urllib import urlopen
from sgmllib import SGMLParser
headers = ['Digi-Key Part Number',
'Manufacturer',
'Manufacturer Part Number',
'Description',
'Lead Free Status / RoHS Status',
'Operating Temperature',
'Standard Package',
'Price Break',
'Unit Price',
'Extended Price']
class DK_Parser(SGMLParser):
def reset(self):
SGMLParser.reset(self)
self.last_td = ''
self.inside_th = False
self.inside_td = False
self.grab_data = False
self.part_info = {}
self.hdr_index = 0
self.row_hdrs = []
def start_tr(self, attrs): # row
self.first_header_in_row = True
def start_th(self, attrs): # header cell
if self.first_header_in_row:
self.first_header_in_row = False
self.row_hdrs = []
self.hdr_index = 0
self.inside_th = True
def end_th(self):
self.inside_th = False
def start_td(self, attrs): # data cell
self.inside_td = True
def end_td(self):
self.inside_td = False
self.hdr_index = self.hdr_index+1
def handle_data(self,text):
text = text.strip()
if self.inside_th:
if text in headers:
self.row_hdrs.append(text)
self.last_td = ''
self.grab_data = True
else:
self.grab_data = False
elif self.inside_td and self.grab_data:
if self.hdr_index:
self.last_td = ''
if self.hdr_index < len(self.row_hdrs):
self.last_td = self.last_td + text
self.part_info[self.row_hdrs[self.hdr_index]] = self.last_td
dk_url = 'http://search.digikey.com/scripts/DkSearch/dksus.dll'
dk_params = '?Detail&name='
sock = urlopen(dk_url + dk_params + dk_pn)
parser = DK_Parser()
parser.feed(sock.read())
sock.close()
parser.close()
for k,v in parser.part_info.items():
print k,":",v
มีเพียงบรรทัดข้อมูลแรกของตาราง [ตัวแบ่งราคา / ราคาต่อหน่วย / ราคาขยาย] เท่านั้นที่ถูกจับ