ฉันเพิ่งอ่านสิ่งนี้ บทความ เกี่ยวกับวิธีการขูดโปรไฟล์สมาชิกชุมชน Inbound.org โดยใช้ Excel และคุณสามารถรับชม วีดีโอ ถ้าคุณชอบที่นี่
ตั้งแต่การเปิดตัวบทช่วยสอนนี้โครงสร้างเว็บไซต์ขาเข้าได้เปลี่ยนไปเล็กน้อยเนื่องจากคุณสามารถดูวิดีโอได้ในเวลา 11:00 น. หากคุณพยายามคัดลอก XPath ของไอคอนโซเชียลมีเดียมันแตกต่างเล็กน้อย ไม่สามารถดึงข้อมูลนั้นได้
นี่คือสิ่งที่ฉันได้รับตอนนี้:
/html/body/div[3]/div/div/div[1]/div/div[2]/a[1]/i
นี่คือวิธีที่ฉันเขียนไวยากรณ์ใน Excel:
=XPathOnUrl(A2,"//a[@class='twitter']","href")
แล้วเช่นนี้
=XPathOnUrl(A2,"//a[contains(@class,twitter)]/@href")
แม้ว่าฉันจะลองหลายวิธี แต่ก็ไม่มีใครแสดงให้ฉันเห็นถึงลิงค์ไปยังโปรไฟล์สื่อสังคมออนไลน์ของสมาชิก
ฉันได้ลองเปลี่ยน xpath ในหลายวิธีเพื่อให้ได้ข้อมูลที่แตกต่างจากหน้าเว็บ แต่ไม่มีข้อมูลทางสังคมออนไลน์
=XPathOnUrl(A2,"//*[contains(@class,member-banner-tagline)]/div[2]/div/div/div[1]/div/div[1]")
=XPathOnUrl(A2,"//*[contains(@class,member-banner-tagline)]/div[2]/div/div/div[1]/div/h1")
ฉันไม่รู้จะลองอะไรอีกแล้วมีอะไรผิดปกติและฉันไม่สามารถเข้าใจ ใครมีประสบการณ์เพียงพอกับสิ่งนี้หรือสามารถระบุปัญหาได้ที่นี่ด้วยไวยากรณ์
ขอบคุณมาก