XPath Data Scraping จากชุมชนออนไลน์โดยใช้ Excel
ฉันเพิ่งอ่านสิ่งนี้ บทความ เกี่ยวกับวิธีการขูดโปรไฟล์สมาชิกชุมชน Inbound.org โดยใช้ Excel และคุณสามารถรับชม วีดีโอ ถ้าคุณชอบที่นี่ ตั้งแต่การเปิดตัวบทช่วยสอนนี้โครงสร้างเว็บไซต์ขาเข้าได้เปลี่ยนไปเล็กน้อยเนื่องจากคุณสามารถดูวิดีโอได้ในเวลา 11:00 น. หากคุณพยายามคัดลอก XPath ของไอคอนโซเชียลมีเดียมันแตกต่างเล็กน้อย ไม่สามารถดึงข้อมูลนั้นได้ นี่คือสิ่งที่ฉันได้รับตอนนี้: /html/body/div[3]/div/div/div[1]/div/div[2]/a[1]/i นี่คือวิธีที่ฉันเขียนไวยากรณ์ใน Excel: =XPathOnUrl(A2,"//a[@class='twitter']","href") แล้วเช่นนี้ =XPathOnUrl(A2,"//a[contains(@class,twitter)]/@href") แม้ว่าฉันจะลองหลายวิธี แต่ก็ไม่มีใครแสดงให้ฉันเห็นถึงลิงค์ไปยังโปรไฟล์สื่อสังคมออนไลน์ของสมาชิก ฉันได้ลองเปลี่ยน xpath ในหลายวิธีเพื่อให้ได้ข้อมูลที่แตกต่างจากหน้าเว็บ แต่ไม่มีข้อมูลทางสังคมออนไลน์ =XPathOnUrl(A2,"//*[contains(@class,member-banner-tagline)]/div[2]/div/div/div[1]/div/div[1]") =XPathOnUrl(A2,"//*[contains(@class,member-banner-tagline)]/div[2]/div/div/div[1]/div/h1") ฉันไม่รู้จะลองอะไรอีกแล้วมีอะไรผิดปกติและฉันไม่สามารถเข้าใจ ใครมีประสบการณ์เพียงพอกับสิ่งนี้หรือสามารถระบุปัญหาได้ที่นี่ด้วยไวยากรณ์ ขอบคุณมาก