ใช่บางครั้ง
มีสองสิ่งที่เกิดขึ้นโดยทั่วไป ลิงค์ของคุณไม่ทำงานอีกต่อไปดังนั้นฉันไม่แน่ใจว่าสถานการณ์จริงในกรณีนี้ดังนั้นฉันจะสรุปในลิงค์อื่น
HTTP Redirection
นี่คือสิ่งที่คุณเห็นด้วยBit.ly
และบริการอื่น ๆ สิ่งที่ต้องทำคือจัดเตรียมการตอบสนองการเปลี่ยนเส้นทาง HTTP เมื่อคุณเยี่ยมชมhttp://bit.ly/oH3410 ระบบจะเปลี่ยนเส้นทางไปยัง URL จริง บางครั้ง URL หนึ่งเปลี่ยนเส้นทางไปยัง URL อื่น คุณสามารถเห็นสิ่งนี้เกิดขึ้นได้หากคุณเสียบ URL ลงในhttp://web-sniffer.net/หรือโดยใช้[curl][1] -I http://bit.ly/oH3410
คุณจะเห็นผลตอบแทน 301 ตัวชี้ไปยังตำแหน่งใหม่
ดังนั้นในการจัดการกับ HTTP Redirection คุณเพียงแค่วนลูปคำขอ HTTP HEAD จนกว่าคุณจะหยุดรับการตอบกลับในยุค 300 (หวังว่าจะได้รับ 200) โปรดทราบว่าอาจเป็นไปได้ว่าพวกเขาจะเปลี่ยนเส้นทางในวงซึ่งจะไม่สิ้นสุด คุณสามารถทำได้ด้วย CURL หรือเครื่องมือ HTTP ใด ๆ
หน้าดาวน์โหลด
นี่คือสิ่งที่เว็บไซต์ดาวน์โหลดส่วนใหญ่ใช้ คุณคลิกลิงก์ดาวน์โหลดและนำคุณไปยังหน้าที่มีโฆษณามากมายและบอกว่า "การดาวน์โหลดของคุณจะเริ่มขึ้นในไม่ช้า" ซึ่งคล้ายกัน [ ตัวอย่าง ] ด้วยสิ่งเหล่านี้คุณสามารถลองแยกวิเคราะห์ลิงก์โดยตรงที่แท้จริงจาก URL แต่นั่นจะเป็นการเจาะจงไซต์และไซต์ส่วนใหญ่จะไม่รวมไว้เพื่อป้องกันไม่ให้คุณหลีกเลี่ยง สิ่งนี้ทำได้ผ่านmeta http-equiv="refresh"
แท็กในส่วนหัวหรือ JavaScript (ส่วนใหญ่) JS มักจะมีทางเลือกส่วนหัวแม้ว่า
มีวิธีแก้ปัญหาคือแม้ว่า หากคุณดูแหล่งที่มาในหน้าดาวน์โหลดคุณจะเห็น<meta http-equiv="refresh">
แท็ก (โดยปกติอยู่ใน<noscript>
แท็ก) ที่มีแอตทริบิวต์ของURL
จุดนั้นชี้ไปที่การดาวน์โหลดจริง ดังนั้นใช้ CURL (หรือเครื่องมือ HTTP อื่น ๆ ) เพื่อดาวน์โหลดหน้านี้แยกวิเคราะห์และคว้าค่านั้น ไซต์อาจยกเว้นสิ่งนี้แม้ว่าพวกเขาต้องการที่จะน่ารังเกียจจริงๆดังนั้นคุณต้องมี JavaScript เพื่อดาวน์โหลดไฟล์
อาจมีบล็อก JavaScript ที่เชื่อมโยงไปยังการดาวน์โหลดด้วย มันอาจจะสับสนหรือเชื่อมโยงจาก URL อื่น ระยะของคุณอาจแตกต่างกันออกไปพยายามที่จะแยกออก อาจมี "ลิงก์โดยตรง" ในหน้า คุณสามารถลองใช้เทคนิคสองสามอย่างเพื่อค้นหาสิ่งนั้น แต่อีกครั้งที่อาจทำให้งงงวยผ่านทาง JavaScript หรืออาจหายไปด้วยกัน
edit
เพื่อดูที่มาร์กอัปสำหรับวิธีที่ฉันทำ