ฉันกำลังพยายามดาวน์โหลดURLที่เป็นเช่นhttp://www.somesite.com/restaurants.html#photo=22x00085
นั้น
ฉันใส่ไว้ในเครื่องหมายอัญประกาศเดี่ยว แต่ดาวน์โหลดได้เฉพาะhttp://www.somesite.com/restaur.htmlซึ่งไม่ใช่หน้าที่ถูกต้อง
มีวิธีแก้ไขไหม?
ฉันกำลังพยายามดาวน์โหลดURLที่เป็นเช่นhttp://www.somesite.com/restaurants.html#photo=22x00085
นั้น
ฉันใส่ไว้ในเครื่องหมายอัญประกาศเดี่ยว แต่ดาวน์โหลดได้เฉพาะhttp://www.somesite.com/restaur.htmlซึ่งไม่ใช่หน้าที่ถูกต้อง
มีวิธีแก้ไขไหม?
คำตอบ:
wget
ทำงานได้ดี URI ไวยากรณ์ระบุว่าชิ้นส่วน - เดอะ#foo
ส่วนหนึ่ง - จะต้องตีความอย่างสิ้นเชิงฝั่งไคลเอ็นต์และไม่ได้ใช้เมื่อดึงเอกสารเอง
ตัวอย่างเช่นหากเป็นหน้า HTML เบราว์เซอร์อาจเลื่อนลงไปที่ส่วนที่มีชื่อหรือ - ในกรณีของคุณจะทริกเกอร์โค้ด JavaScript บางรายการที่แสดงรูปภาพเฉพาะ
ในคำอื่น ๆ เท่าที่wget
เกี่ยวข้อง URIs
http://www.somesite.com/restaurants.html#photo=22x00085
และhttp://www.somesite.com/restaurants.html
... ชี้ไปที่หน้าเดียวกัน /restaurants.html
มันขึ้นอยู่กับเบราว์เซอร์ของคุณเพื่อทำสิ่งที่เหลือ การเปิดrestaurants.html#photo=22x00085
ในเบราว์เซอร์ควรใช้งานได้ดี
ฉันไม่สามารถบอกได้ว่ามันคืออันไหน แต่มีเพียงสองตัวเลือก:
แฮชจริง ๆ แล้วเป็นส่วนหนึ่งของชื่อเอกสารที่ร้องขอ ในกรณีนี้คุณสามารถเข้ารหัสได้:
ในกรณีอื่นภายใต้สถานการณ์ปกติhttp://www.somesite.com/restaur.htmlและhttp://www.somesite.com/restaurants.html#photo=22x00085ควรชี้ไปที่หน้าเดียวกัน ส่วนหลังแฮชเพียงแค่ระบุสมอที่เบราว์เซอร์ควรเลื่อนไปหลังจากโหลดหน้าเว็บ มันไม่ได้ถูกส่งไปยังเซิร์ฟเวอร์
อย่างไรก็ตามเป็นไปได้ว่าแฮชนั้น (ab) ใช้ในการโหลดภาพถ่ายโดยใช้ JavaScript Wget ไม่สามารถแปล JavaScript ดังนั้นจึงไม่มีอะไรที่คุณสามารถทำได้
นั่นไม่ใช่ URL สำหรับรูปภาพ เป็น URL สำหรับหน้าเว็บที่ใช้สคริปต์หรือรหัสอื่นเพื่อดึงภาพ ลองโหลดหน้าเว็บโดยปิด JavaScript นั่นคือสิ่งที่ wget ดึงมาให้คุณ
หากต้องการค้นหา URL สำหรับภาพลองเข้าไปที่หน้าเว็บผ่านเบราว์เซอร์ของคุณแล้วคลิกขวาที่รูปภาพ ควรมีตัวเลือกในการดูข้อมูลเกี่ยวกับรูปภาพรวมถึง URL
หากไม่สามารถใช้งานได้อาจเป็นเพราะรูปภาพกำลังโหลดผ่าน Flash หรือโปรแกรมฝั่งไคลเอ็นต์อื่น ๆ คุณสามารถใช้ Fiddler หรือ Wireshark เพื่อดู URL ที่กำลังโหลด
หากคุณให้ภาพที่แท้จริงกับเว็บไซต์ของเราเราสามารถช่วยคุณกำหนดวิธีการโหลดรูปภาพ