มีอะไรดีไปกว่า httrack ในการดาวน์โหลดไฟล์?


0

ฉันพยายามดาวน์โหลดเอกสาร (pdf, tiff, images) จากหน้าเว็บที่มีจาวาสคริปต์และเฟรมอยู่ ตัวอย่าง: http://127.0.0.1/web/guest/en/websys/webArch/mainFrame.cgi

'httrack --get-files' ไม่ดาวน์โหลดเลยมีวิธีอื่นที่คุณคิดอีกมั้ย โปรแกรมอื่น ฉันจะต้องเขียนโปรแกรมนั้นด้วยตัวเองหรือไม่?

ขอบคุณมาก!

คำตอบ:


0

เนื่องจาก URL นั้นลงท้ายด้วย "cgi" ฉันจะเดาว่านี่เป็นการเรียกใช้สคริปต์ CGI บนเซิร์ฟเวอร์ - ซึ่งหมายความว่าอาจคาดว่าจะมีข้อมูลอื่น มีตัวเลือกสองสามอย่างเกี่ยวกับที่ที่มันสามารถรับข้อมูลนี้ได้

ก่อนอื่นข้อมูลนี้อาจมาจากเซสชันที่คุณลงชื่อเข้าใช้ ดูเอกสารเพื่อรับ--load-cookiesตัวเลือกเพื่อระบุว่าควรใช้ไฟล์คุกกี้จากเบราว์เซอร์ของคุณ (คำแนะนำในคอมพิวเตอร์ของฉันใช้สำหรับรูปแบบไฟล์คุกกี้ของเบราว์เซอร์รุ่นเก่า)

ตัวเลือกอื่นคือคาดว่าจะมีข้อมูล POST จากเบราว์เซอร์ของคุณ คุณจะต้องคิดออกว่าตัวแปรแบบฟอร์มและค่าคืออะไรและส่งผ่านสิ่งเหล่านั้นโดยใช้ wget --post-dataหรือ--post-fileตัวเลือก


ขอบคุณสำหรับคำตอบของคุณดั๊ก แต่ฉันไม่แน่ใจว่าฉันเข้าใจสิ่งที่ต้องทำกับโพสต์ข้อมูลคุณช่วยยกตัวอย่างให้ฉันได้ไหม
Zenet

คุณจะต้องใช้เครื่องมือเพื่อตรวจสอบข้อมูลที่ส่งเมื่อคุณคลิกที่ลิงค์ในเบราว์เซอร์ของคุณ - Fiddler2 เป็นตัวเลือกที่ดีถ้าคุณใช้ Windows เมื่อคุณมีที่คุณจะต้องเข้ารหัสในทางที่จะส่งเป็นข้อมูล POST - มีตัวอย่างในหน้าวิกิพีเดียเกี่ยวกับคำขอ POST en.wikipedia.org/wiki/POST_(HTTP)
Doug Harris
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.