ฉันกำลังดาวน์โหลดหน้า HTML ต้นฉบับของเว็บไซต์โดยใช้cURL
คำสั่ง ปัญหาคือฉันไม่ต้องการเนื้อหาส่วนใหญ่ในหน้า ฉันต้องการ 100 บรรทัดแรกของหน้าแหล่งที่มา มีวิธีหยุดการดาวน์โหลดของหน้าหลังจากสองสามบรรทัดแรกหรือไม่
ขณะนี้ฉันมีคำสั่งด้านล่างใช้งานได้ แต่ดูเหมือนว่าจะไม่มีประสิทธิภาพ
curl -r[0-1] "http://www.freebase.com/m/045c7b" > foo.txt
ฉันพยายามเปลี่ยนค่าจาก1
ไป.5
และ.05
และยังคงหน้าเว็บทั้งหมดจะได้รับการดาวน์โหลด
ฉันกำลังดูเวลาน้อยกว่าหนึ่งวินาทีเพื่อรันคำสั่งข้างต้น
แก้ไข
จากหน้า man ของcURL
ฉันเห็นว่า " คุณควรทราบว่าเซิร์ฟเวอร์ HTTP / 1.1 จำนวนมากไม่ได้เปิดใช้งานฟีเจอร์นี้ดังนั้นเมื่อคุณพยายามรับช่วงคุณจะได้รับเอกสารทั้งหมดแทน " ดังนั้นหาก เซิร์ฟเวอร์ไม่รองรับการสอบถามช่วงมีคำสั่งอื่นในnix
สภาพแวดล้อมที่จะช่วยให้ฉันบรรลุสิ่งที่ฉันพยายามทำ