มีเหตุผลที่ดีที่สิ่งนี้ไม่สามารถทำงานได้โดยตรงกับ HTTP และนั่นคือ URL ไม่ใช่เส้นทางไฟล์แม้ว่าการใช้/
ตัวคั่นจะทำให้หน้าตาคล้ายกันและบางครั้งก็มีความสอดคล้องกัน 1
โดยทั่วไป (หรือในอดีต) เว็บเซิร์ฟเวอร์มักจะทำลำดับชั้นของไดเรกทอรีมิรเรอร์ (สำหรับบางคน - เช่น Apache - นี่เป็นส่วนประกอบสำคัญ) และยังจัดทำดัชนีไดเรกทอรีเหมือนกับระบบไฟล์ อย่างไรก็ตามไม่มีอะไรเกี่ยวกับโปรโตคอล HTTP ที่ต้องการสิ่งนี้
นี้เป็นสิ่งสำคัญเพราะถ้าคุณต้องการใช้ glob ในการพูด, ทุกอย่างซึ่งเป็น subpath ของhttp://foo/bar/
เว้นแต่เซิร์ฟเวอร์มีกลไกบางอย่างที่จะช่วยให้คุณมีเช่น (เช่นดัชนีดังกล่าว) มีอะไรที่จะใช้มัน glob ไป ไม่มีระบบไฟล์ในการค้นหา ยกตัวอย่างเช่นเพียงเพราะคุณรู้ว่ามีหน้าhttp://foo/bar/one.html
และไม่ได้หมายความว่าคุณจะได้รับรายชื่อของไฟล์และไดเรกทอรีย่อยผ่านhttp://foo/bar/two.html
http://foo/bar/
มันจะสมบูรณ์ภายในโปรโตคอลเพื่อให้เซิร์ฟเวอร์ส่งคืน 404 สำหรับสิ่งนั้น หรืออาจส่งคืนรายการไฟล์ หรืออาจส่งรูปภาพ jpg ที่ดีให้คุณ เป็นต้น
ดังนั้นจึงไม่มีมาตรฐานที่นี่ที่wget
สามารถใช้ประโยชน์ได้ AFAICT, wget ทำงานเพื่อสะท้อนลำดับชั้นของเส้นทางโดยการเชื่อมโยงอย่างแข็งขันในการตรวจสอบแต่ละหน้า กล่าวอีกนัยหนึ่งถ้าคุณทำซ้ำมิเรอร์http://foo/bar/index.html
มันดาวน์โหลดindex.html
แล้วแยกลิงค์ที่เป็น subpath ของที่ 2-A
สวิทช์เป็นเพียงตัวกรองที่ถูกนำไปใช้ในกระบวนการนี้
กล่าวโดยย่อถ้าคุณรู้ว่าไฟล์เหล่านี้ถูกทำดัชนีที่ไหนสักแห่งคุณสามารถเริ่มต้นด้วยการใช้-A
ไฟล์นั้นได้ ถ้าไม่เช่นนั้นคุณจะโชคไม่ดี
1. แน่นอน FTP URL ก็เป็น URL เช่นกัน อย่างไรก็ตามในขณะที่ฉันไม่ค่อยรู้เกี่ยวกับโปรโตคอล FTP แต่ฉันเดาว่ามันเป็นเรื่องธรรมดาที่มันอาจจะเป็นรูปแบบที่ทำให้เกิดการหมุนได้อย่างโปร่งใส
2. ซึ่งหมายความว่าอาจจะมี URL ที่ถูกต้องhttp://foo/bar/alt/whatever/stuff/
ที่จะไม่รวมอยู่http://foo/bar/index.html
เพราะมันไม่ได้อยู่ในทางใดทางหนึ่งที่เชื่อมโยงกับสิ่งที่อยู่ในชุดของสิ่งที่เชื่อมโยงกับ ต่างจากระบบไฟล์เว็บเซิร์ฟเวอร์ไม่จำเป็นต้องทำให้เลย์เอาต์ของเนื้อหาโปร่งใสและไม่จำเป็นต้องทำในลักษณะที่ชัดเจนโดยสังหรณ์ใจ
curl "http://example.com/picture[1-10].jpg" -o "picture#1.jpg"