wgetมีตัวเลือก-np
ที่ปิดใช้งานการรับไฟล์จากไดเรกทอรีหลัก ฉันต้องการบางสิ่งที่คล้ายกัน แต่ยืดหยุ่นกว่าเล็กน้อย พิจารณา:
www.foo.com/bar1/bar2/bar3/index.html
ฉันต้องการรับทุกสิ่ง แต่ไม่ใช่ "สูงกว่า" (ในลำดับชั้นต้นไม้) กว่าbar2
(!) ดังนั้นbar2
ก็ควรจะลึกซึ้ง bar1
แต่ไม่
มีวิธีที่จะทำให้เลือกมากขึ้นหรือไม่
พื้นหลัง: ฉันพยายามทำมิเรอร์เว็บไซต์ด้วยโครงสร้างเชิงตรรกะที่คล้ายกัน - จุดเริ่มต้นจากนั้นขึ้นและลง หากมีเครื่องมืออื่นที่wget
เหมาะสมกว่าสำหรับเค้าโครงดังกล่าวโปรดแจ้งให้เราทราบด้วย
ปรับปรุง
หรือแทนที่จะระบุความลึกที่เป็นไปได้บางทีอาจเป็น "ไม่มีผู้ปกครองยกเว้นว่าตรงกับ URL นี้หรือ"
อัปเดต 2
มีโครงสร้างบางอย่างบนเซิร์ฟเวอร์ใช่ไหม คุณสามารถมองเห็นมันเป็นต้นไม้ ดังนั้นโดยปกติด้วย "- ไม่มีแม่" คุณเริ่มจากจุด A และลงเท่านั้น
ความปรารถนาของฉันคือความสามารถในการขึ้น - แสดงโดยบอกว่ามันได้รับอนุญาตให้ขึ้นไปยังโหนด X หรือ (ซึ่งเทียบเท่า 100%) ที่ได้รับอนุญาตให้ขึ้นไปยังโหนด B (โดยที่ระยะทาง BA = X)
ในทุกกรณีกฎสำหรับการหยุดทำงานยังคงอยู่ตามที่ผู้ใช้กำหนด (ตัวอย่างเช่น - ลดระดับโดย Y เท่านั้น)
จะเก็บมันอย่างไร? จริงๆแล้วมันไม่ใช่คำถามจริง ๆ - wget
โดยค่าเริ่มต้นสร้างโครงสร้างเซิร์ฟเวอร์ใหม่ไม่มีอะไรที่นี่จะกลัวหรือไม่จำเป็นต้องแก้ไขอะไร ดังนั้นใน 2 คำ - ตามปกติ
อัปเดต 3
โครงสร้างไดเรกทอรีด้านล่าง - สมมติว่าในแต่ละไดเรกทอรีมีไฟล์เดียวเท่านั้นใน R - R.html และอื่น ๆ แน่นอนว่าเป็นเรื่องง่ายเพราะคุณสามารถมีได้มากกว่าหนึ่งหน้า
R
/ \
B G
/ \
C F
/ \
A D
/
E
A (A.html) เป็นจุดเริ่มต้นของฉัน X = 2 (ดังนั้น B เป็นโหนดระดับบนสุดที่ฉันต้องการดึงข้อมูล) ในตัวอย่างนี้หมายถึงการดึงข้อมูลหน้าทั้งหมดยกเว้น R.html และ G.html A.html เรียกว่า "จุดเริ่มต้น" เพราะฉันต้องเริ่มจากมันไม่ใช่จาก B.
อัปเดต 4
ใช้การตั้งชื่อจากอัปเดต 3
wget OPTIONS www.foo.com/B/C/A/A.html
คำถามคือสิ่งที่ตัวเลือกในการรับหน้าทั้งหมดจากไดเรกทอรี B และด้านล่าง (รู้ว่าคุณต้องเริ่มต้นจาก A.html)
bar2
ไดเรกทอรีและเนื้อหาทั้งหมด หากไม่เป็นเช่นนั้นโปรดชี้แจง
bar2
เรียก แต่ไม่ใช่bar1
? อยู่ที่ไหนbar2
จะไปอาศัยอยู่? จะเกิดอะไรขึ้นถ้า dir สองคนขึ้นไปที่คุณไม่ต้องการให้มีส่วนย่อยที่มีชื่อเหมือนกันเนื้อหาของพวกเขาควรจะรวมกันหรือไม่ มันเกือบจะง่ายกว่ามากที่จะได้รับเว็บไซต์ที่น่ารังเกียจทั้งหมดจากนั้นตัด / ย้ายสิ่งต่างๆ