ดาวน์โหลดลิงค์ PDF ทั้งหมดในหน้าเว็บหรือไม่? [ปิด]


23

คุณรู้จักซอฟต์แวร์ที่ดีในการดาวน์โหลดลิงค์ PDF ทั้งหมดในหน้าเว็บหรือไม่?

ระบบปฏิบัติการคือ Windows 7

คำตอบ:


36

คุณสามารถใช้wgetและเรียกใช้คำสั่งเช่นนี้:

wget --recursive --level=1 --no-directories --no-host-directories --accept pdf http://example.com

หรือด้วยตัวเลือกสั้น ๆ :

wget -r -l 1 -nd -nH -A pdf http://example.com

ปรับปรุง: เนื่องจากการปรับปรุงของคุณบอกว่าคุณกำลังใช้งาน Windows 7: ใช้wget สำหรับ Windowsจากcmdพรอมต์

อัปเดต 2: สำหรับโซลูชันกราฟิก - แม้ว่าอาจมีค่าใช้จ่ายมากเกินไปเนื่องจากไฟล์อื่น ๆ เช่นกันคือDownThemAll


ขอบคุณเควินสำหรับคำแนะนำของคุณ wget ดูดีแล้วฉันต้องการซอฟต์แวร์ 'กราฟิก' ไม่ใช่บรรทัดคำสั่ง :)
iAsk

2
สิ่งนี้จะปฏิเสธแม้กระทั่งหน้า. html เริ่มต้น เคยมีการทดสอบบ้างไหม?
dan3

คำถามถามเกี่ยวกับการดาวน์โหลดลิงค์ PDF ทั้งหมดดังนั้นใช่หน้า. html เริ่มต้นจะถูกละเว้น
Kevin Worthington

มีความเป็นไปได้ที่จะทำสิ่งเดียวกันใน Windows 7 โดยใช้ Power Shell หรือไม่
Benedikt Buchert

1
ฉันขอแนะนำให้ทิ้งเวลาอย่างน้อยสองสามวินาทีระหว่างการดาวน์โหลดไฟล์เพื่อให้ดีและไม่ต้องใช้เซิร์ฟเวอร์ระยะไกล e, g, สำหรับ wget เพิ่มในธงของ-w 5
KJH

6
  1. ในเบราว์เซอร์ของคุณกดCTRL+ SHIFT+ Jและป้อน

    var pdflinks = []; Array.prototype.map โทร (document.querySelectorAll ("a [href $ = \". pdf \ "]"), ฟังก์ชั่น (e, i) {ถ้า ((pdflinks || []). indexOf (e.href) == - 1) {pdflinks.push (e.href);}}); console.log (pdflinks.join (""));

    สิ่งนี้จะกลับมาในคอนโซล:

    " /superuser/tagged/somepdf1.pdf " " /superuser/tagged/somepdf2.pdf " " /superuser/tagged/somepdf3.pdf "

  2. ตอนนี้ใช้wgetกับตัวเลือกบรรทัดคำสั่งwget url1 url2 ...

คัดลอกและวางสิ่งนี้เปิดคอนโซลป้อนwgetกดปุ่มเมาส์ขวาเพื่อแทรกเนื้อหาคลิปบอร์ดของคุณและกด Enter

หากต้องการใช้ไฟล์ดาวน์โหลดให้เข้าร่วมบรรทัดด้วย "\ n" และใช้พารามิเตอร์ดังต่อไปนี้ wget -i mydownload.txt

โปรดทราบว่าโปรแกรมดาวน์โหลดอื่น ๆ (GUI) ส่วนใหญ่ยอมรับเช่นกันว่ามีรายการ URL คั่นด้วยช่องว่าง

หวังว่านี่จะช่วยได้ นี่คือวิธีที่ฉันทำ มันเร็วกว่าและมีความยืดหยุ่นมากกว่าส่วนขยายใด ๆ ที่มีส่วนต่อประสานกราฟิกฉันต้องเรียนรู้และคุ้นเคย


1
ยังดีกว่าconsole.log('"' + pdflinks.join('" "') + '"')- URL ที่มิฉะนั้นคุณจะไม่ได้รับจริงที่ยกมา
dan3

1

หากคุณต้องการที่จะอยู่ในเบราว์เซอร์ฉันได้เขียนส่วนขยายของเว็บเพื่อจุดประสงค์นี้ - ฉันกำลังเพิ่มความสามารถในการบันทึกบทความทางวิชาการ PDF ด้วยชื่อที่มีการจัดรูปแบบที่ถูกต้อง แต่ถ้าคุณเพียงแค่ต้องการดาวน์โหลด สำหรับสิ่งนี้.

มันเรียกว่าแท็บบันทึกและ Chrome เว็บสโตร์ที่นี่ คุณไม่ต้องป้อนรายการ URL หากคุณเปิดทั้งหมดในแท็บ (แต่สำหรับไฟล์จำนวนมากนี่อาจทำให้คอมพิวเตอร์ช้าลงดังนั้นฉันจึงเพิ่มตัวเลือกเพื่อเพิ่มของคุณเอง)


0

ฉันเพิ่งใช้uGet (บน Windows) สำหรับสิ่งนี้ มี GUI และคุณสามารถกรองไฟล์ที่คุณต้องการดาวน์โหลด

บันทึกพยายามจดจำสิ่งเหล่านั้นทั้งหมด


0

ใน Google Chrome เป็นไปได้ที่จะใช้ส่วนขยายเช่น:

  • ดาวน์โหลดปริญญาโท

    ด้วยส่วนขยายนี้คุณสามารถดาวน์โหลดรูปภาพ, วิดีโอ, pdf, doc และไฟล์อื่น ๆ ที่เชื่อมโยงกับหน้าเว็บที่คุณกำลังเยี่ยมชม


0

Google

มีเครื่องมือ Python เล็กน้อยที่อนุญาตให้ดาวน์โหลดลิงค์ PDF จากเว็บไซต์ที่อ้างอิงผลการค้นหาของ Google

เช่น

หมายเหตุ: ฉันเป็นผู้ดูแลของสคริปต์ทั้งสองที่กล่าวถึง

ทั้งคู่กำลังใช้xgoogleห้องสมุด Python ส้อมของฉันของห้องสมุดนี้จะขึ้นอยู่กับรุ่นpkrumins/xgoogle


ที่เกี่ยวข้อง: ค้นหาเว็บจากบรรทัดคำสั่งลินุกซ์

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.