คำถามติดแท็ก wget

GNU Wget (หรือเพียงแค่ wget) เป็นโปรแกรมบรรทัดคำสั่งสำหรับการดาวน์โหลดเนื้อหาจากอินเทอร์เน็ตโดยใช้ HTTP, HTTPS และ FTP

5
ฉันจะให้ชื่อผู้ใช้และรหัสผ่านเพื่อ wget ได้อย่างไร
ฉันพยายามเชื่อมต่อกับเซิร์ฟเวอร์ผ่าน wget: wget http://<user>:<pass>@serveradress แต่ wget ตอบกลับ: พอร์ตไม่ถูกต้อง ฉันรู้ว่าเซิร์ฟเวอร์ยอมรับการรับส่งข้อมูลขาเข้าที่พอร์ต 80 ฉันจะแก้ไขปัญหานี้ได้อย่างไร
157 wget 

8
ดาวน์โหลดไฟล์จากรายการ
ฉันจะดาวน์โหลดไฟล์ (ที่ระบุไว้ในไฟล์ข้อความ) โดยใช้wgetหรือวิธีอื่นโดยอัตโนมัติได้อย่างไร รายการไฟล์ตัวอย่าง: www.example.com/1.pdf www.example.com/2.pdf www.example.com/3.pdf
130 wget 

3
บังคับให้ใช้ชื่อไฟล์จริง
เมื่อใช้wgetในสคริปต์เพื่อดาวน์โหลดไฟล์บางไฟล์จาก Google เอกสารชื่อของไฟล์จะไม่ถูกสงวนไว้ ตัวอย่างเช่น: wget 'http://spreadsheets.google.com/pub?key=pyj6tScZqmEfbZyl0qjbiRQ&output=xls' บันทึกไฟล์pub?key=pyj6tScZqmEfbZyl0qjbiRQแทนindicatorhivestimatedprevalence15-49.xlsซึ่งเป็นสิ่งที่ฉันได้รับถ้าฉันคลิกที่ลิงค์ในเบราว์เซอร์ มีวิธีใดที่จะบังคับใช้พฤติกรรม "เหมือนเบราว์เซอร์" นี้wgetหรือไม่?
50 wget 

9
ฉันจะใช้ wget / curl เพื่อดาวน์โหลดจากเว็บไซต์ที่ฉันเข้าสู่ระบบได้อย่างไร
วิกิพีเดียบางส่วนปรากฏแตกต่างกันเมื่อคุณลงชื่อเข้าใช้ฉันต้องการ wget หน้าผู้ใช้ดังนั้นพวกเขาจะปรากฏราวกับว่าฉันลงชื่อเข้าใช้ มีวิธีที่ฉันสามารถรับหน้าผู้ใช้เช่นนี้ http://en.wikipedia.org/wiki/User:A นี่คือหน้าเข้าสู่ระบบ: http://en.wikipedia.org/w/index.php?title=Special:UserLogin&returnto=Login&campaign=ACP3
46 bash  wget 

2
วิธีทำให้ wget เร็วขึ้นหรือมัลติเธรด
ฉันเพิ่งอัพเกรดฮาร์ดแวร์คอมพิวเตอร์ของฉัน (cpu + มาเธอร์บอร์ด + กราฟิกการ์ด + หน่วยความจำ + ฮาร์ดดิสก์) ดังนั้นจึงจำเป็นต้องติดตั้งระบบปฏิบัติการใหม่ ฉันพยายามดาวน์โหลดdebian-6.0.6-amd64-netinst.isoด้วยwgetคำสั่ง แต่ความเร็วช้ามากจนฉันทนไม่ได้ 4Kb/s ~ 17 Kb/sช้าเหมือนเต่าที่กำลังวิ่งหรือช้ากว่านี้ถ้าฉันใช้ Chrome ฉันอ่านข้อมูลความช่วยเหลือของwgetแล้วดูเหมือนว่าไม่มีตัวเลือกใดที่สามารถทำให้เร็วขึ้นได้ อย่างไรก็ตามมีเพื่อให้wgetเร็วขึ้นหรือไม่ หรือเป็นไปได้ที่จะทำให้การดาวน์โหลดแบบมัลติเธรด ? PS: แบนด์วิดธ์ของฉันคือ 4M ฉันใช้คำสั่งนี้: wget -c url http://hammurabi.acc.umu.se/debian-cd/6.0.6/amd64/iso-cd/debian-6.0.6-amd64-netinst.iso


4
วิธีรับ WGET เพื่อดาวน์โหลด html ของหน้าเว็บเดียวกับเบราว์เซอร์
การใช้เว็บเบราว์เซอร์ (IE หรือ Chrome) ฉันสามารถบันทึกเว็บเพจ (.html) ด้วย Ctl-S ตรวจสอบด้วยโปรแกรมแก้ไขข้อความและดูข้อมูลในรูปแบบตาราง หนึ่งในตัวเลขเหล่านั้นที่ฉันต้องการแยกออกมา แต่สำหรับหลาย ๆ หน้าเว็บหลายแห่งที่ทำด้วยตนเอง ดังนั้นฉันต้องการใช้ WGET เพื่อรับหน้าเว็บเหล่านั้นทีละรายการและเขียนโปรแกรมอื่นเพื่อแยกวิเคราะห์. html และดึงหมายเลขที่ฉันต้องการ แต่ไฟล์. html ที่บันทึกโดย WGET เมื่อใช้ URL เดียวกันกับเบราว์เซอร์ไม่มีตารางข้อมูล ทำไมไม่ มันเหมือนกับว่าเซิร์ฟเวอร์ตรวจพบการร้องขอมาจาก WGET ไม่ใช่จากเว็บเบราว์เซอร์และหน้าเว็บโครงกระดูกที่ขาดตารางข้อมูล ฉันจะรับหน้าเว็บเดียวกันกับ WGET ได้อย่างไร - ขอบคุณ! ข้อมูลเพิ่มเติม: ตัวอย่างของ URL ที่ฉันพยายามดึงข้อมูลคือ: http://performance.morningstar.com/fund/performance-return.action?t=ICENX®ion=usa&culture=th- ที่สตริง ICENX เป็นสัญลักษณ์ของกองทุนรวม ซึ่งฉันจะเปลี่ยนเป็นสัญลักษณ์ที่แตกต่างกันจำนวนหนึ่ง สิ่งนี้จะดาวน์โหลดสารบัญเมื่อดูในเบราว์เซอร์ แต่ตารางข้อมูลจะหายไปหากดึงข้อมูลด้วย WGET
34 wget 

6
วิธีการตรวจสอบลายนิ้วมือ SSL ด้วยบรรทัดคำสั่ง? (wget, curl, …)
ใช้บรรทัดคำสั่งเว็บไซต์ดาวน์โหลดเช่นwget, curlหรืออื่น ๆ ... ในสคริปต์ ... ฉันมีลายนิ้วมือรับรอง SHA-1 และ SHA-256 ของเว็บไซต์ เนื่องจากข้อกังวลด้านความปลอดภัย ( 1 ) ( 2 ) ฉันไม่ต้องการใช้ระบบการออกใบรับรอง SSL สาธารณะ ลายนิ้วมือจะต้องมีการเข้ารหัสอย่างหนัก แอพพลิเคชั่นอย่าง wget สามารถตรวจสอบลายนิ้วมือ SSL ได้หรือไม่? wget ไม่มีฟังก์ชั่นดังกล่าว ( 3 ) การใช้wget --ca-certificateหรือcurl --cacertฉันจะต้องเรียกใช้ผู้ออกใบรับรองท้องถิ่นของฉันซึ่งฉันต้องการป้องกันเพราะนั่นเพิ่มความซับซ้อนมาก นอกจากนี้ยังยากเป็นพิเศษและไม่มีใครทำแบบนั้นมาก่อน ( 4 ) ไม่มีเครื่องมืออะไรเลย download --tlsv1 --serial-number xx:yy:zz --fingerprint xxyyzz https://site.comใช่ไหม แน่นอนว่าการแก้ปัญหาต้องไม่เสี่ยงต่อ TOCTOU ( …
32 security  ssl  wget  curl 

2
วิธีการตรวจสอบสถานะ HTTP โดยไม่ต้องดาวน์โหลดหน้าสมบูรณ์?
ฉันต้องการทราบสถานะ HTTP ของเว็บไซต์โดยใช้ Ubuntu ฉันใช้curlและwgetสั่งการเพื่อจุดประสงค์นั้น แต่ปัญหาคือคำสั่งเหล่านี้ดาวน์โหลดหน้าเว็บไซต์ที่สมบูรณ์แล้วค้นหาส่วนหัวและแสดงบนหน้าจอ ตัวอย่างเช่น: $ curl -I trafficinviter.com HTTP/1.1 200 OK Date: Mon, 02 Jan 2017 14:13:14 GMT Server: Apache X-Pingback: http://trafficinviter.com/xmlrpc.php Link: <http://trafficinviter.com/>; rel=shortlink Set-Cookie: wpfront-notification-bar-landingpage=1 Content-Type: text/html; charset=UTF-8 สิ่งเดียวกันนี้เกิดขึ้นกับWgetคำสั่งที่หน้ากำลังดาวน์โหลดเสร็จและใช้แบนด์วิดท์ของฉันโดยไม่จำเป็น สิ่งที่ฉันกำลังมองหาคือ: วิธีรับรหัสสถานะ HTTP โดยไม่ต้องดาวน์โหลดหน้าจริง ๆ เพื่อที่ฉันจะได้ประหยัดแบนด์วิดท์ได้ ฉันลองใช้ curl แล้ว แต่ไม่แน่ใจว่าฉันกำลังดาวน์โหลดหน้าสมบูรณ์หรือเพียงแค่ส่วนหัวในระบบของฉันเพื่อรับรหัสสถานะ

1
gzip: stdin: ไม่อยู่ในรูปแบบ gzip
เมื่อฉันวิ่ง: tar -zxvf john-1.7.0.2.tar.gz ฉันได้รับสิ่งนี้: gzip: stdin: not in gzip format tar: Child returned status 1 tar: Error is not recoverable: exiting now มันควรเริ่มเปิดออก บางคนบอกว่าห้ามใช้zแต่ฉันได้รับข้อผิดพลาดเดียวกัน เป็นไฟล์ที่ฉันดาวน์โหลดด้วยวิธีนี้: wget http://openwall.com/john/f/john-1.7.0.2.tar.gz

3
ดาวน์โหลดเว็บไซต์ทั้งหมดด้วย wget (หรืออื่น ๆ ) รวมถึงเนื้อหาที่ดาวน์โหลดได้ทั้งหมด
ฉันกำลังพยายามดาวน์โหลดเว็บไซต์ของ winamp ในกรณีที่พวกเขาปิดตัวลง ฉันต้องการดาวน์โหลดทุกสิ่งอย่างแท้จริง ฉันลองครั้งหนึ่งด้วยwgetและฉันจัดการเพื่อดาวน์โหลดเว็บไซต์เอง แต่เมื่อฉันพยายามดาวน์โหลดไฟล์ใด ๆ จากเว็บไซต์มันจะให้ไฟล์โดยไม่มีนามสกุลหรือชื่อ ฉันจะแก้ไขได้อย่างไร
23 downloads  wget 

5
ฉันจะบังคับให้ wget ใช้พร็อกซีเซิร์ฟเวอร์โดยไม่ต้องแก้ไขไฟล์ระบบได้อย่างไร
ฉันต้องการทราบว่าเทียบเท่ากับ wget ทำให้ฉันสามารถตั้งค่าพร็อกซีในขณะที่เรียกคำสั่ง (เช่นwget --proxy=$http_proxy) ความคิดใด ๆ

1
ฉันจะสร้าง wget GUI ด้วยแถบความคืบหน้าหลายแห่งได้อย่างไร
ฉันกำลังเขียนสคริปต์ของตัวเองเพื่อดาวน์โหลดหลายรายการ (พร้อมกันหนึ่งรายการต่อคำสั่ง) โดยใช้wgetและฉันต้องการแถบความคืบหน้า ขณะนี้ฉันใช้zenity --progressแถบความคืบหน้าของฉัน แต่ปัญหาคือมันเกิดแถบความคืบหน้าหลายแถบเมื่อดาวน์โหลด สิ่งที่ฉันต้องการบรรลุคือสิ่งที่คล้ายกับกล่องโต้ตอบการถ่ายโอนไฟล์ใน Nautilus: ใครสามารถชี้ให้ฉันไปในทิศทางที่ถูกต้องว่าโปรแกรมหรือภาษาใดที่จะบรรลุเป้าหมายนี้ หมายเหตุ: ฉันมีความรู้พื้นฐานเกี่ยวกับการเขียนสคริปต์เชลล์ไม่มากนัก
21 wget  zenity 

3
ฉันจะดู / หยุดการเรียกใช้งาน crontab ปัจจุบันได้อย่างไร
ฉันจะดูงาน crontab ที่กำลังดำเนินการอยู่ได้อย่างไร? ฉันจะหยุดงาน crontab ที่กำลังดำเนินการด้วยตนเองได้อย่างไร คำถามนี้เกี่ยวกับดูกระบวนการ cron ที่กำลังทำงานอยู่หรือไม่? ใช่ เพื่อฆ่ากระบวนการด้วยตนเองวิธีหนึ่งคือการใช้ pkill ฉันคิดเกี่ยวกับ pkill / killall แต่คำสั่งบางคำของฉันในไฟล์ crontab นั้นเป็นไปตามลำดับ! หมายความว่าหลังจากเสร็จสิ้นคำสั่งคำสั่งถัดไปจะเริ่มขึ้น! ตัวอย่างเช่น: sudo crontab -e 00 10 * * * /usr/bin/wget LINK ; shutdown -h now ดังนั้นถ้าฉันฆ่าwgetคอมพิวเตอร์จะถูกปิด !!! -> ฉันต้องการฆ่าภารกิจ cron ให้เต็มที่ไม่ใช่ส่วนหนึ่งของมัน! pkillปัญหาต่อไป: แล้วสคริปต์ล่ะ (ฉันได้นำเข้าสคริปต์ทุบตีไปcrontab -e) ->sudo pkill ???
20 cron  wget 

1
ฉันจะเริ่มการดาวน์โหลด wget ใหม่ได้อย่างไร
ฉันใช้wgetแอปพลิเคชัน ไฟล์เดียวหยุดดาวน์โหลด ฉันจะหยุดการดาวน์โหลดและเริ่มดาวน์โหลดอีกครั้งได้อย่างไร นี่คือบันทึกของ wget $ tail -f wget-log 287350K .......... .......... .......... .......... .......... 39% 104K 4h46m 287400K .......... .......... .......... .......... .......... 39% 101K 4h46m 287450K .......... .......... .......... .......... .......... 39% 106K 4h46m 287500K .......... .......... .......... .......... .......... 39% 102K 4h46m 287550K .......... .......... .......... .......... …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.