wget --content-disposition 'https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE48191&format=file'
ไฟล์ที่คุณกำลังดาวน์โหลดเป็นtar
ไฟล์เก็บถาวร (ไฟล์ไบนารี) ซึ่งจัดทำโดยลิงก์แบบไดนามิกจากเว็บเซิร์ฟเวอร์ wget
โดยปกติจะบันทึกไฟล์โดยใช้ส่วนหนึ่งของ URL ที่คุณใช้ แต่ในกรณีนี้เป็นเพียงจุดสิ้นสุด REST API (หรือบางอย่างที่คล้ายกัน) ดังนั้นชื่อจะไม่เป็นมิตรกับการทำงานด้วย (มันจะเป็นชื่อที่ถูกต้องและ เนื้อหาของไฟล์จะเหมือนกัน)
อย่างไรก็ตามในกรณีนี้เซิร์ฟเวอร์ให้ส่วนหัว "การจัดการเนื้อหา" ที่มีชื่อไฟล์จริงซึ่งwget
สามารถใช้งานได้หากคุณใช้--content-disposition
ตัวเลือก ตัวเลือกนี้จะมีการทำเครื่องหมาย "ทดลอง" wget
ในคู่มือของฉัน
คุณต้องอ้าง URL เพื่อที่เชลล์จะไม่ตีความ&
และ?
อักขระในนั้น
สิ่งที่เทียบเท่าโดยใช้curl
:
curl -J -O 'https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE48191&format=file'
หรือใช้ตัวเลือกแบบยาวที่เทียบเท่า:
curl --remote-header-name --remote-name 'https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE48191&format=file'
เมื่อคุณดาวน์โหลดไฟล์แล้วคุณจะต้องแตกไฟล์ออก:
tar -xvf GSE48191_RAW.tar
เนื่องจากวิธีที่สร้างไฟล์เก็บถาวรเฉพาะนี้จะทำให้ไฟล์ของไฟล์เก็บถาวรลงในไดเรกทอรีปัจจุบัน (ดังนั้นการสร้างไดเรกทอรีใหม่ย้ายไฟล์เก็บถาวรไปที่นั่นและเปิดออกอาจเป็นความคิดที่ดี) ไฟล์ในไฟล์เก็บถาวรนี้เป็นไฟล์ที่gzip
บีบอัดCEL