UPDATE:ฉันสังเกตเห็นว่ามีหลายคนที่กำลังดูกระทู้นี้ซึ่งทำให้ฉันเชื่อว่าสถานการณ์นี้ไม่ได้หายากนัก อย่างไรก็ตามฉันได้ถามคำถามที่คล้ายกัน / ที่เกี่ยวข้องกับ SO ที่นี่ซึ่งมีวิธีแก้ปัญหาที่เหมาะสมเช่นกันซึ่งอาจแก้ปัญหาได้ในทางที่ดีขึ้น
ในเครื่องที่ใช้ Windows 7 ของฉันฉันมีไดเรคทอรี่ที่เต็มไปด้วยดัมพ์ที่ดาวน์โหลดมาในไฟล์ ZIP ไฟล์เก็บถาวรแต่ละไฟล์มีไฟล์ข้อความไฟล์ PDF และไฟล์ XML น้อยมาก ฉันต้องการแยกเนื้อหาทั้งหมดของไฟล์เก็บถาวร ZIP แต่ละไฟล์ลงในโฟลเดอร์ที่เกี่ยวข้อง (ต้องสร้างขึ้นในระหว่างกระบวนการ) ขณะที่ทิ้ง / ไม่สนใจการแยกไฟล์ PDF หลังจากแตกไฟล์ที่ต้องการจากไฟล์เก็บถาวรแล้วต้องไม่ลบzip ที่ประมวลผล(หรือฉันอยากรู้ว่าฉันสามารถควบคุมมันได้อย่างไรในสถานการณ์ต่าง ๆ )
หากช่วยให้ทราบจำนวนของไฟล์เก็บถาวรในไดเรกทอรีจะอยู่ในช่วง 60k-70k นอกจากนี้ฉันต้องการไดเรกทอรีเอาท์พุทแยกเพราะไฟล์ในไฟล์เก็บถาวรอาจมีชื่อเหมือนกับไฟล์ในไฟล์อื่น
ตัวอย่างเช่น,
- ฉันมีที่เก็บของฉันทุกคนชอบ
one.zip
,two.zip
.. ในการพูดD:\data
- ฉันสร้างโฟลเดอร์ใหม่สำหรับข้อมูลที่ประมวลผลแล้วพูดว่า
D:\extracted
- ตอนนี้ข้อมูลจากควรจะไป
D:\data\one.zip
D:\extracted\one
ที่นี่D:\extracted\one
ควรสร้างขึ้นโดยอัตโนมัติ - ในระหว่างขั้นตอนการบีบอัดข้อมูลที่สมบูรณ์นี้ไฟล์ PDF ที่พบทั้งหมดไม่ควรแตกออกมา (จะถูกละเว้น) ไม่มีจุดในการแยกแล้วลบ
- (ไม่บังคับ)ควรเก็บรักษาไฟล์บันทึกไว้ที่, พูด,
D:\extracted
. แนวคิดคือการใช้ไฟล์นี้เพื่อดำเนินการต่อจากที่ถูกทิ้งไว้ในกรณีที่เกิดข้อผิดพลาด - (ไม่บังคับ)สคริปต์ควรให้ฉันตัดสินใจว่าฉันต้องการเก็บถาวรแหล่งข้อมูลหรือลบทิ้งหลังจากประมวลผล
ฉันทำการค้นหาเพื่อหาทางแก้ไขแล้ว แต่หาไม่พบ ฉันเจอคำถามสองสามข้อเช่นนี้
- ทำการคลายซิปไฟล์ซ้ำ ๆ ที่ไฟล์นั้นอยู่จากนั้นลบไฟล์เก็บถาวร
- 7 zip extract วนซ้ำ
- เป็นไปได้หรือไม่ที่จะแสดงรายการเนื้อหาไฟล์ zip ซ้ำด้วย 7 zip โดยไม่คลายบีบอัด
แต่พวกเขาก็ไม่ได้ช่วยอะไรมาก (ฉันไม่ใช่มืออาชีพที่ใช้ Windows) ฉันเปิดให้ติดตั้งซอฟต์แวร์ที่ปลอดภัยและโฆษณาฟรีของ บริษัท อื่น (โอเพ่นซอร์ส) เช่น 7-zip
แก้ไข:มีเครื่องมือพร้อมที่จะทำสิ่งที่ฉันต้องการหรือไม่ฉันลองใช้Multi Unpackerแล้ว มันไม่ได้สร้างไดเรกทอรีใหม่มันไม่สามารถละเว้นไฟล์ * .pdf มันก็ช้าที่จะเริ่มต้นด้วยฉันคิดว่ามันเป็นครั้งแรกที่อ่านเอกสารทั้งหมดในแหล่งที่มาก่อนที่จะเริ่มประมวลผลพวกเขา
ขอบคุณล่วงหน้า!