ประมวลผลไฟล์เก็บถาวร zip ซ้ำเพื่อแยกไฟล์ขณะที่ทิ้งรูปแบบเฉพาะของไฟล์
UPDATE:ฉันสังเกตเห็นว่ามีหลายคนที่กำลังดูกระทู้นี้ซึ่งทำให้ฉันเชื่อว่าสถานการณ์นี้ไม่ได้หายากนัก อย่างไรก็ตามฉันได้ถามคำถามที่คล้ายกัน / ที่เกี่ยวข้องกับ SO ที่นี่ซึ่งมีวิธีแก้ปัญหาที่เหมาะสมเช่นกันซึ่งอาจแก้ปัญหาได้ในทางที่ดีขึ้น ในเครื่องที่ใช้ Windows 7 ของฉันฉันมีไดเรคทอรี่ที่เต็มไปด้วยดัมพ์ที่ดาวน์โหลดมาในไฟล์ ZIP ไฟล์เก็บถาวรแต่ละไฟล์มีไฟล์ข้อความไฟล์ PDF และไฟล์ XML น้อยมาก ฉันต้องการแยกเนื้อหาทั้งหมดของไฟล์เก็บถาวร ZIP แต่ละไฟล์ลงในโฟลเดอร์ที่เกี่ยวข้อง (ต้องสร้างขึ้นในระหว่างกระบวนการ) ขณะที่ทิ้ง / ไม่สนใจการแยกไฟล์ PDF หลังจากแตกไฟล์ที่ต้องการจากไฟล์เก็บถาวรแล้วต้องไม่ลบzip ที่ประมวลผล(หรือฉันอยากรู้ว่าฉันสามารถควบคุมมันได้อย่างไรในสถานการณ์ต่าง ๆ ) หากช่วยให้ทราบจำนวนของไฟล์เก็บถาวรในไดเรกทอรีจะอยู่ในช่วง 60k-70k นอกจากนี้ฉันต้องการไดเรกทอรีเอาท์พุทแยกเพราะไฟล์ในไฟล์เก็บถาวรอาจมีชื่อเหมือนกับไฟล์ในไฟล์อื่น ตัวอย่างเช่น, ฉันมีที่เก็บของฉันทุกคนชอบone.zip, two.zip.. ในการพูดD:\data ฉันสร้างโฟลเดอร์ใหม่สำหรับข้อมูลที่ประมวลผลแล้วพูดว่า D:\extracted ตอนนี้ข้อมูลจากควรจะไปD:\data\one.zip D:\extracted\oneที่นี่ D:\extracted\oneควรสร้างขึ้นโดยอัตโนมัติ ในระหว่างขั้นตอนการบีบอัดข้อมูลที่สมบูรณ์นี้ไฟล์ PDF ที่พบทั้งหมดไม่ควรแตกออกมา (จะถูกละเว้น) ไม่มีจุดในการแยกแล้วลบ (ไม่บังคับ)ควรเก็บรักษาไฟล์บันทึกไว้ที่, พูด,D:\extracted. แนวคิดคือการใช้ไฟล์นี้เพื่อดำเนินการต่อจากที่ถูกทิ้งไว้ในกรณีที่เกิดข้อผิดพลาด (ไม่บังคับ)สคริปต์ควรให้ฉันตัดสินใจว่าฉันต้องการเก็บถาวรแหล่งข้อมูลหรือลบทิ้งหลังจากประมวลผล ฉันทำการค้นหาเพื่อหาทางแก้ไขแล้ว …