ลบข้อความซ้ำออกจาก Maildir


10

ฉันได้รับข้อความซ้ำจำนวนมากใน Maildir ของเซิร์ฟเวอร์ IMAP ของฉัน วิธีที่ดีที่สุดในการลบออกคืออะไร

บางประเด็นที่เกี่ยวข้อง:

  • รหัสข้อความที่ใช้ร่วมกันมักจะเป็นคำจำกัดความที่ดีพอ สคริปต์ขนาดเล็กที่ลบทั้งหมด แต่ข้อความที่ซ้ำกันจะทำงาน
  • บางครั้งมีความจำเป็นต้องค้นหาข้อมูลซ้ำตามเนื้อหาของข้อความที่แชร์ คำจำกัดความที่สมเหตุสมผลของการแบ่งปันที่นี่คืออะไร เทียบเท่าระดับบิต สิ่งที่เกี่ยวกับความแตกต่างที่แปลกประหลาดในการตัดบรรทัดการหลบหนีการเข้ารหัสอักขระ?
  • บางครั้งมีความแตกต่างที่มีความหมายระหว่างข้อความ 'ซ้ำ' วิธีที่ดีที่สุดในการตรวจสอบความแตกต่างในชุดของข้อความ 'ซ้ำ' คืออะไร diffs?

คำตอบ:


6

ฉันได้ทำการปรับปรุงที่สำคัญบางอย่างสำหรับสคริปต์ของเควินที่กล่าวถึงข้างต้นและเขาก็ใจดีพอที่จะยอมรับคำขอดึงของฉัน ในที่สุดเราก็แยกออกเป็นโครงการเฉพาะที่คุณสามารถหาได้ที่นี่:

https://github.com/kdeldycke/maildir-deduplicate


สคริปต์นี้ย้ายไปยังตำแหน่งใหม่ดังนั้นฉันจึงปรับปรุงลิงค์
Adam Spires

3

สำหรับไฟล์ทั่วไปใน linux ฉันใช้ fdupes utils เพื่อลบไฟล์ที่ซ้ำกัน ฉันพบว่าใช้งานได้กับข้อความ Maildir


1
ดูเหมือนว่าfdupesจะทำงานสำหรับการทำซ้ำที่แน่นอนเท่านั้นในขณะที่ OP คือ (โดยปริยาย) ถามเกี่ยวกับรูปแบบการทำซ้ำที่ซับซ้อนมากขึ้น ข้อความที่ส่งมาสองครั้งเพราะ.forwardอะไรก็ตามจะมีส่วนหัวที่แตกต่างกันเล็กน้อยดังนั้นในขณะที่ข้อความนั้นซ้ำกันสองไฟล์ที่มีสองสำเนาอาจไม่ได้
tripleee

0

Evolution ของ Gnome [ตัวแทนผู้ใช้แบบกราฟิกเมล์] มีคุณสมบัติในตัวเพื่อลบเมลที่ซ้ำกัน ตามที่อธิบายไว้ในหน้าความช่วยเหลือนี้มันจะลดลงไปที่

  1. เลือกข้อความต้องสงสัย (หรือเฉพาะข้อความทั้งหมด)
  2. ไปที่เมนูข้อความที่เลือกลบข้อความที่ซ้ำกัน

voila

PS Evolution สามารถเข้าถึงข้อความของคุณในพื้นที่ (MailDir, MH, Mbox) หรือผ่าน IMAP


0

ที่ดีที่สุดที่ฉันได้พบในวันนี้คือเควิน Deldycke ของMaildir-deduplicate

  • มันจะละเว้นX-MIMETrackส่วนหัวโดยค่าเริ่มต้นและเปรียบเทียบส่วนหัวโดยใช้ส่วนSHA224ย่อย
  • มันจะลบรายการที่ซ้ำกันโดยอัตโนมัติโดยไม่ต้องขอการยืนยัน อย่างไรก็ตามมีโหมดเรียกใช้แบบแห้งซึ่งอนุญาตให้แสดงตัวอย่างภาพที่ซ้ำกันจะถูกลบ

ฉันเดิมพันใครจะทำอะไรบางอย่างแฟนซีจาก Rick แซนเดอdelIMAPdups.pl , ส่วนหนึ่งของเครื่องมือ IMAP


maildir-deduplicate ย้ายไปที่ตำแหน่งใหม่ดังนั้นฉันจึงอัปเดตลิงก์ อย่างไรก็ตามข้อมูลของคุณล้าสมัยแล้ว
Adam Spires

ฉันได้อัปเดตสิ่งนี้แล้วเพื่อไม่ให้ข้อมูลที่ล้าสมัยทำให้เข้าใจผิดอีกต่อไป
Adam Spires
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.