สแปมจำนวนมากกำลังผ่านตัวกรองบนเมลเซิร์ฟเวอร์ที่ฉันเรียกใช้ด้วยวิธีง่าย ๆ ในการเริ่มต้นด้วยการลดน้ำหนัก (ชัดเจนอย่างไม่น่าเชื่อ) หรือการหลอกลวงข้อความอื่น ๆ ที่ด้านบนตามด้วยการเขียนเนื้อหาเอกสารขนาดใหญ่กว่า - หรือความชั่วร้ายที่สุดของทุกข้อความที่คัดลอกมาจากกองแลกเปลี่ยน อย่างดีที่สุด Spamassassin ถือว่านี่คือ BAYES_50 และมันเกิดขึ้นว่าข้อความที่เหลือถูกสร้างขึ้นอย่างระมัดระวังพอที่จะไม่ถูกทริกเกอร์อื่น ๆ (ตัวอย่างเช่นส่วนหัวมีค่าน้อยที่สุดและถูกต้อง) บ่อยครั้งข้อความที่ตัดตอนมารวมอยู่ในแนวเดียวกันอย่างใกล้ชิดกับความสนใจที่ถูกต้องตามกฎหมายของฉันว่าข้อความโดยรวมมีคะแนนเป็น BAYES_00 เนื่องจากโทเค็นสแปมมาก
ส่วนบนเป็นสแปมอย่างเห็นได้ชัด (และในความเป็นจริงมีแนวโน้มที่จะคล้ายกับที่ได้รับก่อนหน้านี้และได้รับการฝึกอบรมเป็นข้อความสแปม) ที่ฉันประหลาดใจว่ามันผ่าน - แต่เห็นได้ชัดว่ามันเป็น ดูเหมือนว่าผ่านแยกซึ่งให้คะแนน 25 บรรทัด (หรือมากกว่านั้น) ของข้อความและชั่งน้ำหนักที่หนักจะแก้ปัญหา มีวิธีทำเช่นนี้หรือไม่?
หลายคนแนะนำให้เขียนนิพจน์ทั่วไปที่กำหนดเอง ฉันไม่ต้องการเข้าร่วมในเรื่องนี้เพราะนี่คือการต่อสู้ที่พ่ายแพ้อย่างต่อเนื่อง มันเป็นสิ่งที่ผู้คนทำก่อนการเรียงลำดับสแปมแบบเบย์มีการใช้กันอย่างแพร่หลายและโดยทั่วไปก็แย่มาก ไม่มีมนุษย์คนใดสามารถให้ทัน มันไม่ได้มีประสิทธิภาพมากกว่าแค่กดปุ่มลบสำหรับแต่ละข้อความสแปมและทำงานได้มากขึ้นในส่วนของฉัน
การกรองสแปมแบบเบย์ทำงาน มันยังใช้งานได้กับสแปมนี้ถ้าฉันแยกส่วน " เหนือครึ่งหน้าบน " และเพิ่งวิเคราะห์ส่วนนั้นโดยถอดล่อ / แกลบออก คำถามคือ: ฉันจะทำให้ Spamassassin ทำเช่นนั้นได้อย่างไร