จะกรองข้อความด้วยอิโมจิเคลื่อนไหวในหัวข้อใน Gmail ได้อย่างไร


27

ฉันกำลังสืบค้นผ่านโฟลเดอร์สแปมของฉัน (ซึ่งฉันไม่ค่อยทำเพราะ Gmail ไม่ค่อยมีผลบวกปลอม) และฉันสังเกตเห็นสิ่งที่น่าสนใจ:

รายการตัวอย่างของข้อความสแปม

ข้อความที่มีมากกว่าครึ่งหนึ่งมีอีโมจิเคลื่อนไหวอย่างน้อยหนึ่งรายการในหัวเรื่อง

เพื่อนของฉันจะไม่ใช้อึนั้น ไม่มี บริษัท ที่ถูกต้องที่ฉันทำธุรกิจด้วยจะทำเช่นนั้น

ฉันจะสร้างตัวกรองเพื่อลบข้อความอัตโนมัติด้วยอีโมจิเคลื่อนไหวในหัวข้อได้อย่างไร

ใช้jamesmstone 's เบาะแสด้านล่างผมพยายามค้นหาด้วยsubject:=?UTF-8?และsubject:"=?UTF-8?"และอีกหลายพีชคณิตอื่น ๆ แต่ไม่มีใครทำงาน

นี่คือชุดตัวอย่างของส่วนหัวจากหนึ่งในกองนึ่งเหล่านี้:

Delivered-To: [redacted]@gmail.com
Received: by 10.107.28.200 with SMTP id c191csp1104992ioc;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
X-Received: by 10.107.38.5 with SMTP id m5mr15068933iom.15.1453691236564;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Return-Path: <VivaLoan@mythirdxyz.xyz>
Received: from mythirdxyz.xyz ([2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11])
        by mx.google.com with ESMTP id o10si8722554igw.41.2016.01.24.19.07.15
        for <[redacted]@gmail.com>;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Received-SPF: pass (google.com: domain of VivaLoan@mythirdxyz.xyz designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) client-ip=2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11;
Authentication-Results: mx.google.com;
       spf=pass (google.com: domain of VivaLoan@mythirdxyz.xyz designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) smtp.mailfrom=VivaLoan@mythirdxyz.xyz;
       dkim=pass header.i=@mythirdxyz.xyz;
       dmarc=pass (p=REJECT dis=NONE) header.from=mythirdxyz.xyz
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=mythirdxyz.xyz; 
 i=@mythirdxyz.xyz; q=dns/txt; s=default; t=1453691229; 
 bh=GuM9JCP4yh7WfVbRBortR7UAr6DAtlgy0oTCna0iWQk=; h=MIME-Version : 
 Content-Type : Content-Transfer-Encoding : To : From : Subject : Date : 
 Message-ID : From : Subject : Date; 
 b=e/zS14UB4o5MhYlfbpsy0h2G/oZyoC5H3ouyhNh13zcSHSNXzI6uvJpIy9a+za2ng26Xe2
 NfAI7nenAMCdHJSGF4yfmtTi3+XrR2MqQPHQ1fzTXGhRy/ktCj4tEqt7DhSxnRCqkYFUNaLA
 wh3FMLr6IxPi2Z7xUXm3JBffhDcSU=
MIME-Version: 1.0
Content-Type: text/html; charset="utf-8"
Content-Transfer-Encoding: base64
To: [redacted]@gmail.com
From: "APPROVAL DEPARTMENT" <VivaLoan@mythirdxyz.xyz>
Subject: =?utf-8?q?=F3=BE=93=A0_Personal_loan_as_soon_as_tomorrow_=F3=BE=93=A0?=
Date: Sun, 24 Jan 2016 19:07:09 -0800
Message-ID: <A112ED51-1674-4902-BF73-F2EBCBA42CAF@mythirdxyz.xyz>

3
ฉันสงสัยว่าพวกเขาเป็นgoomoji...
jamesmstone

@ เจมส์สโตน: ฉันคาดหวังว่าพวกเขาเป็น
เบียร์

คำตอบ:


9

คำตอบสั้น ๆ

แทนที่จะใช้ตัวกรอง Gmail ที่ขึ้นอยู่กับคุณลักษณะการค้นหาของ Gmail เพื่อค้นหาอีโมจิที่เข้ารหัสในข้อความต้นฉบับให้สร้างสคริปต์โดยใช้วิธีการGmailMessage :: getRawContent ()ของ Google Apps Script เพื่อประมวลผลข้อความ

คำถามที่เกี่ยวข้อง

ลิงค์ต่อไปนี้เป็นคำตอบสำหรับคำถามที่คล้ายกันในเว็บไซต์นี้รวมถึงสคริปต์ที่ใช้วิธีการที่อ้างถึง


2
เป็นมูลค่าการกล่าวขวัญว่าสคริปต์ไม่สามารถลบข้อความได้อย่างสมบูรณ์ที่สุดสิ่งที่ทำได้คือย้ายไปที่ถังขยะหรือโฟลเดอร์สแปม และหากข้อความดังกล่าวไปถึงสแปมแล้วจะมีประโยชน์เล็กน้อยจากสคริปต์

@Minestrone: จริงๆแล้วมันเป็นไปได้ที่จะลบข้อความโดยใช้สคริปต์ ควรใช้ Gmail API ดูdevelopers.google.com/gmail/api/v1/reference/users/messages/... เมื่อต้องการใช้ API ของ Gmail ใน Google Apps Script, ดูdevelopers.google.com/apps-script/guides/services/advanced
Rubén

1
ฉันไม่ค่อยสนใจที่จะลบข้อความจริงๆในขณะที่ฉันกำลังค้นหาวิธีในการกรองพวกเขา ฉันอาจต้องการใส่ป้ายกำกับให้พวกเขา
เบียร์

@เบียร์. ฉันคิดว่าดังนั้นฉันจึงไม่ได้กล่าวถึงการใช้ GMAIL API ในเนื้อหาของคำตอบ ในทางกลับกันโชคดีที่ฉันไม่ได้รับอีเมลจากอิโมจิในเรื่องนี้
Rubén

4

ฉันได้สร้าง Google Apps Script เพื่อวัตถุประสงค์ดังกล่าวแล้ว

มันอยู่ใน Github: https://github.com/spamzero/spamzero

ช่วยให้คุณสร้างกฎขั้นสูงทุกประเภทที่คุณสามารถจับคู่กับโฟลเดอร์ข้อความสแปมของคุณได้ดังนั้นข้อความที่เป็นสแปมจะถูกล้างออกโดยอัตโนมัติ


1
คำตอบของคุณจะดีขึ้นถ้าคุณใส่คำอธิบายสั้น ๆ ของสคริปต์ที่เน้นว่ามันจะช่วยจัดการข้อความด้วยอิโมจิเคลื่อนไหวในเรื่องได้อย่างไร
Rubén

4
ฉันเห็นด้วยกับ @ Rubénยิ่งมีข้อมูลดีกว่า เนื่องจากช่วยให้ผู้อ่านได้คำตอบที่มีชีวิต 'โดยไม่ต้องกระโดดผ่านห่วงมากเกินไป
Michelfrancis Bustillos

ขอบคุณสำหรับสคริปต์นี้! บางครั้งโซลูชันที่มีประโยชน์ที่สุดคือวิธีที่ช่วยลดความรำคาญในชีวิตประจำวันเช่นสแปมที่มีการเคลื่อนไหว ฉันขอแนะนำให้เพิ่ม Github README ลิงก์นี้สำหรับGoogle Apps Script Quickstartเพื่อให้ผู้ใช้ที่ไม่มีประสบการณ์ในการใช้สคริปต์ทราบถึงวิธีเปิดใช้งาน Gmail API และดูบันทึก
แดน

1

นี่ไม่ใช่สิ่งที่คุณต้องการ (กรอง emojis เองแทนที่จะเป็นข้อความที่มี emojis) แต่คุณอาจพบว่าเนื้อหาบางอย่างมีประโยชน์สำหรับการสร้างตัวกรองข้อความที่ดีขึ้น

ขณะนี้มีผู้ใช้ Greasemonkey / Tampermonkey / Violentmonkey ผู้ใช้โอเพนซอร์สเพื่อกำจัดแมลงสาบที่น่ารำคาญเหล่านั้น (แค่ตัวละครไม่ใช่ตัวอักษรเอง):

Gmail หัวเรื่อง Line Emoji Roach Motel

เมื่อมองดูที่มาของสคริปต์คุณจะเห็นว่ามีอีโมจิแมลงสาบสองประเภทที่คุณจะพบในอีเมลจากนักการตลาดที่ไม่เหมาะสม (ทุกวันนี้รวมถึง eBay และ Amazon เศร้า):

  • แมลงสาบ HTML-image (รวมถึงภาพเคลื่อนไหวที่น่ากลัว) aka goomoji

  • แมลงสาบ Unicode: ยังมีอีโมจิจำนวนมาก (และลำดับ Unicode อื่น ๆ ที่สร้างภาพ) ที่นักส่งสแปมและนักการตลาดคนอื่น ๆ เริ่มใช้ในหัวเรื่องอีเมลและ gmail ไม่ได้แปลงเป็นภาพ HTML ในบางเบราว์เซอร์สิ่งเหล่านี้จะแสดงเป็นตัวหนาและมีสีซึ่งเกือบจะไม่ดีเท่ากับภาพเคลื่อนไหว เบราว์เซอร์สามารถเลือกที่จะเคลื่อนไหวสิ่งเหล่านี้ได้ แต่ฉันไม่รู้ว่ามีอะไรบ้าง ลำดับ Unicode เหล่านี้แสดงโดยเบราว์เซอร์เป็นข้อความ Unicode ดังนั้นลักษณะที่แน่นอน (สีหรือไม่เคลื่อนไหวหรือไม่ ... ) ขึ้นอยู่กับระบบการแสดงผลข้อความที่เบราว์เซอร์ใช้ การปรากฏตัวของ Unicode อิโมจิที่กำหนดนั้นยังขึ้นอยู่กับตัวเลือกชุดรูปแบบ Unicode และตัวดัดแปลงอีโมจิที่ปรากฏอยู่ใกล้กับมันในลำดับจุดรหัส Unicode ซึ่งแตกต่างจากสแปมอิโมจิที่ใช้รูปภาพลำดับเหล่านี้สามารถคัดลอกและวางจากเบราว์เซอร์และไปยังแอปอื่น ๆ เป็นข้อความ Unicode

สำหรับประเภทหลังนั้น userscript จะมีนิพจน์ทั่วไปที่ออกแบบมาเพื่อจับภาพลำดับ Unicode ที่น่าจะถูกใช้โดยนักการตลาด regex มีลักษณะเช่นนี้ในจาวาสคริปต์ ES6 (userscript แปลสิ่งนี้เป็นเรกคอร์ดรุ่นก่อน ES6 ที่รองรับอย่างกว้างขวางโดยใช้Transpiler ES6 Regex ที่น่าทึ่ง):

var re = /(\p{Emoji_Modifier_Base}\p{Emoji_Modifier}?|\p{Emoji_Presentation}|\p{Emoji}\uFE0F|[\u{2100}-\u{2BFF}\u{E000}-\u{F8FF}\u{1D000}-\u{1F5FF}\u{1F650}-\u{1FA6F}\u{F0000}-\u{FFFFF}\u{100000}-\u{10FFFF}])\s*/gu

// which includes the Unicode Emoji pattern from
//   https://github.com/tc39/proposal-regexp-unicode-property-escapes
// plus also these blocks frequently used for spammy emojis
// (see https://en.wikipedia.org/wiki/Unicode_block ):
//   U+2100..U+2BFF     Arrows, Dingbats, Box Drawing, ...
//   U+E000..U+F8FF     Private Use Area (gmail generates them for some emoji)
//   U+1D000..U+1F5FF   Musical Symbols, Playing Cards (sigh), Pictographs, ...
//   U+1F650..U+1FA6F   Ornamental Dingbats, Transport and Map symbols, ...
//   U+F0000..U+FFFFF   Supplementary Private Use Area-A
//   U+100000..U+10FFFF Supplementary Private Use Area-B
// plus any space AFTER the discovered emoji spam
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.