สแปมบอททำงานอย่างไร


43

ฉันมีฟอรัมที่ได้รับผลกระทบจำนวนมากจากสแปมบอทในฟอรัมและแน่นอนว่าวิธีที่ดีที่สุดในการเอาชนะบางสิ่งก็คือการรู้จักศัตรูของเจ้า ฉันจะกังวลเกี่ยวกับการเอาชนะสแปมบอทเหล่านั้นในภายหลัง แต่ตอนนี้ฉันต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับพวกเขา อ่านรอบ ๆ ฉันรู้สึกประหลาดใจกับการขาดข้อมูลอย่างละเอียดเกี่ยวกับเรื่อง (หรือบางทีความไม่สามารถของฉันในการป้อนคำค้นหาที่ถูกต้องเพื่อผลลัพธ์ google ที่ดีขึ้น)

ฉันสนใจเรียนรู้เกี่ยวกับสแปมบอท ฉันถามคำถามในฟอรัมอื่นและได้รับคำตอบที่ถูกต้องเช่น "สแปมบอทเป็นผู้ใช้ที่ลงทะเบียนบนไซต์ของคุณเสมอ"

  • สแปมบอทในฟอรัมทำงานอย่างไร
  • พวกเขาหาหน้า 'การลงทะเบียนผู้ใช้ใหม่' ได้อย่างไร (ฉันประหลาดใจเป็นพิเศษเพราะบางฟอรัมไม่มี URL เฉพาะสำหรับสิ่งนี้เช่น www.forum.com/register.html แต่ใช้สตริงการสืบค้นหรือแม้แต่วิธีอื่นที่มองไม่เห็นในแถบ URL)
  • พวกเขารู้ได้อย่างไรว่าจะต้องป้อนข้อมูลใดในฟิลด์ 'การลงทะเบียนผู้ใช้ใหม่' แต่ละฟิลด์
  • พวกเขาจะกำหนดได้อย่างไรว่าหน้าใดที่พวกเขาสามารถสแปม / ป้อนข้อมูลและสิ่งที่ไม่ได้?
  • พวกเขา 'ดู' หน้านี้เลยหรือไม่?
  • .. ถ้าไม่เช่นนั้นฉันจะถือว่าพวกเขากำลังสื่อสารกับเซิร์ฟเวอร์โดยตรง - เป็นอย่างไร - เป็นไปได้หรือไม่ พวกเขาทำมันได้อย่างไร?
  • สแปมบอทในฟอรัมสามารถทำลาย CAPTCHAs ได้หรือไม่? พวกเขาสามารถแก้คำถามเชิงตรรกะได้อย่างไร? คำถามคณิตศาสตร์?
  • พวกเขาทำ reverse-engineer สคริปต์ตรวจสอบ anti-bot ฝั่งไคลเอ็นต์หรือไม่? สคริปต์ฝั่งเซิร์ฟเวอร์
  • เทคนิคใดที่ยังคงใช้ได้เพื่อป้องกันพวกเขา
  • สแปมบอทมาจากไหน? มีใครบางคนนั่งอยู่ข้างหลังคอมพิวเตอร์ที่กำลังจ้องเขม็งดูเว็บไซต์ที่ทำลายบอทหลังจากไซต์หรือไม่ หรือพวกเขากำลังคิกคักขณะที่พวกเขาเพียงแค่ 'ปล่อย' มันลงบนอินเทอร์เน็ตอย่างใด? สแปมบอท 'ถูกใช้งาน' โดยคอมพิวเตอร์ที่ติดไวรัสอยู่ที่ไหน? พวกเขาทำซ้ำตัวเอง?
  • ฯลฯ

คำตอบ:


48

พวกเขาหาหน้า 'การลงทะเบียนผู้ใช้ใหม่' ได้อย่างไร (ฉันประหลาดใจเป็นพิเศษเพราะบางฟอรัมไม่มี URL เฉพาะสำหรับสิ่งนี้เช่น www.forum.com/register.html แต่ใช้สตริงการสืบค้นหรือแม้แต่วิธีอื่นที่มองไม่เห็นในแถบ URL)

พวกเขาค้นหาเว็บไซต์ใหม่โดย:

  • การรวบรวมข้อมูลและค้นหาลายเซ็นของซอฟต์แวร์ที่รู้จัก โดยปกตินี่เป็นตัวอย่างของข้อความเช่นลิขสิทธิ์หรือเมตาแท็ก แต่อาจเป็นตัวระบุที่สอดคล้องกัน โดยปกติจะใช้กับซอฟต์แวร์บล็อกและฟอรัม
  • การรวมคู่มือ มนุษย์ซึ่งมีแรงงานราคาถูกในหลาย ๆ ส่วนของโลกมองหาซอฟต์แวร์หรือรูปแบบที่รู้จักซึ่งสามารถนำไปใช้ประโยชน์ได้ง่ายและเพิ่มลงในฐานข้อมูล สิ่งนี้มักใช้กับการลงทะเบียนแบบกำหนดเองและแบบฟอร์มการติดต่อ
  • พวกเขาซื้อรายการ เช่นเดียวกับที่อยู่อีเมลถูกขายโดยผู้ส่งอีเมลขยะรายชื่อเว็บไซต์เป้าหมายที่มีช่องโหว่หรือเป็นที่ต้องการนั้นก็ถูกขายเช่นกัน

พวกเขารู้ได้อย่างไรว่าจะต้องป้อนข้อมูลใดในฟิลด์ 'การลงทะเบียนผู้ใช้ใหม่' แต่ละฟิลด์

พวกเขารู้ว่าต้องป้อนอะไรในแต่ละฟิลด์โดยใช้ชื่อฟิลด์เป็นแนวทาง 99.99% ของเวลาที่ฟิลด์ที่อยู่อีเมลชื่อ "อีเมล" หรือบางอย่างที่มีคำว่า "อีเมล" คุณไม่จำเป็นต้องเป็นนักวิทยาศาสตร์จรวดที่จะรู้ว่าฟิลด์นั้นอาจเป็นที่อยู่อีเมล สำหรับสิ่งต่าง ๆ เช่นชื่อล็อกอิน ID ที่อยู่ ฯลฯ มันทำงานบนหลักการเดียวกัน

พวกเขาจะกำหนดได้อย่างไรว่าหน้าใดที่พวกเขาสามารถสแปม / ป้อนข้อมูลและสิ่งที่ไม่ได้?

พวกเขาไม่สนใจ เครื่องมืออัตโนมัติสามารถลองได้หลายรูปแบบในช่วงเวลาสั้น ๆ โดยแทบไม่มีค่าใช้จ่ายดังนั้นการลองใช้ทุกรูปแบบที่เป็นไปได้นั้นไม่ใช่เรื่องง่ายที่จะทำ เมื่อแรงงานของมนุษย์มีส่วนร่วมพวกเขาสามารถเป็น "ตัวย่อสคริปต์" และลองสิ่งที่ชัดเจนเพื่อดูว่าพวกเขาได้รับการตอบสนองใด ๆ ที่บ่งชี้ว่ารูปแบบอาจมีความเสี่ยง โดยทั่วไปรูปแบบใด ๆ จะเป็นเป้าหมายที่เป็นไปได้เช่นเดียวกับหน้าใด ๆ ที่ยอมรับอินพุตของผู้ใช้

สแปมบอทในฟอรัมทำงานอย่างไร

พวกเขา 'ดู' หน้านี้เลยหรือไม่? .. ถ้าไม่เช่นนั้นฉันจะถือว่าพวกเขากำลังสื่อสารกับเซิร์ฟเวอร์โดยตรง - เป็นอย่างไร - เป็นไปได้หรือไม่ พวกเขาทำมันได้อย่างไร?

สแปมบอทมาจากไหน? มีใครบางคนนั่งอยู่ข้างหลังคอมพิวเตอร์ที่กำลังจ้องเขม็งดูเว็บไซต์ที่ทำลายบอทหลังจากไซต์หรือไม่ หรือพวกเขากำลังคิกคักขณะที่พวกเขาเพียงแค่ 'ปล่อย' มันลงบนอินเทอร์เน็ตอย่างใด? สแปมบอท 'ถูกใช้งาน' โดยคอมพิวเตอร์ที่ติดไวรัสอยู่ที่ไหน? พวกเขาทำซ้ำตัวเอง?

มันเป็นแบบอัตโนมัติทั้งหมด เครื่องมือเช่นxrumerถูกสร้างขึ้นและขายและมีความสามารถในการใช้ประโยชน์จากซอฟต์แวร์ที่มีช่องโหว่ที่รู้จัก ทุกคนสามารถซื้อได้และหลังจากการตั้งค่ามันเป็นไฟมากหรือน้อยและลืม มันจะไปที่ฟอรัมทั้งหมดในรายการและพยายามสแปมให้มากที่สุดเท่าที่จะทำได้ เพียงเพราะกำลังดุร้ายมันประสบความสำเร็จและคุ้มค่าสำหรับผู้ส่งอีเมลขยะ นั่นเป็นเหตุผลที่พวกเขาไม่เคยหยุด พวกเขาแทบจะไม่ต้องยกนิ้วให้มันทำงาน

สแปมบอทในฟอรัมสามารถทำลาย CAPTCHAs ได้หรือไม่? พวกเขาสามารถแก้คำถามเชิงตรรกะได้อย่างไร? คำถามคณิตศาสตร์?

ใช่ แต่ไม่เสมอไป ขึ้นอยู่กับว่าจะนำไปใช้อย่างไร แต่แคปช่าหลายแห่งรวมถึงที่เสนอโดย บริษัท ใหญ่ ๆ นั้นถูกตีและไร้ประโยชน์อย่างมีประสิทธิภาพ นั่นเป็นสาเหตุที่ต้องมีการปกป้องหลายรูปแบบเพื่อหยุดยั้ง ถึงอย่างนั้นมนุษย์ก็สามารถเอาชนะระบบใดก็ได้

เทคนิคใดที่ยังคงใช้ได้เพื่อป้องกันพวกเขา

จากคำตอบก่อนหน้า : คุณสามารถทำสิ่งต่าง ๆ (และควรทำมากกว่าหนึ่ง) รวมถึง:

1) การใส่ฟิลด์ปลอมที่บอทเท่านั้นจะเห็น ถ้าฟิลด์นั้นถูกส่งพร้อมกับแบบฟอร์มที่เหลือคุณสามารถเพิกเฉยได้ (และแบนถ้าต้องการ) นอกจากนี้คุณยังสามารถบอทกับดักที่ไม่ดีที่ทำตามการเชื่อมโยงที่ซ่อนอยู่

2) ใช้ CAPATCHA เช่นreCAPTCHA

3) ใช้ฟิลด์ที่ต้องการให้ผู้ใช้ตอบคำถามเช่นอะไรคือ 5 + 3 มนุษย์ทุกคนสามารถตอบคำถามได้ แต่บอทจะไม่รู้ว่าต้องทำอย่างไรเนื่องจากเป็นฟิลด์ที่มีการเติมข้อมูลโดยอัตโนมัติตามชื่อฟิลด์ ดังนั้นฟิลด์นั้นจะไม่ถูกต้องหรือหายไปซึ่งในกรณีนี้การส่งจะถูกปฏิเสธ

4) ใช้โทเค็นและใส่ลงในเซสชั่นและเพิ่มไปยังแบบฟอร์ม หากโทเค็นไม่ได้ถูกส่งมาพร้อมกับแบบฟอร์มหรือไม่ตรงกันก็เป็นไปโดยอัตโนมัติและสามารถละเว้น

5) ค้นหาการส่งซ้ำจากที่อยู่ IP เดียวกัน หากแบบฟอร์มของคุณไม่ได้รับคำขอมากเกินไป แต่ทันใดนั้นอาจเป็นเพราะบอตกำลังถูกโจมตีและคุณควรพิจารณาบล็อกที่อยู่ IP ชั่วคราว

6) การใช้Akismet เป็นการดีที่จะระบุสแปม


5
+1 สำหรับคำตอบอย่างละเอียด ฉันมีปัญหาสแปมและนำองค์ประกอบแบบฟอร์มที่ซ่อนไปใช้และเรียกว่า "อีเมล" / "จดหมาย" และการป้อนที่อยู่อีเมลจริงฉันชื่อ "ที่อยู่" ไม่มีจดหมายขยะ!
มี.ค.

1
โพสต์ที่ดีเกี่ยวกับวิธีการจัดการกับโทรลล์ (ความคิดที่จะเหมือนกันสำหรับสแปมบอท): codinghorror.com/blog/2011/06/suspension-ban-or-hellban.html
ercpe

สำหรับ captchas นั้นขึ้นอยู่กับเครื่องมือที่พวกเขาใช้เพื่อเอาชนะพวกเขา มีโปรแกรมซอฟต์แวร์ที่บางครั้ง (และไม่เสมอไป) ผ่าน captchas แล้วมีบริการที่ใช้แรงงานราคาถูกเพื่อแก้ปัญหา captchas และสิ่งเหล่านี้มีอัตราความสำเร็จสูงกว่า
ub3rst4r

11

สแปมบอทในฟอรัมทำงานอย่างไร

โปรแกรมเมอร์ที่มีความสามารถ (ถ้าชั่วร้าย) เขียนพวกเขา - อาจมีหลายประเภทของสแปมบอทที่มีคนเขียน แต่โชคไม่ดีที่ใช้เวลาเพียงไม่กี่ผู้เขียนสแปมบอทแบ่งปันและขายงานของพวกเขาเพื่อทำลายชีวิตสำหรับผู้ดูแลระบบ ...

แอปพลิเคชันสแปมยอดนิยมอันดับหนึ่งเรียกว่า "xrumer"

ในขณะที่ฉันรู้ว่าสิ่งนี้ไม่ได้ตอบคำถามของคุณทั้งหมดฉันคิดว่ามีการกล่าวถึงว่า ธ ปท. ไม่สามารถทำได้ดี (เช่นการแก้คำถามตรรกะที่ไม่คงที่ซับซ้อน) สามารถทำได้โดยคนงานที่มีรายได้ต่ำ การส่งสแปมเป็นธุรกิจที่ไม่เหมือนใครและไม่มีปัญหาเรื่องแรงงานราคาถูกที่จะนำไปสู่การส่งข้อความสแปมออกไป


4
ฉันรู้สึกเหมือนฉันเห็นวัวกำลังถูกแปรรูปในโรงงานเนื้อสัตว์ แต่ให้ข้อมูลสูง
rlb.usa

วิดีโอที่น่าสนใจตลกที่มันถูกสร้างขึ้นวันก่อนวันคริสต์มาส; วันที่คือ 12-25-2006 12:15 น. ... :-)
ความผิดพลาด

Ack! เห็นได้ชัดว่าไม่ได้มีความสามารถ ... โปรแกรมนั้นเตือนฉันเกี่ยวกับ FriendBlaster (เราเคยใช้มันในที่ทำงาน - ฉันทำผิด แต่เจ้านายไม่ยอมฟัง) ฉันไม่สงสัยเลยว่าเวลาและความพยายามของผู้เขียนจะเข้าสู่โปรแกรมอย่างไร แต่จริงๆแล้วไม่มีสิ่งใดที่กำลังดำเนินการเป็นเรื่องยากที่จะดำเนินการ (และนำไปใช้อย่างไม่ดีในกรณีของ FriendBlaster) สิ่งที่น่าประทับใจยิ่งกว่าคือนักแฮกเกอร์และนักวิจัยด้านความปลอดภัยที่พัฒนาช่องโหว่และทำลายแผนการ DRM ภายในไม่กี่สัปดาห์หลังจากที่เปิดตัว
Lèsemajesté

2

ฉันสร้างปลั๊กอินต่อต้านสแปมสำหรับ WordPressมันบล็อกสแปมได้ค่อนข้างดีหากไม่มีแคปต์ชาหรืออย่างอื่น

มันทำงานอย่างไร: มีการเพิ่มสองเขตข้อมูลพิเศษในแบบฟอร์มความคิดเห็น แรกคือคำถามเกี่ยวกับปีปัจจุบัน ประการที่สองควรจะว่างเปล่า หากผู้ใช้เยี่ยมชมเว็บไซต์ฟิลด์แรกจะตอบโดยอัตโนมัติด้วย javascript ฟิลด์ที่สองเว้นว่างไว้และทั้งสองฟิลด์จะถูกซ่อนไว้และไม่ปรากฏให้ผู้ใช้เห็น หากผู้ส่งสแปมพยายามส่งแบบฟอร์มแสดงความคิดเห็นเขาจะทำผิดกับคำตอบในฟิลด์แรกหรือพยายามส่งฟิลด์ว่างและความคิดเห็นจากสแปมจะถูกปฏิเสธ ผู้ใช้ไม่จำเป็นต้องป้อนแคปต์ชาหรือสิ่งอื่นใดเพื่อพิสูจน์ว่าไม่ใช่บอททุกอย่างทำด้วยจาวาสคริปต์

คุณสามารถดาวน์โหลดปลั๊กอินและใช้รหัสเพื่อแก้ปัญหาสแปมบนไซต์ของคุณ


1
ดังนั้นผู้ใช้ของคุณต้องการจาวาสคริปต์เพื่อให้สามารถลงทะเบียนได้? นั่นคือการสูญเสียการเข้าถึงใช่ไหม?
Augustin Riedinger

@AugustinRiedinger ปลั๊กอินป้องกันสแปมที่ปิดการใช้งานจาวาสคริปต์นั้นใช้งานได้ง่ายเหมือนวิธี captha มีผู้ใช้งานจาวาสคริปต์ปิดใช้งานน้อยกว่า 2%
webvitaly

คุณหมายถึงคุณจะแสดงภาพทดสอบในกรณีนั้นใช่ไหม ฉันรู้ว่ามันมีผู้ใช้งานน้อยมากที่นั่น แต่ฉันคิดในแง่ของการปฏิบัติที่ดีที่สุด อ่านสิ่งที่น่าสนใจเกี่ยวกับเรื่องนี้
Augustin Riedinger

@AugustinRiedinger ใช่ฉันแสดงคำถามที่คล้ายกับ captcha เกี่ยวกับปีปัจจุบันหากผู้ใช้ปิดการใช้งานจาวาสคริปต์
webvitaly

0

เมื่อพยายามที่จะเอาชนะพวกเขาสิ่งหนึ่งที่ผมจะเก็บไว้ในใจก็คือว่าวัตถุประสงค์ของพวกเขาคือมักจะโพสต์ลิงก์ไปยังเว็บไซต์จำนวนมากที่เป็นไปได้เพื่อประโยชน์ SEO หมวกดำ

พวกเขาสนใจเกี่ยวกับจำนวนเว็บไซต์ที่พวกเขาเข้าถึงและไม่ใช่ไซต์ของคุณโดยเฉพาะ บางคนต้องการสแปมเพียงไซต์ของคุณเพียงอย่างเดียวก็สามารถลงทะเบียนได้โดยไม่ต้องใช้หุ่นยนต์

ด้วยเหตุนี้ฉันค่อนข้างมั่นใจว่าการทดสอบแบบ bespoke ที่ดี (เช่นคำถามที่สมาชิกฟอรัมของคุณจะรู้คำตอบ) เกือบจะมีประสิทธิภาพมากกว่าโรบอตมากกว่าที่เขียนไว้ล่วงหน้าซึ่งโรบอตน่าจะฉลาด ไปยัง

ตัวอย่างเช่นถ้าหุ่นยนต์ถอดรหัส Recaptcha มันจะสามารถเข้าถึงสแปมได้หลายล้านรูปแบบ ถ้ามันทำการทดสอบแบบ bespoke มันจะเข้าถึงได้แค่เว็บไซต์เดียวเท่านั้นดังนั้นจึงไม่มีบอทสแปมอัตโนมัติจะรบกวนการทำเช่นนั้น

https://www.projecthoneypot.orgอาจให้ข้อมูลที่ดีในการใช้ (เช่นคำหลักและ ips เพื่อบล็อก)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.