การโจมตี 404 ครั้งใหญ่ด้วย URL ที่ไม่มีอยู่จริง จะป้องกันได้อย่างไร


14

ปัญหานี้เกิดจากข้อผิดพลาด 404 ข้อตามที่รายงานโดย Google Webmaster Tools พร้อมหน้าและข้อความค้นหาที่ไม่เคยมีมาก่อน หนึ่งในนั้นคือviewtopic.phpและฉันยังสังเกตเห็นจำนวนครั้งที่น่ากลัวในการตรวจสอบว่าไซต์นั้นเป็นไซต์ WordPress ( wp_admin) และสำหรับการเข้าสู่ระบบ cPanel หรือไม่ ฉันบล็อก TRACE แล้วและเซิร์ฟเวอร์นั้นมีการป้องกันการสแกน / แฮ็ค อย่างไรก็ตามดูเหมือนว่าจะไม่หยุด ผู้อ้างอิงเป็นไปตาม Google totally.meWebmaster,

ฉันได้มองหาวิธีที่จะหยุดสิ่งนี้เพราะมันไม่ได้เป็นสิ่งที่ดีสำหรับผู้ใช้งานจริงที่ไม่ดี

ฉันใช้ Perishable Press mini black list ( พบได้ที่นี่ ) ตัวบล็อกผู้อ้างอิงมาตรฐาน (สำหรับสื่อลามก, สมุนไพร, เว็บไซต์คาสิโน) และแม้แต่ซอฟต์แวร์เพื่อปกป้องไซต์ (การบล็อก XSS, การฉีด SQL ฯลฯ ) เซิร์ฟเวอร์กำลังใช้การวัดอื่นเช่นกันดังนั้นใครจะคิดว่าไซต์นั้นปลอดภัย (หวังว่า) แต่มันจะไม่สิ้นสุด

ใครบ้างมีปัญหาเดียวกันหรือฉันเป็นคนเดียวที่เห็นสิ่งนี้? มันเป็นสิ่งที่ฉันคิดว่าเช่นการโจมตีบางอย่าง? มีวิธีแก้ไขหรือป้องกันการสูญเสียทรัพยากรที่ไร้ประโยชน์นี้หรือไม่

แก้ไข ฉันไม่เคยใช้คำถามเพื่อขอบคุณสำหรับคำตอบและหวังว่าจะสามารถทำได้ ขอบคุณทุกคำตอบที่ลึกซึ้งซึ่งช่วยให้ฉันสามารถหาทางออกได้ ฉันได้ปฏิบัติตามคำแนะนำของทุกคนและดำเนินการดังต่อไปนี้:

  • น้ำผึ้ง
  • สคริปต์ที่รับฟังข้อสงสัย URL ในหน้า 404 และส่งอีเมลพร้อมตัวแทนผู้ใช้ / ip ในขณะที่ส่งคืนส่วนหัว 404 มาตรฐาน
  • สคริปต์ที่ให้รางวัลแก่ผู้ใช้ที่ถูกต้องตามกฎหมายในหน้าเว็บที่กำหนดเอง 404 รายการในกรณีที่ผู้ใช้คลิกที่หนึ่งใน URL เหล่านั้น ภายในเวลาไม่ถึง 24 ชั่วโมงฉันสามารถแยกไอพีที่น่าสงสัยบางอย่างซึ่งอยู่ในรายการ Spamhaus IP ที่บันทึกไว้ทั้งหมดเป็นของ บริษัท โฮสติ้ง VPS สแปม

ขอบคุณทุกคนอีกครั้งฉันจะยอมรับคำตอบทั้งหมดถ้าทำได้


เมื่อ Google Webmaster Tools แจ้งว่าผู้อ้างอิงนั้นเป็นคุณโดยสิ้นเชิงคุณหมายถึงพวกเขากำลังระบุว่าหน้าต่างๆในเว็บไซต์ของคุณเป็นหน้าอ้างอิงหรือไม่
Stephen Ostermiller

ขอโทษที่ฉันทำผิด ฉันมีหน้าเว็บเหล่านี้ซึ่งไม่เคยมีอยู่ในเครื่องมือเว็บมาสเตอร์และ Google บอกว่าไม่พบ หนึ่งในนั้นคือ mysite.com/viewtopic.php?forget_the_value=1 และมีการเชื่อมโยงจาก Tot.me.I ฉันคลิกแม้แต่ ... ไม่พบอะไรเลย
tattvamasi

2
เป็นเรื่องปกติที่จะได้รับ 404 จำนวนมากในบันทึกการเข้าถึงของคุณสำหรับเพจที่ไม่มีอยู่ตรวจสอบหาช่องโหว่ (เช่นผู้ดูแลระบบ WP) เป็นต้น - คุณเพียงแค่ต้องทำให้แน่ใจว่าเว็บไซต์ของคุณปลอดภัย อย่างไรก็ตามเพื่อให้รายงานเหล่านี้โดย GWT อาจมีลิงก์ไปยังหน้าเหล่านี้หรือมีเว็บไซต์ก่อนหน้านี้ (เช่น WordPress) โฮสต์ในโดเมนของคุณหรือไม่
MrWhite

Nope สิ่งที่ตลกคือฉันไม่เคยใช้เวิร์ดเพรสและฉันไม่เคยใช้หน้าเว็บที่ฉันเคยเห็นว่าเป็นข้อผิดพลาด 404 ข้อ ข้อผิดพลาดบางอย่างที่ฉันทำ (URL ที่สะกดผิดในลิงก์ขาเข้าจากหน้าหนึ่งไปอีกหน้าหนึ่ง) แต่ไฟล์ viewtopic.php ไม่เคยมีมาก่อน ไซต์นั้นมีมานานหลายปีแล้ว ...
tattvamasi

เมื่อผมบอกว่า "การเชื่อมโยงไปยังหน้าเว็บเหล่านี้" ผมหมายถึงจากเว็บไซต์อื่นสำหรับข้อผิดพลาด 404 แต่ละรายการของคุณ (เป็น GWT) คุณควรจะสามารถเจาะลึกเพื่อแสดงให้คุณเห็นว่า "ลิงก์มาจากไหน"
MrWhite

คำตอบ:


17

ฉันมักจะเห็นไซต์อื่นที่ลิงก์ไปยังหน้าเว็บจำนวนมากบนไซต์ของฉันที่ไม่มีอยู่ แม้ว่าคุณจะคลิกที่หน้านั้นและไม่เห็นลิงค์:

  • ไซต์อาจเคยมีลิงก์เหล่านั้นมาก่อน
  • ไซต์อาจปิดบังและให้บริการลิงก์เหล่านั้นเฉพาะกับ Googlebot และไม่ใช่สำหรับผู้เยี่ยมชม

มันเป็นการสิ้นเปลืองทรัพยากร แต่มันจะไม่ทำให้ Google สับสนและมันจะไม่ส่งผลเสียต่ออันดับของคุณ นี่คือสิ่งที่ John Mueller ของ Google (ที่ทำงานกับเครื่องมือของผู้ดูแลเว็บและแผนผังไซต์) ได้กล่าวถึงข้อผิดพลาด 404 ข้อที่ปรากฏในเครื่องมือของผู้ดูแลเว็บ :

ช่วยด้วย! เว็บไซต์ของฉันมีข้อผิดพลาด 939 CRAWL !! 1

ฉันเห็นคำถามแบบนี้หลายครั้งต่อสัปดาห์ คุณไม่ได้อยู่คนเดียว - เว็บไซต์จำนวนมากมีข้อผิดพลาดในการรวบรวมข้อมูล

  1. ข้อผิดพลาด 404 ของ URL ที่ไม่ถูกต้องจะไม่เป็นอันตรายต่อการจัดทำดัชนีหรือการจัดอันดับเว็บไซต์ของคุณแต่อย่างใด ไม่สำคัญว่าจะมี 100 หรือ 10 ล้านพวกเขาจะไม่เป็นอันตรายต่อการจัดอันดับเว็บไซต์ของคุณ http://googlewebmastercentral.blogspot.ch/2011/05/do-404s-hurt-my-site.html
  2. ในบางกรณีข้อผิดพลาดในการรวบรวมข้อมูลอาจมาจากปัญหาโครงสร้างที่ถูกกฎหมายภายในเว็บไซต์หรือ CMS ของคุณ คุณบอกได้อย่างไร ตรวจสอบที่มาของข้อผิดพลาดในการรวบรวมข้อมูลอีกครั้ง หากมีลิงค์เสียในเว็บไซต์ของคุณใน HTML คงที่ของหน้าของคุณนั่นก็คุ้มค่าที่จะแก้ไขเสมอ (ขอบคุณ+ Martino Mosna )
  3. สิ่งที่เกี่ยวกับ URL ขี้ขลาดที่ "แตกชัดเจน" เมื่ออัลกอริทึมของเราชอบไซต์ของคุณพวกเขาอาจพยายามค้นหาเนื้อหาที่ยอดเยี่ยมเพิ่มเติมบนไซต์ตัวอย่างเช่นโดยพยายามค้นหา URL ใหม่ใน JavaScript หากเราลองใช้“ URL” เหล่านั้นและค้นหา 404 นั่นเป็นสิ่งที่ยอดเยี่ยมและคาดหวัง เราแค่ไม่อยากพลาดทุกสิ่งสำคัญ (แทรก meme ของ Googlebot ที่แนบมามากเกินไปที่นี่) http://support.google.com/webmasters/bin/answer.py?answer=1154698
  4. คุณไม่จำเป็นต้องแก้ไขข้อผิดพลาดในการรวบรวมข้อมูลในเครื่องมือของผู้ดูแลเว็บ คุณลักษณะ "ทำเครื่องหมายว่าตายตัว" มีไว้เพื่อช่วยคุณเท่านั้นหากคุณต้องการติดตามความคืบหน้าของคุณที่นั่น มันไม่เปลี่ยนแปลงอะไรในระบบค้นหาบนเว็บของเราดังนั้นคุณสามารถเพิกเฉยได้หากคุณไม่ต้องการ http://support.google.com/webmasters/bin/answer.py?answer=2467403
  5. เราแสดงรายการข้อผิดพลาดในการรวบรวมข้อมูลในเครื่องมือของผู้ดูแลเว็บตามลำดับความสำคัญซึ่งขึ้นอยู่กับหลายปัจจัย หากหน้าแรกของข้อผิดพลาดในการรวบรวมข้อมูลไม่ชัดเจนอย่างชัดเจนคุณอาจไม่พบข้อผิดพลาดการรวบรวมข้อมูลที่สำคัญในหน้าต่อไป http://googlewebmastercentral.blogspot.ch/2012/03/crawl-errors-next-generation.html
  6. ไม่จำเป็นต้อง“ แก้ไข” ข้อผิดพลาดในการรวบรวมข้อมูลในเว็บไซต์ของคุณ การค้นหา 404 เป็นเรื่องปกติและคาดว่าจะเป็นเว็บไซต์ที่มีการกำหนดค่าที่ดี หากคุณมี URL ใหม่ที่เทียบเท่าการเปลี่ยนเส้นทางไปยัง URL นั้นเป็นวิธีปฏิบัติที่ดี มิฉะนั้นคุณไม่ควรสร้างเนื้อหาปลอมคุณไม่ควรเปลี่ยนเส้นทางไปยังหน้าแรกของคุณคุณไม่ควร robots.txt ไม่อนุญาต URL เหล่านี้ - สิ่งเหล่านี้ทำให้เรายากที่จะรับรู้โครงสร้างของเว็บไซต์และดำเนินการอย่างถูกต้อง เราเรียกข้อผิดพลาด“ soft 404” เหล่านี้ http://support.google.com/webmasters/bin/answer.py?answer=181708
  7. ชัดเจน - หากข้อผิดพลาดในการรวบรวมข้อมูลแสดงขึ้นสำหรับ URL ที่คุณสนใจบางที URL ในไฟล์ Sitemap ของคุณนั่นคือสิ่งที่คุณควรดำเนินการทันที หาก Googlebot ไม่สามารถรวบรวมข้อมูล URL ที่สำคัญของคุณพวกเขาอาจหลุดจากผลการค้นหาของเราและผู้ใช้อาจไม่สามารถเข้าถึงได้

ขอบคุณแม้ว่าฉันได้อ่านเกี่ยวกับใครบางคนที่อ้างว่าการโจมตี 404 นั้นส่งผลเสียต่ออันดับของหน้าเว็บ (การอภิปรายในฟอรัม google webmaster ทันทีที่ฉันดึงมันมาฉันจะโพสต์ที่นี่) และบางคนอ้างว่า 404 ข้อผิดพลาด ไม่ได้พูดทุกอย่างคนเหล่านี้อ้างสิทธิ์) ดังนั้นนี่เป็นหนึ่งในข้อกังวลของฉันและคำถามอื่น ๆ ก็คือใครเป็นคนทวีตลิงก์ผิดไปยังเว็บไซต์ของฉันโดยไม่เจตนาและทำไมถ้ามันควรจะทำอะไรกับ SEO? ยอมรับคำตอบแล้ว :)
tattvamasi

totally.me เป็นเว็บไซต์จริง มีเว็บไซต์ขยะมากมายที่ขูดและโพสต์ลิงก์เพื่อดึงดูดผู้ใช้ มันเป็นรูปแบบของการส่งสแปม บางครั้งลิงก์เหล่านี้มีอยู่ในช่วงเวลาสั้น ๆ เท่านั้น ส่วนใหญ่จะทำเพื่อส่งผลให้เครื่องมือค้นหาขนาดเล็กที่มีความซับซ้อนน้อยลงและมีผู้ชมในภูมิภาคมากขึ้นที่พบมากในรัสเซียและโปแลนด์แม้ว่าจะมีอีกหลายคนก็ตาม ลิงก์เช่นนี้มักมาจากฐานข้อมูลที่ผ่านการคัดลอกมาก่อนหน้านี้เพื่อให้ลิงก์เก่าจะกลับมาอีกครั้งและไซต์ใหม่จะครอบตัดเป็นระยะ ไม่มีอะไรที่คุณสามารถทำได้เกี่ยวกับมัน
Closnoc

2
"การโจมตี 404" จะไม่ส่งผลกระทบต่ออันดับของหน้าเว็บไซต์ของคุณหรือการจัดอันดับ (หากคู่แข่งของคุณใช้เวลาในการเชื่อมโยงไปยังหน้าเว็บที่ 404 นั่นเป็นเวลาน้อยกว่าที่พวกเขาใช้ในการทำสิ่งที่มีประโยชน์ดังนั้นจงมีความสุข :)) ไซต์ควรจะมี 404 วินาทีนั่นเป็นสัญญาณว่าคุณได้ตั้งค่าเซิร์ฟเวอร์อย่างถูกต้อง ดังนั้นถ้ามีอะไรมันจะเป็นสัญญาณที่ดีสำหรับเรา
John Mueller

5

มีสคริปต์มากมายที่จะทำการสแกนที่อยู่ IP แบบสุ่มบนอินเทอร์เน็ตเพื่อค้นหาช่องโหว่ที่รู้จักในซอฟต์แวร์ประเภทต่างๆ 99.99% ของเวลาพวกเขาไม่พบสิ่งใด (เหมือนในเว็บไซต์ของคุณ) และ 0.01% ของเวลาสคริปต์จะเขียนเครื่องและทำสิ่งที่ตัวควบคุมสคริปต์ต้องการ โดยทั่วไปแล้วสคริปต์เหล่านี้จะทำงานโดย botnets ที่ไม่ระบุชื่อจากเครื่องที่ก่อนหน้านี้เป็น pwnd ไม่ใช่จากเครื่องจริงของ kiddie ต้นฉบับของสคริปต์

คุณควรทำอะไร?

  1. ตรวจสอบให้แน่ใจว่าเว็บไซต์ของคุณไม่เสี่ยง สิ่งนี้ต้องใช้ความระมัดระวังอย่างต่อเนื่อง
  2. หากสิ่งนี้สร้างภาระมากที่ผลกระทบต่อประสิทธิภาพของเว็บไซต์ปกติให้เพิ่มกฎการบล็อกบน IP เพื่อหลีกเลี่ยงการยอมรับการเชื่อมต่อจากไซต์นั้น ๆ
  3. เรียนรู้วิธีกรองการสแกนสำหรับ CMD.EXE หรือ cPanel หรือ phpMyAdmin หรือช่องโหว่อื่น ๆ จำนวนมากเมื่อดูผ่านบันทึกเซิร์ฟเวอร์ของคุณ

คุณดูเหมือนจะเชื่อว่าทุกคนที่ส่งคืน 404 จากเซิร์ฟเวอร์ของคุณให้กับทุกคนจะส่งผลกระทบต่อสิ่งที่ Google คิดเกี่ยวกับเว็บไซต์ของคุณ นี่ไม่เป็นความจริง. โปรแกรมรวบรวมข้อมูลของ Google ที่ส่งคืน 404 เท่านั้นและอาจเป็นผู้ใช้ Chrome จะมีผลกับเว็บไซต์ของคุณ ตราบใดที่ลิงก์ทั้งหมดในเว็บไซต์ของคุณเป็นลิงค์ที่ถูกต้องและคุณไม่ได้ทำให้ลิงก์ที่คุณเคยเปิดเผยแก่โลกนั้นเป็นโมฆะคุณจะไม่เห็นผลกระทบใด ๆ บอทสคริปต์ไม่ได้พูดคุยกับ Google ในทางใดทางหนึ่ง

หากคุณถูกโจมตีด้วยวิธีการที่แท้จริงคุณจะต้องสมัครใช้บริการผู้ให้บริการบรรเทาสาธารณภัยบางประเภท Verisign, Neustar, CloudFlare และ Prolexic เป็นผู้ขายทั้งหมดที่มีแผนหลากหลายรูปแบบสำหรับการโจมตีหลากหลายรูปแบบ - จากเว็บพร็อกซี่ธรรมดา ๆ (ซึ่งอาจเป็นอิสระจากผู้ให้บริการบางราย) ไปจนถึง DNS ที่กรองตามความต้องการ การแกว่งจุดที่มีอยู่ซึ่งส่งการรับส่งข้อมูลทั้งหมดของคุณผ่านศูนย์ข้อมูล "ขัด" ด้วยกฎที่ช่วยลดการโจมตี

แต่ดูเหมือนว่าคุณกำลังดูสคริปต์ช่องโหว่ปกติที่ IP ใด ๆ บนอินเทอร์เน็ตจะดูว่ากำลังฟังบนพอร์ต 80 หรือไม่คุณสามารถใส่เครื่องใหม่เริ่มต้น Apache ว่างเปล่า และภายในไม่กี่ชั่วโมงคุณจะเห็นเส้นเหล่านั้นในบันทึกการเข้าถึง


ขอบคุณมาก - ฉันจะมองหาตัวกรองพิเศษบางอย่างถึงแม้ว่าการป้องกันเซิร์ฟเวอร์และไซต์จะสูงมากจนบางครั้งผู้ใช้ที่ถูกกฎหมายในหน้าต้องห้ามอยู่แล้ว ในการตอบกลับ "โปรแกรมรวบรวมข้อมูลของ Google ที่ส่งคืนโดย 404s และอาจเป็นผู้ใช้ Chrome" ฉันต้องเพิ่มว่าฉันพบลิงก์เหล่านั้นใน Google Webmaster Tools ดังนั้นฉันคิดว่าฉันสามารถสันนิษฐานได้ว่าพวกเขากำลังถูกรวบรวมข้อมูลอย่างปลอดภัย ...
tattvamasi

คุณต้องคิดออกว่าทำไม Google ถึงมีหน้าเว็บที่ไม่มีอยู่จริง ตัวอย่างเช่นหากคุณให้บุคคลภายนอกเข้าสู่บันทึกการเข้าถึงของคุณนั่นจะเป็นวิธีที่ Google จะสามารถเข้าถึงพวกเขาได้ คุณไม่ควรปล่อยให้บุคคลภายนอกเข้ามาเกี่ยวข้อง นอกจากนี้การรักษาความปลอดภัยยังเป็นสิ่งที่ถูกต้องเกี่ยวกับความถูกต้องมากกว่าการป้องกันแบบฮิวริสติกที่คุณเพิ่มไว้ด้านนอก ฉันดู "ปลั๊กอินความปลอดภัย" ของบุคคลที่สามด้วยความสงสัย เมื่อไซต์ทำสิ่งที่ฉันต้องการอย่างแท้จริงและเฉพาะที่ปลอดภัย (ตามคำจำกัดความ)
Jon Watte

3

นี่อาจไม่ใช่การโจมตี แต่เป็นการสแกนหรือโพรบ

ทั้งนี้ขึ้นอยู่กับสแกนเนอร์ / prober มันอาจเป็นพิษเป็นภัยซึ่งหมายความว่ามันเป็นเพียงการมองหาปัญหาในความสามารถในการวิจัยบางประเภทหรืออาจมีฟังก์ชั่นที่จะโจมตีโดยอัตโนมัติหากพบว่ามีการเปิด

เว็บเบราว์เซอร์ใส่ข้อมูลผู้อ้างอิงที่ถูกต้อง แต่โปรแกรมอื่น ๆ ก็สามารถทำสิ่งที่ผู้อ้างอิงต้องการได้

ผู้อ้างอิงเป็นเพียงข้อมูลส่วนหนึ่งที่มีให้โดยโปรแกรมที่เข้าถึงเว็บไซต์ของคุณ มันอาจจะเป็นสิ่งที่พวกเขาเลือกที่จะตั้งค่าให้เช่นหรือtotally.me random.yuมันอาจเป็นเว็บไซต์จริงที่พวกเขาเพิ่งเลือก

คุณไม่สามารถแก้ไขหรือป้องกันได้ หากคุณพยายามปิดกั้นคำขอประเภทนี้ทุกครั้งคุณต้องมีรายการที่มีขนาดใหญ่มากและไม่คุ้มค่า

ตราบใดที่โฮสต์ของคุณยังคงติดตามแพตช์และป้องกันช่องโหว่นี้ไม่ควรทำให้คุณเกิดปัญหาใด ๆ


1
หาก 404 แสดงใน Google WMT แสดงว่ามาจากลิงก์จริง totally.me เป็นเว็บไซต์จริง
Closnoc

ใช่เลยฉันเป็นเว็บไซต์จริงและมีการเชื่อมโยงบางอย่างผิดปกติจากความผิดของฉัน (พิมพ์ผิดในปุ่มทวีต) ขณะนี้มีการเชื่อมโยงจำนวนมากไปยัง viewtopic.php / หน้าใด ๆ ในเว็บไซต์ของฉันที่ฉันสาบานว่าไม่เคยมี ฉันสามารถระบุผู้ใช้ที่ทวีตได้ (ตอนนี้ไม่มีอะไรในหน้านั้น แต่ฉันคิดว่ามีจำนวนมาก) แท็กที่ได้รับความนิยมก็มี URL ที่ผิดโดยเจตนาเช่นกัน สิ่งที่ทำให้ฉันกังวลคือประสบการณ์ของผู้ใช้การใช้ทรัพยากรและเห็นว่า Google กำลังรวบรวมข้อมูลปลอม 404 ฉันไม่สามารถแบนทั้งโลกสำหรับหน้าไม่พบในทางกลับกัน ไม่แน่ใจในสิ่งที่ต้องทำ
tattvamasi

3

แน่นอนมันฟังดูเหมือนบ้าบอ เราได้รับการตอกย้ำเช่นกันโดย IP หลายพันรายในหลาย ๆ โฮสต์ซึ่งส่วนใหญ่ไม่รู้จักกับไซต์ OP ก่อนที่ฉันจะเสนอวิธีแก้ปัญหาที่เป็นประโยชน์มีคำถามหนึ่งข้อที่ฉันมีคือ:

ถาม:คุณเห็น 404 จากเว็บไซต์ของคุณโดยรวมในเครื่องมือเว็บมาสเตอร์ของ Google ได้อย่างไร GWT เป็นผลลัพธ์ของการค้นพบของ Google บอทไม่ใช่ผลลัพธ์ของบอตอื่น ๆ นอกจากนี้บอตอื่น ๆ ที่ไม่ได้เรียกใช้ JS เพื่อการวิเคราะห์ ... คุณมีบางอย่างที่ kinda API ไปที่ GWT ซึ่งคุณสามารถดูสถิติเซิร์ฟเวอร์ของคุณได้หรือไม่? หากไม่เป็นเช่นนั้นอาจเป็นสาเหตุของการเตือนเนื่องจากนี่คือ googlebot เองค้นหาข้อผิดพลาด

  • หากนี่เป็นข้อผิดพลาดเพียงแค่ googlebot สิ่งนี้อาจบ่งบอกว่ามีใครบางคนปลูกลิงค์ไปยังเว็บไซต์ของคุณในฟอรัมและสิ่งต่าง ๆ สำหรับเป้าหมายของบอทคอมพิวเตอร์มนุษย์จริงที่เป็นอันตราย คิดว่าตัวแปลงข้อมูล + ชาวไร่กำลังทำงานอยู่บนเซิร์ฟเวอร์ที่ถูกโจมตีโดยตั้งเป้าหมายไว้มากมายสำหรับ "สัญญาสแปม" ในอนาคตผ่านทางพอร์ทัล

  • หากคุณรู้แน่นอนว่ารายงานสถานะเซิร์ฟเวอร์ทั้งหมดของคุณคุณต้องมีเครื่องมือบางอย่าง แอพและบริการบางอย่างอาจช่วยให้คุณย่อส่วนลงได้ สมมติว่าคุณกำลังเรียกใช้เซิร์ฟเวอร์ linux:

1)เริ่มเพิ่มการละเมิด IP ในบัญชีดำ htaccess ดูเหมือนว่า "ปฏิเสธจาก 192.168.1.1" และจะห้าม 403 รายการ อย่าถูกพาตัวออกไปเพียงแค่ปิดกั้นพวกยักษ์ ตรวจสอบกับเว็บไซต์ในขั้นตอนที่ 4) เพื่อให้แน่ใจว่าพวกเขาไม่ได้เป็นผู้ให้บริการอินเทอร์เน็ตที่แท้จริง คุณสามารถคัดลอกไฟล์นี้และติดไว้ในบัญชี / แอปใด ๆ ที่นอกเหนือจากไฟร์วอลล์ได้

2)ติดตั้ง APF มันง่ายจริงในการจัดการไฟร์วอลล์ผ่าน SSH ใน linux ในขณะที่คุณสร้าง ht ให้เพิ่มใน APF เช่น "apf -d 192.168.1.1" Ht ดูเหมือนซ้ำซ้อนเนื่องจาก APF แต่ Ht เป็นแบบพกพา

3)ติดตั้ง cPanel Hulk และตรวจสอบให้แน่ใจว่าได้ขึ้นบัญชีขาวไอพีของคุณเพื่อไม่ให้ล็อคคุณหากคุณลืมรหัสผ่าน นี่จะเป็นแหล่งที่ดีของ IP ที่จะเพิ่มใน ht + apf มีสมาร์ทบางอย่างเพื่อให้สามารถลดความพยายามในการเข้าสู่ระบบเดรัจฉานอย่างชาญฉลาด

4)เชื่อมต่อกับ stopforumspam.com และ projecthoneypot.org และทำให้โมดูลทำงานได้ ทั้งสองช่วยกันปฏิเสธคำขอที่รู้จักและระบุ + รายงาน brutes / nets / chinaspam ใหม่ มีตัวกรองอีเมลที่คุณสามารถใช้ได้เช่นกัน แต่ gmail นั้นเป็นเจ้าของตัวกรองสแปม

5)เนื่องจากบอทไม่เคยยอมแพ้ให้ปกป้องเส้นทางผู้ดูแลระบบของคุณ หากคุณเรียกใช้ wordpress เปลี่ยนเส้นทางผู้ดูแลระบบเพิ่ม captcha ฯลฯ หากคุณใช้ SSH ให้เปลี่ยนพอร์ตการเข้าสู่ระบบเป็นสิ่งที่ไม่ได้ใช้งานแล้วปิดการเข้าสู่ระบบราก SSH สร้าง "radmin" คุณต้องเข้าสู่ระบบก่อนจากนั้น su สำหรับรูท

  • หมายเหตุเกี่ยวกับ captcha หากคุณเรียกใช้ captcha ของคุณเองในเว็บไซต์ที่มีปริมาณมากและไม่ปฏิเสธบอทที่ระดับไฟร์วอลล์ / ht พวกเขาอาจใช้ค้อนทุบ cpu ของคุณเนื่องจากการสร้างภาพในวิดเจ็ต "antispam" เหล่านั้นทั้งหมด

  • หมายเหตุเกี่ยวกับโหลดหากคุณเรียกใช้ CentOS บนเซิร์ฟเวอร์ของคุณและมีความสามารถ VPS, CloudLinux นั้นยอดเยี่ยมสำหรับการทำให้แข็งและควบคุมโหลด บอกว่าบอทผ่านไปได้ CageFS ก็อยู่ที่นั่นเพื่อ จำกัด มันไว้ในบัญชี สมมติว่าพวกเขาตัดสินใจที่จะ DDoS .... LVE อยู่ที่นั่นเพื่อให้บัญชี (ไซต์) โหลดต่อยอดเพื่อไม่ให้เซิร์ฟเวอร์ของคุณทำงานผิดพลาด มันเป็นการเพิ่มที่ดีในการเน้นระบบทั้งหมดของ "การจัดการเอนทิตีที่ผิดพลาด" :)

แค่ความคิดฉันหวังว่าจะช่วยคุณออก


ขอบคุณ ความจริงที่ว่าฉันเห็นข้อผิดพลาดเหล่านั้นใน Google Webmasters ทำให้ฉันคิดว่า - เมื่อคุณชี้ให้เห็นอย่างถูกต้อง - มีเทคนิค "NSEO" บางอย่าง (การปลูกลิงค์หลายร้อยลิงก์ไปยังเว็บไซต์ของฉันที่ไม่เคยมี) ไซต์นั้นปลอดภัยเนื่องจากการโจมตีประเภทนั้นไม่ได้ทำอะไรเลย ฉันไม่แน่ใจว่าฉันปลอดภัยสำหรับการทำ SEO / ประสบการณ์ผู้ใช้ (ถ้า Google เริ่มทำดัชนีหน้าเว็บที่ไม่มีอยู่ฉันมีปัญหาแล้วข้อผิดพลาดนี้ทำให้เว็บไซต์ติดอันดับ btw) ขอบคุณอีกครั้ง.
tattvamasi

1
Gbot จะไม่สร้างดัชนีหน้า 404 ดังนั้นมันจะไม่ส่งผลกระทบต่อ SEO ของคุณจริงๆ อาจแคชหน้าอื่นที่ส่งปริมาณการใช้งาน แต่ไม่ใช่ของคุณ หากสิ่งนี้กลายเป็นปัญหาสำหรับมนุษย์จริงให้สร้างตัวเปลี่ยนเส้นทางขนาดใหญ่สำหรับลิงก์สองชั้นเช่น wp-admin ทำให้พวกเขาลงจอดอย่างมีมนุษยธรรมเกี่ยวกับสาเหตุที่พวกเขาเห็นหน้านี้ ให้คูปอง "im ขออภัยสำหรับ 404" แก่พวกเขาหากคุณกำลัง ecom เพียงจำไว้ว่าให้ทำเครื่องหมายทั้งหมดไว้ใน GWT ดังนั้นมันจะทำดัชนี + แคช Lander ใหม่ของคุณ เลือกที่จะใส่ blackhole เพื่อ badbots บนมัน โดยไม่คำนึงถึงเตรียมพร้อมสำหรับการเข้าชมโดยตรงหาก spamnet นี้มีลิงก์สำหรับคุณ
dhaupin

ขอบคุณ สำหรับตอนนี้ฉันพยายามที่จะดูว่า 404 ที่อ่อนนุ่มในกรณีที่เกิดข้อผิดพลาดฉันได้สร้างความเสียหายเล็กน้อย หน้า 404 นั้นเป็นเพจที่กำหนดเองอยู่แล้วและจะให้ลิงก์ที่เกี่ยวข้องที่เป็นประโยชน์แก่คุณ (หากสามารถค้นหาได้) ในกรณีที่สะกดผิดโดยฉันฉันกำลังส่งการเปลี่ยนเส้นทาง 301 ไปยังหน้าที่ถูกต้อง (Google เห็นว่าพวกเขานุ่มนวล 404 ฉันคิดว่า) ในกรณีของขยะนี้/RK=0/RS=YkUQ9t4mR3PP_qt7IW8Y2L36PFo-/, /blog/wp-login.php/, /user/create_form/, /m/, /RK=0/RS=lznPhspsSDFHMiuIUDmmo01LA7w-/( ฯลฯ ... ) ฉันกำลังเข้าสู่ระบบของผู้ใช้และกลับ 404 หวังว่าฉันทำมันขวา
tattvamasi

1

คำอธิบายของปัญหา

ก่อนอื่นคุณไม่ใช่คนเดียวที่มีปัญหานี้ - ทุกคนคือ สิ่งที่คุณได้เห็นนั้นเป็นผลมาจากบ็อตอัตโนมัติที่รวบรวมข้อมูล IP ทุกเครื่องและค้นหาช่องโหว่ทั่วไป ดังนั้นโดยทั่วไปแล้วพวกเขาพยายามค้นหาสิ่งที่คุณใช้และถ้าคุณใช้ phpmyadmin พวกเขาจะพยายามรวมรหัสผ่านชื่อผู้ใช้มาตรฐานจำนวนมาก

ฉันประหลาดใจที่สิ่งที่คุณพบในตอนนี้ (คุณอาจเป็นแค่คุณเริ่มเซิร์ฟเวอร์ของคุณ) ปัญหาคือคุณไม่สามารถปิดกั้นที่อยู่ IP ของพวกเขาตลอดไป (ส่วนใหญ่อาจเป็นคอมพิวเตอร์ที่ติดเชื้อและผู้ใช้ที่แท้จริงของเขาไม่ทราบว่ามันกำลังทำอะไรอยู่

ผล SEO

มันไม่มีผลเลย หมายความว่ามีคนพยายามเข้าถึงบางสิ่งบางอย่างบนคอมพิวเตอร์ของคุณและไม่ได้อยู่ที่นั่น

มันสำคัญจริงๆหรือ

แน่นอนว่าคนเหล่านี้พยายามสอบสวนคุณถึงปัญหาบางอย่าง ยิ่งกว่านั้นพวกเขากำลังสูญเสียทรัพยากรของคุณ (เซิร์ฟเวอร์ของคุณจำเป็นต้องตอบสนองในทางใดทางหนึ่ง) และทำการบันทึกไฟล์บันทึกของคุณ

ฉันควรแก้ไขมันอย่างไร

ฉันมีปัญหาเดียวกันกับที่ฉันพยายามแก้ไขและเครื่องมือที่ดีที่สุด (ความเรียบง่ายในการใช้ vs สิ่งที่ฉันสามารถทำได้) ฉันสามารถค้นหาได้คือfail2ban

คุณโชคดีเช่นกันเพราะฉันได้พบวิธีแก้ไขปัญหาเดียวกันแล้วและจัดทำเป็นเอกสารไว้ที่นี่ (ดังนั้นคุณไม่จำเป็นต้องค้นหาวิธีการติดตั้งและวิธีการใช้งาน) ตรวจสอบคำถามของฉันในServerFault แต่โปรดอ่านเกี่ยวกับ fail2ban เล็กน้อยเพื่อให้รู้ว่า


1

เช่นเดียวกับที่หลายคนพูดไปแล้วนี่ไม่ใช่การโจมตี แต่เป็นความพยายามในการสอบสวนหรือสแกนแอปไซต์ของคุณและ / หรือความสามารถของเซิร์ฟเวอร์ของคุณ วิธีที่ดีที่สุดในการกรองทราฟฟิกที่ไร้ประโยชน์เหล่านี้และการสแกนที่อาจเป็นอันตรายคือการใช้ WAF (Web Application Firewall) สิ่งนี้จะจับความพยายามที่แตกต่างกันทั้งหมดและตั้งค่าสถานะพวกเขาและจากนั้นส่งทราฟฟิกที่ถูกต้องตามกฎหมายจริงไปยังเซิร์ฟเวอร์และเว็บแอปของคุณ

คุณสามารถใช้ DNS WAF บนคลาวด์หรืออุปกรณ์เฉพาะ ฉันใช้ Incapsula และ F5 ASM เป็นการส่วนตัวสำหรับเว็บไซต์ลูกค้าที่แตกต่างกัน ค่าใช้จ่ายต่ำเพียง $ 500 ต่อเดือนและช่วยได้อย่างมาก นอกจากนี้ยังให้การปกป้องลูกค้าของคุณได้ดีขึ้นและลดทรัพยากรบนเว็บเซิร์ฟเวอร์ซึ่งจะช่วยให้คุณประหยัดเงินและเพิ่มความเร็วรวมถึงอุปกรณ์เหล่านี้มีการปฏิบัติตาม PCI 6.6 และบทวิจารณ์พร้อมรายงาน

หวังว่านี่จะช่วยได้


หากนี่เป็นเพียง "ความพยายามในการสอบสวน" คุณจะอธิบายความจริงที่ว่า 404s เหล่านี้มีรายงานใน GWT ได้อย่างไร?
MrWhite
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.