ทำไมเว็บไซต์เหล่านี้ถึงโคลนเนื้อหาของฉันและฉันจะหยุดพวกเขาได้อย่างไร


14

ดังนั้นฉันจึงค้นหาเว็บไซต์ของฉันบน Google: http://www.botlibre.com

และด้วยความประหลาดใจของฉันพบบางโคลนของเว็บไซต์ของฉันเช่น:

http://83waystowasteyourtime.adidas.com

และ:

http:// mediaiq.astral.comm

คำถามของฉันคือ:

  1. เหตุใดพวกเขาจึงสร้างโคลนเว็บไซต์ของฉัน SEO บางประเภทหรืออะไร พวกเขาจะได้อะไรจากการได้รับ?
  2. พวกเขามี URL ได้อย่างไรadidas.comและastral.comm? ฉันคิดว่ามันไม่ใช่ Adidas ที่นำเนื้อหาของฉันไปใช้
  3. ฉันจะปิดเว็บไซต์เหล่านี้และหยุดคนไม่ให้ขโมยเนื้อหาของฉันได้อย่างไร (บน Tomcat)

copyscape.com ดูเหมือนว่าจะเป็นแหล่งข้อมูลที่ดีสำหรับการค้นหาเนื้อหาที่ซ้ำกันนั่นคือวิธีที่ฉันพบสำเนาของไซต์ของฉัน
Kzqai

คำตอบ:


17

ตกลง. นี่เป็นสิ่งที่ค่อนข้างแปลก แต่ไม่น่าเศร้าเท่าที่คุณคิด

ฉันไม่แน่ใจว่าผลตอบแทนจะเป็นอย่างไร นี่ทำให้ฉันไม่มีเหตุผลอะไรเลยว่าทำไมบางคนถึงทำอย่างนี้ ฉันไม่เห็นข้อได้เปรียบสำหรับแฮ็กเกอร์เลย ข่าวดีคือผู้เข้าชมมาที่ไซต์ของคุณ อย่างไรก็ตามจะมีการเข้าชมจากมุมมอง SEO ดังนั้นคุณต้องการแก้ไขปัญหานี้อย่างรวดเร็ว

ฉันถือว่าเว็บไซต์ของคุณไม่ได้อยู่บนเซิร์ฟเวอร์ที่ใช้ร่วมกันดังนั้นหากคุณเข้าถึงเว็บไซต์ของคุณด้วยที่อยู่ IP ก็จะยังคงใช้งานได้ ฉันทดสอบสิ่งนี้แล้ว

83waystowasteyourtime.adidas.com และ mediaiq.astral.com เป็นโดเมนย่อยที่ใช้แฮ็กเก่าที่อนุญาตให้ทุกคนสร้างโดเมนย่อยสำหรับโดเมนที่สงสัยใด ๆ คุณสามารถอ่านได้ที่นี่: http://www.techrepublic.com/blog/it-security/watch-out-for-dns-sub-domain-hijacking/มีเว็บไซต์อื่น ๆ ถ้าคุณ Google โดเมนย่อย DNS สับ

ข่าวดีก็คือสิ่งนี้ สิ่งเหล่านี้ไม่ใช่การคัดลอกหรือคัดลอกไซต์ของคุณ แต่เป็นไซต์ของคุณ แต่ละโดเมนย่อยชี้ไปที่ที่อยู่ IP ของคุณโดยเฉพาะ

คุณสามารถทำสิ่งต่อไปนี้

> dig 83waystowasteyourtime.adidas.com any

และ

> dig mediaiq.astral.comm any

บนคอมพิวเตอร์ linux ใด ๆ เพื่อดู

คุณอาจต่อสู้กับสิ่งนี้ได้ แต่ฉันไม่แน่ใจว่าวิธีการใดที่จะใช้ได้:

สมมติว่าคุณติดตั้ง Apache ไว้คุณสามารถแก้ไขไฟล์. htaccess ในไดเรกทอรีเว็บรูทของคุณและใส่รหัสต่อไปนี้

เพิ่มสิ่งต่อไปนี้ที่ด้านบนของไฟล์เพื่อเปิดเอ็นจินการเขียนซ้ำ

RewriteEngine On

การบล็อกโดยโฮสต์:

RewriteCond %{HTTP_HOST} ^83waystowasteyourtime\.adidas\.com$ [NC]
RewriteRule .* - [F,L]

--หรือ--

การปิดกั้นโดยผู้อ้างอิง:

RewriteCond %{HTTP_REFERER} ^83waystowasteyourtime\.adidas\.com$ [NC]
RewriteRule .* - [F,L]

คุณจะต้องการทดสอบสิ่งเหล่านี้และบอกเราว่าอันไหนใช้ได้ โปรด. บางทีเราอาจต้องไปหาปลาด้วยวิธีอื่น

แน่นอนคุณสามารถเปลี่ยนกฎการเขียนซ้ำและเปลี่ยนเส้นทางไปยังเว็บไซต์ของคุณโดยตรงด้วย:

RewriteRule .* http://www.botlibre.com [R=301,L]

--หรือ--

ส่งพวกเขาไปยังนรก (เรื่องตลก) ด้วย:

RewriteRule .* http://www.hell.com [R=301,L]

... ซึ่งเป็นเว็บไซต์จริง แต่คุณจะส่งปัญหาไปให้พวกเขา

ฉันขอแนะนำให้ปิดกั้นพวกเขา

ตามที่ @Martijn พูดถึงในความคิดเห็นของเขาและมันก็คุ้มค่าที่จะเก็บรักษาไว้คุณสามารถมีลิงก์แบบบัญญัติต่อหน้าเพื่อช่วยปกป้องคุณ ในกรณีนี้ลิงก์จะชี้ไปที่หน้าที่เปิดอยู่ มันใช้งานได้มากกว่า แต่วันนี้ดูเหมือนจะเป็นความคิดที่ดี

<link rel="canonical" href="http://www.example.com/booger-eating-tyrants" />

เช่นกันคุณสามารถเข้าถึงเจ้าของโดเมนแม่และให้พวกเขาเข้าร่วมในการต่อสู้:

Adidas.com

Admin Name: Albert Pedraz
Admin Organization: adidas AG
Admin Street: Adi-Dassler-Strasse 1
Admin City: Herzogenaurach
Admin State/Province:
Admin Postal Code: 91074
Admin Country: DE
Admin Phone: +49.9132844584
Admin Email: adidas@role.noris.net

Tech Name: noris.net Hostmaster
Tech Organization: noris network AG
Tech Street: Thomas-Mann-Str. 16-20
Tech City: Nuernberg
Tech State/Province:
Tech Postal Code: 90471
Tech Country: DE
Tech Phone: +49.91193520
Tech Fax: +49.9119352100
Tech Email: hostmaster@noris.net

Astral.com

Admin Name: Van Tu Duong
Admin Organization: Bell Media Inc.
Admin Street: 9 Channel Nine Court,
Admin City: Scarborough
Admin State/Province: Ontario
Admin Postal Code: M1S 4B5
Admin Country: CA
Admin Phone: +1.5148702477
Admin Phone Ext:
Admin Fax:
Admin Fax Ext:
Admin Email: trademarks@bell.ca

Tech Name: Van Tu Duong
Tech Organization: Bell Media Inc.
Tech Street: 9 Channel Nine Court,
Tech City: Scarborough
Tech State/Province: Ontario
Tech Postal Code: M1S 4B5
Tech Country: CA
Tech Phone: +1.5148702477
Tech Phone Ext:
Tech Fax:
Tech Fax Ext:
Tech Email: trademarks@bell.ca

3
และเพิ่มส่วนหัว 301 ลงในเว็บไซต์ของคุณและเพิ่ม canonicaltag ให้กับหน้าเว็บของคุณเพื่อค้นหาeneninesเดิม รวมทั้งอาจจะใช้เวลานี้เพื่อประโยชน์ของคุณ :)
Martijn

@Martijn ขอบคุณสำหรับความคิดเห็น! ฉันอัพเดตคำตอบด้วยตัวอย่างลิงก์แบบบัญญัติ สิ่งนี้จะช่วยคนในอนาคต
Closnoc

ขอบคุณสำหรับข้อมูลที่ดี ฉันจะใส่ไฟล์ "RewriteCond" ลงในไฟล์อะไร? ยังมีคำตอบสำหรับคำถาม # 1 ทำไม พวกเขาได้ประโยชน์อะไรจากสิ่งนี้
James

1
@ James ฉันอัปเดตคำตอบ ฉันตอบคำถามข้อ 1 แต่คำตอบของฉันลดลงและอาจพลาดได้ง่าย ฉันย้ายมันไปด้านบนและขยายออกไปบ้าง ฉันยังเพิ่มไฟล์ใดและจะหาได้ที่ไหน - สมมติว่า Apache (นี่คือรหัส Apache) ฉันไม่รู้จัก IIS เลยอีกต่อไป ฉันทำได้ดีมาสิบปีแล้วตั้งแต่ฉันได้ทำอะไรกับ IIS Rememeber ฉันไม่แน่ใจว่าชุดโค้ดใดที่ใช้งานได้ แต่ฉันค่อนข้างสงสัยว่ารุ่น% {HTTP_REFERER} นั้นถูกต้อง โปรดทดสอบและแจ้งให้เราทราบว่าผลลัพธ์คืออะไร อีกครั้งสมมติว่า Apache
Closnoc

ขออภัยฉันใช้ Tomcat ความคิดใด ๆ ในการทำเช่นนี้กับ Tomcat
James
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.