การใช้ rel = canonical กับการรวม


21

ฉันทำงานที่ไซต์ที่อนุญาตการเผยแพร่เนื้อหา (ผ่าน API และการถ่ายโอนข้อมูล) เราพบว่ามีเว็บไซต์จำนวนมากที่เผยแพร่เนื้อหาของเราปรากฏในผลการค้นหาของ Google มากกว่าแม้ว่าเราจะเป็นผู้เผยแพร่ดั้งเดิมก็ตาม มันน่าหงุดหงิด

เรากำลังพิจารณาที่จะเป็น rel=canonical ส่วนหนึ่งของข้อกำหนดที่มาของเรา Google กล่าวว่าถูกต้องตามกฎหมายที่จะใช้งานข้ามโดเมนและในสถานการณ์การเผยแพร่

คุณได้ทำสิ่งนี้แล้วหรือไม่และ Google พิจารณา URL ที่เป็นที่ยอมรับในการจัดอันดับการค้นหาหรือไม่ มันจะช่วยเราในการลด "สแปม" ของ SERP หรือไม่


1
สิ่งที่คุณกำลังอธิบายไม่ใช่สแปม เป็นคนทำในสิ่งที่คุณกำลังขอให้พวกเขาทำ - รวบรวมเนื้อหาของคุณ สแปมเป็นโฆษณาอีเมลและหน้าเว็บที่ไม่พึงประสงค์ที่สร้างขึ้นเพื่อจุดประสงค์เพียงอย่างเดียวในการทิ้งระเบิดผู้คนด้วยโฆษณาแทนที่จะสร้างคุณค่าใด ๆ หากเว็บไซต์เหล่านั้นเป็นประเภทของการรวมเนื้อหาของคุณคุณจำเป็นต้องคิดทบทวนรูปแบบการเผยแพร่ของคุณอีกครั้งหรืออาจจะทำให้ไซต์ของคุณแย่ (โดยผ่านการเชื่อมโยง) แต่การมีอันดับการค้นหาดีกว่าคุณไม่ได้สร้างสแปมเว็บไซต์
Lèsemajesté

@ Lèseจริงเหรอ? ดูเหมือนว่าไซต์เหล่านี้จะละเมิดกฎ "เนื้อหาต้นฉบับน้อยหรือไม่มีเลย" โดยตรงที่สร้างขึ้นโดย Google เองgoogle.com/support/webmasters/bin/answer.py?answer=66361
Jeff Atwood

@Jeff: ไซต์ใดที่คุณอ้างถึงโดยเฉพาะ ฉันกำลังพูดถึงการกระทำของการใช้การรวมเว็บเองซึ่งเป็นสิ่งที่เว็บไซต์ถูกต้องตามกฎหมายจำนวนมากทำ ไซต์สแปมไม่จำเป็นต้องใช้เนื้อหาที่รวบรวมและการใช้เนื้อหาที่รวบรวมจะไม่ทำให้ไซต์นั้นเป็นไซต์สแปม (แม้ว่าพวกเขาจะมีอันดับที่ดีกว่าคุณก็ตาม) ในกรณีที่สิ่งพิมพ์ข่าวที่สำคัญหลายแห่งใช้เนื้อหาที่รวบรวมจาก AP เพื่อเสริมเนื้อหาของตัวเอง มันซ้ำเนื้อหาหรือไม่ ใช่. แต่มันเป็นสแปมหรือไม่ ไม่และฉันไม่คิดว่า AP กำลังโปรโมตสแปมเช่นกัน
Lèsemajesté

@ หมิ่นพระบรมเดชานุภาพคำสำคัญที่นี่เป็นอาหารเสริมเนื้อหาของตนเอง หากมีการคัดลอกเนื้อหาทั้งหมดสิ่งที่มีคุณค่าหรือความสนใจจะถูกสร้างขึ้นใช่มั้ย?
Jeff Atwood

1
@Jeff: ยังไม่ชัดเจนจากคำถามของ Matt ว่าเป็นเว็บไซต์ที่เขาอ้างถึง เขาเพียง แต่กล่าวว่ามีเว็บไซต์ที่เผยแพร่เนื้อหาของเขาใหม่ (ซึ่งมีจุดประสงค์ในการให้บริการ API การเผยแพร่) ซึ่งมีการจัดอันดับสูงกว่าเนื้อหาต้นฉบับ สำหรับฉันแล้วไม่ได้หมายความว่าเว็บไซต์สแปมเหล่านี้ (จำเป็น) แต่บางทีการตีความคำถามของฉันอาจไม่ถูกต้อง
Lèsemajesté

คำตอบ:


10

Jeff ถูกต้อง 100% ในทุกสิ่งที่เขาพูด

ปัญหาอีกประการหนึ่งของการขอไซต์การเผยแพร่ที่จะใช้<link rel="canonical" href="http://example.com/foo">คือมันแจ้งให้ Google ทราบว่าหน้าการเผยแพร่ไม่ควรได้รับอันดับหน้าและhttp://example.com/fooควรได้รับทั้งหมด

ที่สร้างสองประเด็นสำคัญ

  1. หน้าการเผยแพร่จะไม่ปรากฏในการค้นหาของ Google เลยเนื่องจากไม่มีอันดับหน้า ไซต์การเผยแพร่จะไม่พอใจกับสิ่งนี้เพียงเล็กน้อย ทำให้ไม่น่าเป็นไปได้ที่พวกเขาจะยินดีที่จะทำการเปลี่ยนแปลงหากพวกเขาสามารถทำได้
  2. มันอาจไม่ส่งผลกระทบต่อเว็บไซต์ของคุณในแบบที่คุณชอบเพราะคุณไม่ได้รับการเชื่อมโยงจากเว็บไซต์การเผยแพร่อย่างมีประสิทธิภาพ ฉันสงสัยว่า Google จะจัดการกับสิ่งนี้อย่างไร มันเป็นความจริงที่พวกเขาอนุญาตสำหรับ cross site rel = "canonical" แต่ฉันเชื่อว่าจุดประสงค์นั้นสำหรับการโยกย้ายไซต์และมีหลายไซต์ภายใต้โฮสต์เดียวที่มีเนื้อหาเดียวกันเพื่อให้มีหน้า defacto หนึ่งหน้าเทียบกับหน้าเดียวกัน / หน้าเดียวกัน

นั่นเป็นจุดที่ดี ฉันคิดว่าการรวมเป็นหนึ่งในพื้นที่ที่มีเหตุผลที่ถูกต้องสำหรับการทำซ้ำเนื้อหา ในกรณีนี้จะเป็นการดีกว่าที่จะปล่อยให้เนื้อหาที่ซ้ำกันอยู่คนเดียวและยอมรับว่านั่นคือการเผยแพร่ แน่นอนว่า Google ควรให้ความสำคัญกับหน้าต้นฉบับมากกว่าหน้าพันธมิตรการเผยแพร่ อาจต้องสร้างแท็กใหม่ซึ่งเป็นสิ่งที่อยู่ระหว่างrel="canonical"และ<cite>แท็กHTML5 ด้วยวิธีนี้เอ็นจิ้นการค้นหาสามารถรู้ได้ว่าหน้าใดเป็นหน้าต้นฉบับสำหรับเนื้อหาที่ซ้ำกันอย่างถูกกฎหมาย
Lèsemajesté

ยืนยันดูคำตอบของฉันจาก Matt Cutts ด้านล่าง
Jeff Atwood

14

การวิจัยของฉันระบุว่าต้องการลิงค์กลับ - และลิงค์ที่ไม่ถูกติดตาม - เป็นไปตามเกณฑ์ที่สำคัญที่สุด

หากไซต์ "syndicating" ไม่ได้มีเนื้อหาที่มีลิงก์กลับไปยังต้นฉบับที่ถูกต้องสำหรับเครื่องมือค้นหาที่จะติดตามเครื่องมือค้นหาจะมีการสืบค้นเวลาที่ยากขึ้นกว่าเดิมที่เนื้อหามาและต้องใช้ความซับซ้อน "ค้นหาเนื้อหาข้อความที่ซ้ำกัน การวิเคราะห์พฤติกรรมของอินเทอร์เน็ตทั้งหมด

ฉันไม่แน่ใจเกินกว่าที่จำเป็น

วิดีโอ Matt Cutts ที่เกี่ยวข้อง

http://www.youtube.com/watch?v=x8XdFb6LGtM

Matt กล่าวว่าควรใช้ rel = "canonical" เพื่อชี้กลับไปยังหน้าเว็บที่บทความมา - เช่นเดียวกับที่เขามักจะแนะนำว่าบทความที่ตีพิมพ์รวมถึงลิงก์แบบดั้งเดิม (เช่น<a>แท็ก nchor) ที่ชี้กลับไปที่ บทความต้นฉบับ

จำไว้ว่าที่ยอมรับไม่ได้เป็นเพียงตบrel="canonical"บน<a>แท็ก; มันเป็นเช่นนี้มากขึ้น:

<html>
    <head>
         <link rel="canonical" href="http://example.com/foo">
    </head>
...

ดังนั้นจึงต้องใช้งานประเภทอื่นคุณต้องแก้ไขส่วนหัวของหน้าแต่ละหน้า ฉันไม่แน่ใจว่า "ผู้เผยแพร่" เหล่านี้จำนวนมากจะมีระดับการควบคุมนั้นเทียบกับลิงก์แบบง่าย ( ไม่มีผู้ติดตาม!) กลับไปที่แหล่งที่มา


ฉันขอแนะนำให้อ่านรายการบล็อกของ Jeff ในหัวข้อนี้ต้องมี Attribution Attribution - blog.stackoverflow.com/2010/08/defending-attribution-required
Scott Mitchell

@scott โปรดทราบว่าตอนแรกเราไม่ได้ต้องการลิงก์ที่ติดตาม แต่เราเปลี่ยนเพราะแมงมุมของ Google ขาดสิ่งที่อยู่ในการถ่ายโอนข้อมูลบางส่วนของเครื่องขูดใช้ ... และการเชื่อมโยงที่ขาดหายไปซึ่งไม่ได้ติดตามช่วยไม่ได้นำกลับมา ในดัชนีของ Google!
Jeff Atwood

@Jeff: ในการสัมผัสกันเล็กน้อยสิ่งหนึ่งที่ฉันขอร้องคือการเชื่อมโยงในคำตอบ Stackoverflow มี rel = "nofollow" ผู้ใช้ที่มีตัวแทนที่แน่นอนไม่ควรได้รับประโยชน์จาก no rel = "nofollow" ไปยังลิงก์ที่โพสต์หรือไม่
Scott Mitchell

@scott ฟิลด์เว็บไซต์ในโปรไฟล์ของคุณในเว็บไซต์ Stack Exchange ใด ๆ จะมีการลบ nofollow ที่ 2k rep เป็นความอนุเคราะห์
Jeff Atwood

1
@ เจฟฟ์ฉันกำลังพูดถึงลิงก์ในคำตอบของ Stackoverflow ตัวอย่างเช่นถ้าฉันทำมุมมอง / แหล่งที่มาในหน้านี้มากฉันเห็นลิงก์ในคำตอบของคุณ (เช่นหนึ่งใน YouTube) มี rel = "nofollow" ฉันเข้าใจว่านี่คือการห้ามปรามผู้ส่งอีเมลขยะ แต่ในเวลาเดียวกันดูเหมือนว่าคุณไม่มีโอกาสที่จะปรับปรุงความเกี่ยวข้องของผลการค้นหาสำหรับผู้อื่นไม่พูดถึง "การให้เครดิต" (ในสายตาของ Google) กับคนที่เขียน บทความ / บล็อกรายการ / ฯลฯ ที่กำลังเชื่อมโยงกับ
Scott Mitchell

2

การเพิ่มคำตอบอื่นเนื่องจากฉันได้รับคำตอบที่ชัดเจนจากMatt Cuttsในเรื่องนี้:

rel=canonicalทำงานข้ามโดเมนได้ แต่โดยทั่วไปจะทำหน้าที่เหมือน 301 [เปลี่ยนเส้นทาง]ดังนั้นหน้าเว็บไซต์เป้าหมายจะตรงไปยังเว็บไซต์ของคุณใน Google เว็บไซต์ใดก็ตามที่ใช้เนื้อหาของคุณจะถูกลบออกจากเครื่องมือค้นหาโดยทั่วไป

อย่างที่ Matt คิดว่าวิธีที่ดีที่สุดที่จะนึกถึงrel=canonicalคือการเปลี่ยนเส้นทางถาวร 301ครั้ง

ดังนั้นการกำหนดข้ามโดเมนrel=canonicalเป็นชุดของคำที่มาจะเหมือนกับขอให้พวกเขาเปลี่ยนเส้นทาง 301 ให้คุณ! อุ๊ยตาย : P

เมื่อรู้อย่างนี้แล้วชัดเจนว่าrel=canonicalมีไว้สำหรับใช้ในไซต์ที่คุณมีอำนาจควบคุมเท่านั้นเช่นเมื่อคุณย้ายโดเมนและคุณต้องการเนื้อหาของโดเมนหนึ่งเพื่อแทนที่อีกโดเมนหนึ่ง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.