เหตุใด Google จึงสร้างดัชนีหน้าเว็บด้วยสตริงการสืบค้น utm_campaign


9

เมื่อเร็ว ๆ นี้ฉันสังเกตเห็นว่า Google กำลังจัดทำดัชนี URL ที่มีอาร์กิวเมนต์สตริงข้อความสืบค้น utm_campaign, utm_source และ utm_medium ในผลลัพธ์ Google จะแสดง URL ที่มีสตริงข้อความค้นหาเหล่านี้มากกว่า URL แบบบัญญัติ:

utm_campaign ถูกเพิ่มไปยัง URL

ฉันเข้าใจว่านี่อาจเป็นปัญหา 'เนื้อหาซ้ำซ้อน' แต่ฉันใช้link rel=canonicalแท็กทั่วทั้งเว็บไซต์ของฉัน เป็นตัวอย่างหนึ่ง:

[snip]
<meta name="description" content="App store optimization helps discovery and rank on Google Play and the App Store. Publishers can use ASO by following these simple steps."/>
<meta name="robots" content="noodp"/>
<link rel="canonical" href="https://sweetpricing.com/blog/2016/11/app-store-optimization/" />
<meta property="og:locale" content="en_US" />
[snip]

สกรีนช็อตของแท็กบัญญัติ

ความคาดหวังของฉันคือ Google ควรใช้ URL ที่เป็นที่ยอมรับสำหรับการจัดทำดัชนี ผมทำอะไรผิดหรือเปล่า?


2
แม้จะไม่มีแท็กที่เป็นที่ยอมรับได้ แต่ Googlebot ก็มักจะละเว้นพารามิเตอร์ UTM เพราะรู้ว่าพวกเขาใช้สำหรับการติดตามเท่านั้น ฉันไม่เคยเห็นพวกเขาทำดัชนีมาก่อนโดยเฉพาะอย่างยิ่งไม่ใช่ที่ยอมรับ
Stephen Ostermiller

4
FWIW site:stackexchange.com inurl:utm_campaignยังให้ผลลัพธ์ที่คล้ายกัน (ในระดับที่ใหญ่กว่าเล็กน้อย) นอกจากนี้โปรดทราบว่าsite:การค้นหามักส่งคืน URL ที่ไม่เป็นที่ยอมรับในผลลัพธ์ซึ่งโดยทั่วไปแล้วจะไม่ได้รับการส่งกลับในการค้นหา "ปกติ" อย่างไรก็ตามดูเหมือนว่า URL ดังกล่าวจะถูกส่งคืนในการค้นหา "ปกติ" เช่นกัน
MrWhite

คำตอบ:


3

ตรวจสอบเว็บไซต์ของคุณเหมือนตอนนี้ฉันไม่แน่ใจว่าปัญหานี้จะเกิดขึ้นอีกต่อไปหรือไม่

ปัญหาไม่ได้เป็นการเชื่อมโยงภายในเว็บไซต์ของคุณด้วยการรวมพารามิเตอร์ UTM (ตามที่คำถามอื่นแนะนำ)

ดูเหมือนว่ากระบวนการบางอย่างที่คุณต้องเปิดเผยเนื้อหาเว็บไซต์ของคุณบนโซเชียลมีเดียนั้นกำลังทิ้งพารามิเตอร์ UTM ไว้ใน URL และแบ่งปัน URL เหล่านั้นซึ่งในบางจุดทำให้พวกเขาถูกทำดัชนี

มันเป็นเรื่องยากที่สิ่งนี้จะเกิดขึ้น แต่มันเคยเกิดขึ้นกับหลาย ๆ ไซต์ก่อนหน้านี้ ความจริงที่ว่ามีเพียงสามหน้าที่มีการทำดัชนีด้วยพารามิเตอร์เหล่านี้บ่งบอกว่านี่ไม่ใช่ปัญหาร้ายแรงหรือเป็นแบบนั่งข้างเดียว

นี่คือขั้นตอนที่คุณสามารถทำได้เพื่อช่วยกำจัดสิ่งนี้ไม่ให้เกิดขึ้น: -

1. ระบุ URL ที่ยอมรับในหน้าของคุณ

คุณทำสิ่งนี้แล้วและการนำไปใช้นั้นถูกต้อง วิธีนี้จะช่วยให้มั่นใจได้ว่าจะได้รับน้ำหนักตามที่ระบุในเครื่องมือค้นหา สันนิษฐานว่าสิ่งนี้เกิดขึ้นเสมอ แต่ถ้าไม่ทำเช่นนี้ก็สามารถอธิบายได้ว่าเหตุใดจึงมีบางกรณีของหน้าเก่าที่ยังคงจัดทำดัชนีด้วยพารามิเตอร์ UTM

การใช้งานที่ถูกต้องของ URL ที่ยอมรับ

2. สั่งให้ Google ไม่ทำดัชนีพารามิเตอร์ UTM ใน Search Console

ในกรณีที่มีการจัดทำดัชนี URL ด้วยพารามิเตอร์ UTM (เช่นกรณีของคุณ) พารามิเตอร์ URL ควรปรากฏเป็น URL ที่ตรวจพบจากในส่วน 'รวบรวมข้อมูล> พารามิเตอร์ URL' ของ Google Search Console สำหรับโดเมนของคุณ (ดูด้านล่าง)

พารามิเตอร์ URL UTM ของ Google Search Console

แม้ว่าพารามิเตอร์ UTM จะไม่ปรากฏขึ้นคุณสามารถ 'เพิ่มพารามิเตอร์' เพื่อสร้างได้

เพียงแค่เลือกNo: Doesn't affect page content (ex: tracks usage)(ที่เรียกว่า 'Passive พารามิเตอร์') และ Google จะแล้วมักจะมีเพียงแค่รวบรวมข้อมูล URL ที่เป็นหนึ่งเดียวกับค่าพารามิเตอร์ที่เฉพาะเจาะจง

3 ไม่อนุญาตพารามิเตอร์ URL ใน robots.txt ของคุณ

การทำเช่นนี้จะป้องกันไม่ให้ Google จัดทำดัชนีเนื้อหาของ URL เหล่านี้ แต่ไม่ใช่ URL จริง (พวกเขายังคงสามารถแสดงในผลการค้นหา แต่จะละเว้นคำอธิบายดังต่อไปนี้)

หน้าจัดทำดัชนีไม่อนุญาตใน robots.txt

เพียงเพิ่มบางอย่างเช่นรายการต่อไปนี้จะจัดการเรื่องนี้จากrobots.txt: -

Disallow: /*?utm=*

ข้อสรุป

ขั้นตอนที่ # 1 และ # 2 ควรดำเนินการตามความระมัดระวังและ "แนวปฏิบัติที่ดีที่สุด" อย่างใดและขั้นตอนที่ 3 นอกเหนือจากขั้นตอนที่ # 1 และ # 2 (อาจจะไม่มีประสิทธิภาพในตัวเอง)

ภายใน Google Search Console ยังมีความสามารถในการลบ URL ชั่วคราว สิ่งนี้มีประโยชน์อย่างยิ่งหากมีหน้าที่ดื้อดึงบางหน้าที่ยังคงจัดทำดัชนี แต่คุณรู้ว่าแหล่งที่มาของปัญหาได้รับการแก้ไขแล้วและสถานที่นี้ควรจะเพียงพอที่จะกำจัดพวกเขาเพียงครั้งเดียวและจากผลการค้นหาทั้งหมด

ฉันไม่ได้รวมสิ่งนี้ไว้เป็นขั้นตอนข้างต้นแม้ว่าจะได้ทำการวิจัยก่อนหน้านี้แล้วฉันไม่สามารถจำได้ว่ามันจะสนับสนุน URL ที่มีพารามิเตอร์หรือไม่ ครั้งหนึ่งฉันเคยรู้คำตอบ แต่ความทรงจำของฉันทำให้ฉันล้มเหลวในโอกาสนี้

อ่านเพิ่มเติมเกี่ยวกับการกำจัดของ URL จาก Google


1
แต่ถ้าคุณปิดกั้น URL เหล่านี้จากการรวบรวมข้อมูลโดยใช้robots.txt(# 3) คุณจะไม่ปิดกั้นแคมเปญเหล่านี้จากการติดตามหรือไม่ ... และยังป้องกันไม่ให้แท็กบัญญัติในหน้าถูกอ่าน (# 1)
MrWhite

ฉันเห็นด้วยกับสิ่งที่ w3dk พูดเกี่ยวกับ robots.txt หากมีสิ่งใดใช้noindex: /*?utm=*ใน robots.txt
Stephen Ostermiller

2

ดูเหมือนว่าคุณกำลังใช้ลิงก์เหล่านี้ภายในเนื้อหาของเว็บไซต์ของคุณเพื่อเชื่อมโยงหน้าต่างๆเข้าด้วยกัน

เพื่อให้แน่ใจว่า Google จะไม่สร้างดัชนีคุณสามารถเพิ่มrel="nofollow"ลิงก์เหล่านี้ภายในเว็บไซต์ของคุณและบล็อกพารามิเตอร์เหล่านี้จากไฟล์ robots.txt:

Disallow : /*utm_campaign

เยี่ยมมากที่ใช้สำหรับลิงก์ภายใน ซึ่งจะอธิบายความแตกต่างจากไซต์ส่วนใหญ่ที่โดยทั่วไปจะใช้เฉพาะในลิงก์ขาเข้า
Stephen Ostermiller

ที่จริงแล้วมีการเพิ่ม URL utm_campaign โดย Buffer.com - เช่นพวกเขาดูเหมือน "utm_source = plus.google.com & utm_campaign = buffer" ฉันไม่คิดว่าฉันกำลังใช้ลิงก์เหล่านี้ที่ใดก็ได้บนเว็บไซต์
Brendon

1

คุณตรวจสอบว่า URL ที่เป็นที่ยอมรับของคุณได้รับการจัดทำดัชนีหรือไม่? หาก URL ของ canonical ได้รับการจัดทำดัชนีแล้วไม่มีอะไรต้องกังวล

คุณสามารถลองของ Google เครื่องมือของผู้ดูแลเว็บและการเปลี่ยนแปลงวิธีที่ Google จัดการพารามิเตอร์ URL ที่นี่


1
สำหรับบาง URL เฉพาะ URL utm_campaign เท่านั้นที่ได้รับการจัดทำดัชนี สำหรับหน้าอื่น ๆ URL ทั้งสองปรากฏในดัชนี เมื่อวานนี้ฉันใช้เครื่องมือดึงข้อมูลเป็น Google เพื่อรวบรวมข้อมูลหนึ่ง URL (ด้วยสตริงข้อความค้นหา utm_campaign) - ตอนนี้ดูเหมือนว่า URL นั้นจะหายไปและตอนนี้ URL ตามมาตรฐานได้รับการจัดทำดัชนีแล้ว
Brendon

นอกจากนี้สถิติการตระเวน ( ภาพหน้าจอ ) ดูเหมือนจะแสดงหน้าเว็บที่ใช้เวลานานในการรวบรวมข้อมูล (เฉลี่ย 2.3 วินาที) ฉันไม่แน่ใจว่านี่เป็นปัญหาอย่างกว้างขวางหรือไม่ แต่บางที Google อาจมีปัญหาในการรวบรวมข้อมูลเว็บไซต์
Brendon

คุณยังสามารถทำความสะอาดได้เล็กน้อยเมื่อผู้เยี่ยมชมเข้ามาในเว็บไซต์ของคุณ ใช้ลิงค์ Fresh URL script เพื่อลบพารามิเตอร์ UTM ใด ๆ ออกจาก URL หลังจากได้รับประโยชน์จากมัน เพิ่มพารามิเตอร์ URL สอง ...
muhammad usman
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.