เครื่องมือค้นหารวบรวมข้อมูล PDF และหากมีกฎใด ๆ ที่ต้องปฏิบัติตามเมื่อสร้างขึ้น


22

เว็บไซต์ที่ฉันใช้งานมี PDF อยู่สองสามร้อย ฉันไม่คิดว่าฉันเคยเห็นพวกเขาคนใดกลับมาในการค้นหา แต่มีการเชื่อมโยงไปยังโดยตรงจากไซต์ คำหลักเหล่านี้เต็มไปด้วยคำหลักเนื่องจากเป็นเอกสารผลิตภัณฑ์

มีอะไรพิเศษที่เราต้องทำเพื่อให้ Google หรือเครื่องมือค้นหาอื่น ๆ รวบรวมข้อมูลได้หรือไม่

มีกฎที่ยากและรวดเร็วในการสร้าง PDF เพื่อช่วยให้ Google ชอบพวกเขามากขึ้นหรือไม่? ตัวอย่างเช่นฉันควรใช้พวกเขาผ่าน ghostscript เพื่อล้างแท็ก PDF ที่ Adobe เสียระหว่างการสร้าง?


เพิ่มแผนผังไซต์ xml ของคุณเพื่อให้แน่ใจว่าพวกเขาตระหนักถึงพวกเขาหรือไม่
artlung

คำตอบ:


17

Google ทำดัชนีไฟล์ PDF แน่นอนและคุณสามารถค้นหาเฉพาะไฟล์ PDF ได้โดยเพิ่มfiletype:pdfลงในคำค้นหา ( ตัวอย่าง )

ฉันจะบอกว่าสิ่งสำคัญที่ต้องทำเพื่อเพิ่มประสิทธิภาพ PDF ดังนั้นการจัดทำดัชนีได้ง่ายจะเป็น:

  • ให้ชื่อไฟล์ที่มีความหมาย
  • ทำคุณสมบัติเมตะดาต้าเอกสารให้สมบูรณ์ (หัวเรื่อง, ผู้แต่ง, คำหลัก ฯลฯ )
  • ตรวจสอบให้แน่ใจว่า PDF ของคุณประกอบด้วยข้อความจริงและไม่สแกนภาพ
  • ตรวจสอบให้แน่ใจว่าคุณมีเนื้อหาที่ดีพร้อมการใช้หัวเรื่องอย่างถูกต้องเช่นเดียวกับที่คุณทำกับเอกสาร HTML

สำหรับเคล็ดลับเพิ่มเติมอ่านการเพิ่มประสิทธิภาพเอกสาร PDFและเคล็ดลับที่สิบเอ็ดสำหรับการเพิ่มประสิทธิภาพ PDF สำหรับเครื่องมือค้นหา


ลิงค์labs.justsearching.co.uk/optimizing-pdf-documents-621.htmlไม่สามารถใช้งานได้อีกต่อไป

@Christofian ขอบคุณ - ฉันได้อัปเดตลิงค์แล้ว ฉันจะปล่อยให้ผู้อ่านเห็นคุณค่าของ บริษัท SEO ที่เปลี่ยนชื่อลิงก์โดยไม่ต้องมีการเปลี่ยนเส้นทาง 301!
Dan Diplo

@DanDiplo เกี่ยวกับ SEO ของไฟล์ PDF ฉันขอแนะนำให้เพิ่มลิงก์ลงในเนื้อหาเมื่อมีผลบังคับใช้
Anagio

1

ฉันไม่แน่ใจเกี่ยวกับเครื่องมือค้นหาอื่น ๆ แต่เท่าที่ Google มีความกังวลกฎหลักจะไม่แยกพวกเขาผ่าน robots.txt

นี่คือการประกาศครั้งแรกของพวกเขาในการสนับสนุนการค้นหา PDF


1

เช่นเดียวกับการสร้างเว็บไซต์ที่ไม่สามารถทำลาย SEO ของคุณการทำให้ไฟล์ PDF ของคุณเข้าถึงไม่ได้ เครื่องมือตรวจสอบการเข้าถึงในตัวของ Adobe นั้นห่างไกลจากความสมบูรณ์แบบ แต่อย่างน้อยการแก้ไขพื้นที่เหล่านั้นจะช่วยให้คุณเริ่มต้นได้

ฉันอาจใช้เวลา 5 นาทีในแต่ละ 4 หรือ 5 ส่วนใหญ่เป็นข้อความ PDF ที่เราใส่ออนไลน์ เวลาจะเพิ่มขึ้นอย่างสม่ำเสมอโดยขึ้นอยู่กับจำนวนหน้าและความซับซ้อนของหน้าเหล่านั้น

สมมติว่าคุณมี Adobe Acrobat Pro เพื่อทำการแก้ไข:

  • ทำการตรวจสอบการเข้าถึงเต็มรูปแบบ (ตรวจสอบอย่างรวดเร็วสวยไม่มีจุดหมายกับฉัน)
  • อัปเดตข้อมูลเมตาในคุณสมบัติเอกสาร (คำหลักหัวเรื่องภาษา ฯลฯ )
  • ตรวจสอบให้แน่ใจว่ามีการเพิ่มแท็ก
  • ตรวจสอบให้แน่ใจว่าข้อความถูกแท็กเป็นข้อความรูปภาพเป็นรูปภาพสิ่งพื้นหลังเป็นพื้นหลัง
  • ติดแท็กปุยที่ไร้ประโยชน์ (เช่นการตกแต่งหรือการออกแบบ) เป็นพื้นหลัง
  • เพิ่มข้อความกำกับภาพที่ดีลงในภาพ
  • ตรวจสอบให้แน่ใจในลำดับการอ่าน
  • ในแถบเครื่องมือเนื้อหาตรวจสอบให้แน่ใจว่าข้อความนั้นไม่ซ้ำซ้อนหรือผิดพลาดอย่างไม่มีการลด
  • ใช้เครื่องสแกน OCR กับหน้าที่สแกน

สำหรับการแก้ไขขั้นสูงเช่นตารางและข้อผิดพลาด Adobe อย่างผิดปกติเราใช้ปลั๊กอินชื่อ CommonLook CommonLook ทำงานให้เสร็จ แต่ฉันเกลียดมันเกือบเท่าที่ฉันเกลียดเครื่องมือ Adobe

ทำความคุ้นเคยกับเครื่องมือ Touch Up Reading Order, แถบเครื่องมือแท็ก, แถบเครื่องมือคำสั่งการอ่านและแถบเครื่องมือเนื้อหา งานของฉันต้องใช้เอกสารที่มีคุณสมบัติครบถ้วนก่อนออกไปท่องเว็บ แต่ทุกคนสามารถได้รับประโยชน์จากคุณสมบัติการแท็กและเอกสารอย่างง่าย


เว็บไซต์ของเรามีไฟล์ PDF มากกว่า 5,000 ไฟล์ที่เราต้องย้อนกลับไปและนำมาซึ่งการปฏิบัติตามมาตรฐาน 508 ฉบับ ใช้เวลาสักครู่ในการเรียนรู้ Adobe แนะนำผู้ฝึกสอนไม่ได้ช่วยอะไร แต่เมื่อคุณเรียนรู้แล้วคุณจะสามารถซิปพวกเขาออกมาได้
MrChrister
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.