ขณะนี้เรากำลังพัฒนาเว็บไซต์ที่ปัจจุบันมีหน้าเว็บที่ไม่ซ้ำกัน 8 ล้านหน้าซึ่งจะเพิ่มขึ้นเป็นประมาณ 20 ล้านหน้าและในที่สุดจะอยู่ที่ประมาณ 50 ล้านหรือมากกว่านั้น
ก่อนที่คุณจะวิพากษ์วิจารณ์ ... ใช่มันมีเนื้อหาที่มีประโยชน์และไม่ซ้ำใคร เราทำการประมวลผลข้อมูลดิบจากบันทึกสาธารณะอย่างต่อเนื่องและด้วยการขัดข้อมูลบางส่วนการเปิดตัวเอนทิตี้และการจับคู่ความสัมพันธ์เราสามารถสร้างเนื้อหาที่มีคุณภาพได้การพัฒนาเว็บไซต์ที่ค่อนข้างมีประโยชน์และไม่เหมือนใครส่วนหนึ่งเนื่องจากความกว้าง ข้อมูล.
PR คือ 0 (โดเมนใหม่ไม่มีลิงก์) และเราได้รับ spidered ในอัตราประมาณ 500 หน้าต่อวันทำให้เราอยู่ที่ประมาณ 30,000 หน้าจัดทำดัชนี ในอัตรานี้เราใช้เวลานานกว่า 400 ปีในการจัดทำดัชนีข้อมูลทั้งหมดของเรา
ฉันมีสองคำถาม:
- คืออัตราของการจัดทำดัชนีมีความสัมพันธ์โดยตรงกับ PR และโดยที่ฉันหมายถึงมันมีความสัมพันธ์เพียงพอที่โดยการซื้อโดเมนเก่าที่มี PR ที่ดีจะทำให้เราได้รับอัตราการจัดทำดัชนี (ในละแวก 100,000 หน้าต่อวัน)
- มีที่ปรึกษา SEO คนใดที่เชี่ยวชาญในการช่วยกระบวนการจัดทำดัชนีเอง เราทำได้ดีมากกับ SEO โดยเฉพาะอย่างยิ่งบนหน้านอกจากนี้การแข่งขันสำหรับวลีคำหลัก "หางยาว" ของเรานั้นค่อนข้างต่ำดังนั้นความสำเร็จของเราจึงขึ้นอยู่กับจำนวนหน้าที่จัดทำดัชนี
คู่แข่งหลักของเราประสบความสำเร็จในการจัดทำดัชนีหน้าเว็บประมาณ 20 มม. ในเวลาเพียงหนึ่งปีพร้อมกับอันดับ Alexa 2000-ish
คุณสมบัติสำคัญที่เรามี:
- ความเร็วในการดาวน์โหลดหน้าค่อนข้างดี (250-500 ms)
- ไม่มีข้อผิดพลาด (ไม่มีข้อผิดพลาด 404 หรือ 500 เมื่อได้รับการ spidered)
- เราใช้เครื่องมือเว็บมาสเตอร์ของ Google และเข้าสู่ระบบทุกวัน
- มี URL ที่จดจำง่าย
- ฉันกลัวที่จะส่งแผนผังไซต์ การโพสต์ชุมชน SEO บางแห่งแนะนำเว็บไซต์ใหม่ที่มีหน้านับล้านหน้าและไม่มีการประชาสัมพันธ์ มีวิดีโอ Google ของ Matt Cutts ที่พูดถึงการแสดงบนไซต์ขนาดใหญ่เช่นกันเพื่อหลีกเลี่ยงการตรวจสอบที่เพิ่มขึ้น (ประมาณ 2:30 ในวิดีโอ)
- ลิงก์ของไซต์ที่คลิกได้จะแสดงหน้าทั้งหมดไม่เกินสี่หน้าและโดยทั่วไปจะมีลิงก์ภายในไม่เกิน 250 (-ish) ลิงก์บนหน้าเว็บ
- ยึดข้อความสำหรับลิงก์ภายในเป็นตรรกะและเพิ่มความเกี่ยวข้องแบบลำดับชั้นให้กับข้อมูลในหน้ารายละเอียด
- ก่อนหน้านี้เราได้ตั้งค่าอัตราการรวบรวมข้อมูลไว้ที่ระดับสูงสุดในเครื่องมือของผู้ดูแลเว็บ (ประมาณหน้าเดียวทุกสองวินาทีสูงสุด) ฉันเพิ่งเปลี่ยนกลับเป็น "ให้ Google ตัดสินใจ" ซึ่งเป็นคำแนะนำ