คำถามติดแท็ก data-mining

1
มีวิธีในการตรวจจับอคติของเครื่องมือค้นหาหรือไม่?
เสิร์ชเอ็นจิ้นมีการใช้งานมากขึ้นเรื่อย ๆ ในฐานะผู้ดูแลข้อมูล แต่เกณฑ์ที่ใช้โดยเสิร์ชเอ็นจิ้นเพื่อจัดอันดับผลการค้นหานั้นมีความทึบ ผู้ใช้จะแน่ใจได้อย่างไรว่าผลลัพธ์ของพวกเขาจะไม่ลำเอียงหรือดัดแปลงในบางวิธีเพื่อให้ได้รับความสนใจโดยเสียค่าใช้จ่ายในคุณภาพของผลการค้นหา รัฐบาลมักเรียกร้องให้ผู้ให้บริการค้นหาลบหรือลดอันดับของเว็บไซต์ที่ถือว่าไม่พึงประสงค์ทางการเมือง ธุรกิจอาจจ่ายผู้ให้บริการเพื่อเพิ่มผลลัพธ์บางอย่างเหนือผู้อื่นเพื่อเพิ่มรายได้ ไฟร์วอลล์อาจเข้าไปยุ่งกับผลลัพธ์ก่อนที่จะถูกส่งกลับไปยังผู้ใช้ แม้การเปลี่ยนแปลงขั้นตอนวิธีการจัดอันดับที่ไม่น่ากลัวที่ดูเหมือนว่าจะไม่ปรากฏบนพื้นผิวนั้นมีความลำเอียง แต่จริงๆแล้วอาจได้รับการออกแบบมาเพื่อทำอันตรายต่อเว็บไซต์ที่ใช้คุณลักษณะทั่วไปร่วมกัน (ไม่เกี่ยวข้องกับคุณภาพจริง) เป็นไปได้หรือไม่ที่จะตรวจสอบความเอนเอียงของเครื่องมือค้นหาโดยพูดถึงผลการตรวจสอบเป็นระยะเวลาหนึ่งและประเมินว่า "ตัวแปรที่ซ่อนอยู่" (อาจเป็นพันธมิตรทางการเมือง) บางส่วนเป็นปัจจัยขับเคลื่อนในการเปลี่ยนแปลงการจัดอันดับเว็บไซต์หรือไม่ ผู้ให้บริการที่มีเล่ห์เหลี่ยมอาจค่อยๆลดอันดับของเว็บไซต์เป้าหมาย (และอาจเป็นเว็บไซต์แบบสุ่มและเพื่อดึงดูดผู้ใช้) อะไรคือข้อ จำกัด เกี่ยวกับจำนวนผู้ให้บริการที่สามารถแนะนำได้โดยไม่มีการตรวจจับ? หรือเป็นไปได้ที่จะปิดบังสัญญาณรบกวนดังกล่าวเสมอโดยเลือกเกณฑ์การจัดอันดับแบบถ่วงน้ำหนักซึ่งบังเอิญสร้างผลลัพธ์ที่ตั้งใจ (โดยใช้วิธี "การสอดแนมข้อมูล") มีการเปลี่ยนแปลงใด ๆ หรือไม่หากมีการเปิดเผยเกณฑ์การจัดอันดับสาธารณะ เราจำเป็นต้องใช้โอเพ่นซอร์สที่เครื่องมือค้นหาเกณฑ์ใช้หรือไม่ สิ่งนี้ทำให้ฉันนึกถึงผลลัพธ์ที่ตรวจพบว่าตราสารทางการเงินที่ซับซ้อนเช่น CDO ได้รับการดัดแปลงโดยผู้ขายหรือเทียบเท่ากับการแก้ปัญหาที่หนาแน่นที่สุด: http://www.cs.princeton.edu/~rongge/derivative.pdf ขอบคุณ!
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.