การผสมข้อมูลคืออะไร


15

ระยะนี้จะปรากฏขึ้นบ่อย ๆ ในหัวข้อวิธีการที่เกี่ยวข้องกับ

มีการผสมผสานวิธีการเฉพาะในการทำเหมืองข้อมูลและการเรียนรู้ทางสถิติ? ฉันไม่สามารถรับผลลัพธ์ที่เกี่ยวข้องจาก google ได้

ดูเหมือนว่าการผสมเป็นการผสมผสานผลลัพธ์จากหลาย ๆ โมเดลและทำให้ได้ผลลัพธ์ที่ดีขึ้น มีทรัพยากรใดที่ช่วยให้ฉันรู้เพิ่มเติมเกี่ยวกับมันหรือไม่?

คำตอบ:


10

http://www.cs.cornell.edu/~caruana/ctp/ct.papers/caruana.icml04.icdm06long.pdf เอกสารบางฉบับเพื่อช่วยให้คุณเข้าใจเพิ่มเติมเกี่ยวกับการผสม ฉันคิดว่าคุณยังสามารถ google สำหรับการเลือกวงดนตรี / การเรียนรู้และการซ้อนเช่นกัน

ความเข้าใจทั่วไปของคุณในการ 'ผสมผลลัพธ์จากหลาย ๆ โมเดลและทำให้ได้ผลลัพธ์ที่ดีขึ้น' นั้นถูกต้อง


ลิงก์นั้นมาจากที่ใดที่หนึ่งในฟอรัมที่มีการต่อรองเช่นกัน ฉันบันทึกลิงก์ของ pdf เท่านั้น แต่ไม่ใช่การสนทนาแม้ว่า ...
King

12

การเพิ่ม (ดังที่กล่าวไว้ในการสนทนาที่เชื่อมโยง) เป็นวิธีที่รวมชุดของอัลกอริทึมเพื่อให้ได้ผลลัพธ์ที่ดีกว่าสิ่งที่คุณจะได้รับจากอัลกอริทึมเดียว ตัวอย่างเช่นป่าสุ่มเป็นวิธีการรวมต้นไม้การจำแนกประเภทต่างๆสำหรับอัลกอริทึมการจำแนก วิธีการนี้เรียกอย่างเป็นทางการว่า ensemble averaging (แม้ว่า algoithm มักใช้กฎส่วนใหญ่) การผสมดูเหมือนจะเป็นคำที่บางคนใช้เพื่ออธิบายวิธีการส่งเสริมการจัดหมวดหมู่


สิ่งนี้จะเรียกว่าการผสมถ้าฉันแทนที่ต้นไม้การจำแนกในรูปแบบ adaboost ปกติด้วยอัลกอริทึมชุดอื่น?
TomHall

สวัสดี Michael คำตอบของคุณมีประโยชน์จริง ๆ แต่น่าเสียดายที่ฉันเป็นคนใหม่สำหรับสถิติและยังไม่มีชื่อเสียงเพียงพอที่จะโหวตคำตอบของคุณ
TomHall

1
งั้นอย่าลืมทำหลังจากคุณได้รับคะแนนตัวแทนไม่กี่
Michael R. Chernick

0

ในการผสมข้อมูลอุตสาหกรรมไม่ได้เกี่ยวกับตัวแบบแต่เกี่ยวกับการประมวลผลล่วงหน้า : เมื่อข้อมูลถูกรวมเข้าด้วยกันซึ่งมาจากแหล่งต่าง ๆ เช่นหนึ่งจากฐานข้อมูลและข้อมูลอื่นจากไฟล์ CSV

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.