ตัวแยกประเภทการเรียนรู้ของเครื่องใหญ่ -O หรือความซับซ้อน


14

เพื่อประเมินประสิทธิภาพของอัลกอริธึมลักษณนามใหม่ฉันพยายามเปรียบเทียบความแม่นยำและความซับซ้อน (big-O ในการฝึกอบรมและการจำแนก) จากเครื่องการเรียนรู้: ความคิดเห็นที่ฉันได้รับที่สมบูรณ์รายการลักษณนามภายใต้การดูแลยังเป็นตารางความถูกต้องระหว่างขั้นตอนวิธีการและปัญหาการทดสอบ 44 จากUCI repositoy อย่างไรก็ตามฉันไม่สามารถหาบทวิจารณ์กระดาษหรือเว็บไซต์กับ big-O สำหรับตัวแยกประเภททั่วไปเช่น:

  • C4.5
  • RIPPER (ฉันคิดว่านี่อาจเป็นไปไม่ได้ แต่ใครจะรู้)
  • ANN พร้อมการขยายพันธุ์กลับ
  • Bayesian ไร้เดียงสา
  • K-NN
  • SVM

ถ้าใครมีการแสดงออกสำหรับลักษณนามเหล่านี้มันจะมีประโยชน์มากขอบคุณ


2
คุณอาจจะสนใจในบทความต่อไปนี้: thekerneltrip.com/machine/learning/…ข้อจำกัดความรับผิดชอบเต็มรูปแบบมันเป็นบล็อกของฉัน :)
RUser4512

สนใจที่จะติดตามตำแหน่งที่เชื่อมโยงไปถึงตอนนี้ของคำถามนั้นชี้ไปที่ใด?
แมตต์

@ RUser4512 การพิจารณาบล็อกที่ยอดเยี่ยมจริงๆ! คุณเคยพิจารณาเพิ่มความซับซ้อนของพื้นที่ด้วยหรือไม่?
แมตต์

1
@ แมทขอบคุณ :) ใช่ แต่อาจเป็นในบทความอื่นมีหลายสิ่งที่จะพูดเกี่ยวกับเรื่องนี้เช่นกัน!
RUser4512

คำตอบ:


11

ให้ = จำนวนตัวอย่างการฝึกอบรมd = มิติของคุณสมบัติและNd = จำนวนคลาสc

จากนั้นการฝึกอบรมมีความซับซ้อน:

  1. Naive Bayes คือสิ่งที่ต้องทำคือการคำนวณความถี่ของทุกค่าคุณสมบัติd iสำหรับแต่ละคลาสO(Nd)di
  2. -NN อยู่ใน O ( 1 ) (บางคนถึงกับบอกว่ามันไม่มีอยู่จริง แต่ความซับซ้อนของการฝึกอวกาศคือ O ( N d )kO(1)O(Nd)เนื่องจากคุณต้องเก็บข้อมูลที่ต้องใช้เวลาด้วย)
  3. ไม่เชิงเส้น SVM ที่ไม่ใช่ค่าประมาณคือหรือO ( N 3 )ขึ้นอยู่กับเคอร์เนล คุณสามารถได้O ( N 3 )ลงไปที่O ( N 2.3 )O(N2)O(N3)O(N3)O(N2.3)ด้วยเทคนิคบางอย่าง
  4. SVM โดยประมาณคือO(NR)โดยที่ R คือจำนวนการวนซ้ำ

การทดสอบความซับซ้อน:

  1. Naive Bayes อยู่ในเนื่องจากคุณต้องดึงค่าคุณสมบัติdสำหรับแต่ละคลาสcO(cd)dc
  2. kO(Nd)เนื่องจากคุณต้องเปรียบเทียบจุดทดสอบกับทุกจุดข้อมูลในฐานข้อมูลของคุณ

ที่มา: "Core Vector Machines: การฝึกอบรม SVM อย่างรวดเร็วในชุดข้อมูลขนาดใหญ่มาก" - http://machinelearning.wustl.edu/mlpapers/paper_files/TsangKC05.pdf

ขอโทษฉันไม่รู้เกี่ยวกับคนอื่น


6
O(n2)O(n3)

@MarcClaesen ลิงก์ไม่ทำงานอีกต่อไปและไม่ได้อยู่ในเครื่อง wayback นี่เป็นบทความเดียวกัน: leon.bottou.org/publications/pdf/lin-2006.pdfหรือไม่
Wordsforthewise
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.