เหตุใดตัวจําแนกแบบเบย์จึงเป็นลักษณนามในอุดมคติ


11

จะถือว่าเป็นกรณีที่เหมาะที่โครงสร้างความน่าจะเป็นพื้นฐานที่เป็นที่รู้จักกันอย่างสมบูรณ์แบบหมวดหมู่

เหตุใดจึงใช้ตัวจําแนกเบส์เพื่อให้ได้ประสิทธิภาพที่ดีที่สุดที่สามารถทำได้

หลักฐาน / คำอธิบายอย่างเป็นทางการสำหรับสิ่งนี้คืออะไร? เนื่องจากเราใช้ตัวจําแนกเบส์เป็นเกณฑ์มาตรฐานเพื่อเปรียบเทียบประสิทธิภาพของตัวจําแนกอื่น ๆ ทั้งหมด

คำตอบ:


9

เหตุใดจึงใช้ตัวจําแนกเบส์เพื่อให้ได้ประสิทธิภาพที่ดีที่สุดที่สามารถทำได้ หลักฐาน / คำอธิบายอย่างเป็นทางการสำหรับสิ่งนี้คืออะไร?

โดยปกติชุดข้อมูลจะถูกพิจารณาว่าประกอบด้วยตัวอย่าง iidของการกระจายที่สร้างข้อมูลของคุณ จากนั้นคุณสร้างแบบจำลองการคาดการณ์จากข้อมูลที่ได้รับ: ได้รับตัวอย่างคุณคาดการณ์ระดับในขณะที่ระดับที่แท้จริงของกลุ่มตัวอย่างเป็น(x_i)Dnxixif^(xi)f(xi)

แต่ในทางทฤษฎีคุณสามารถตัดสินใจที่จะไม่เลือกหนึ่งในรูปแบบเฉพาะแต่พิจารณาทุกรุ่นที่เป็นไปได้ในครั้งเดียวและรวมพวกเขาอย่างใดเป็นหนึ่งใหญ่รุ่น .f^chosenf^F^

แน่นอนว่าจากข้อมูลแล้วmodells ขนาดเล็กจำนวนมากอาจไม่น่าจะเป็นไปได้หรือไม่เหมาะสม (ตัวอย่างเช่นแบบจำลองที่ทำนายค่าของเป้าหมายเพียงค่าเดียวแม้ว่าจะมีหลายค่าของเป้าหมายในชุดข้อมูล )D

ในกรณีใด ๆ คุณต้องการทำนายค่าเป้าหมายของตัวอย่างใหม่ซึ่งดึงมาจากการแจกแจงแบบเดียวกับ s เป็นมาตรการที่ดีของประสิทธิภาพการทำงานของรูปแบบของคุณจะเป็น คือความน่าจะเป็นที่คุณคาดการณ์ ค่าเป้าหมายที่แท้จริงสำหรับสุ่มXxie

e(model)=P[f(X)=model(X)],
X

เมื่อใช้สูตร Bayes คุณสามารถคำนวณความน่าจะเป็นที่กลุ่มตัวอย่างใหม่มีค่าเป้าหมายได้จากข้อมูล :xvD

P(vD)=f^P(vf^)P(f^D).
หนึ่งควรเน้นว่า

  • มักจะเป็นหรือเนื่องจากเป็นหน้าที่ของ ,P(vf^)01f^x
  • ไม่ปกติ แต่เกือบตลอดเวลามันเป็นไปไม่ได้ที่จะประมาณค่า (ยกเว้นกรณีเล็กน้อยดังกล่าวข้างต้น)P(f^D)
  • ไม่ปกติ แต่เกือบตลอดเวลาจำนวนรุ่นที่เป็นไปได้ใหญ่เกินไปสำหรับการประเมินผลรวมf^

ดังนั้นจึงเป็นเรื่องยากมากที่จะได้รับ / ประเมินในกรณีส่วนใหญ่P(vD)

ตอนนี้เราไปยังลักษณนามของ Optimal Bayes สำหรับกำหนดจะทำนายค่า ตั้งแต่นี้เป็นค่าที่น่าจะเป็นมากที่สุดในหมู่เป้าหมายเป็นไปได้ทั้งหมดค่า , ลักษณนามที่เหมาะสม Bayes เพิ่มมาตรการประสิทธิภาพ{F})x

v^=argmaxvf^P(vf^)P(f^D).
ve(f^)

เนื่องจากเราใช้ตัวจําแนกเบส์เป็นเกณฑ์มาตรฐานเพื่อเปรียบเทียบประสิทธิภาพของตัวจําแนกอื่น ๆ ทั้งหมด

อาจเป็นไปได้ว่าคุณใช้ตัวจําแนกเบส์รุ่นซื่อๆ มันง่ายที่จะติดตั้งใช้งานได้ดีเวลาส่วนใหญ่ แต่คำนวณเพียงการประเมินไร้เดียงสาเท่านั้นP(vD)


ตัวจําแนกเบย์ (ไม่ใช่ซื่อๆเบย์) เป็นตัวจําแนกเบย์ที่เหมาะสมหรือไม่? และความน่าจะเป็นก่อนหน้านี้คืออะไร? P(v|f)
RuiQi

@RuiQi ผมไม่คิดว่ามีสิ่งดังกล่าวเป็นลักษณนามเบส์ ฉันรู้ว่าตัวจําแนกเบส์ไร้เดียงสาและลักษณนามเบย์ที่ดีที่สุด
แอนทอน

@RuiQiน่าจะเป็นว่ากลุ่มตัวอย่างที่จะจัดจะตกอยู่ในระดับถ้าเราใช้ทำนายรูปแบบ{F} ฉันเดาว่าคุณสามารถเรียกมันว่าน่าจะเป็นก่อนหน้านี้ P(vf^)vf^
แอนทอน

0

ผลการดำเนินงานในแง่ของอัตราความสำเร็จของการแยกประเภทที่เกี่ยวข้องกับความเป็นไปได้ว่าชั้นจริงเท่ากับระดับที่คาดการณ์C_PCTCP

คุณสามารถแสดงความน่าจะเป็นนี้เป็นอินทิกรัลสำหรับทุกสถานการณ์ที่เป็นไปได้ของคุณสมบัติเวกเตอร์ (หรือผลรวมเมื่อไม่ต่อเนื่อง) และความน่าจะเป็นแบบมีเงื่อนไขในการจำแนกความถูกต้องสำหรับเหล่านั้นXXx

P(CT=CP)=all possible Xf(x)P(CT=CP|x)dx

ที่ไหนคือความหนาแน่นความน่าจะเป็นสำหรับคุณลักษณะเวกเตอร์Xf(x)X

หากสำหรับชุดของคุณลักษณะที่เป็นไปได้ตัวจําแนกไม่ได้เลือกคลาสที่น่าจะเป็นไปได้มากที่สุดสําหรับชุดคุณลักษณะนั้นก็จะสามารถปรับปรุงได้x

Bayes ลักษณนามเสมอเลือกชั้นน่าจะเป็นที่สุดสำหรับชุดของคุณลักษณะแต่ละ (ระยะเป็นสูงสุด) จึงไม่สามารถปรับปรุงให้ดีขึ้นอย่างน้อยไม่ได้ขึ้นอยู่กับการมีxxP(CT=CP|x)x

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.