เพื่อให้เข้าใจการสนทนาของวาตานาเบะเป็นสิ่งสำคัญที่ต้องตระหนักว่าสิ่งที่เขาหมายถึงโดย "ความเป็นเอกเทศ" ความแปลกประหลาด (เข้มงวด) เกิดขึ้นพร้อมกับแนวคิดทางเรขาคณิตของการวัดเชิงเอกพจน์ในทฤษฎีของเขา
p.10 [Watanabe]: "แบบจำลองทางสถิติถูกกล่าวว่าเป็นปกติถ้ามันสามารถระบุได้และมีตัวชี้วัดเชิงบวกแน่นอนถ้าแบบจำลองทางสถิติไม่ปกติก็จะเรียกว่าเอกพจน์อย่างเคร่งครัด"p ( x ∣ w )
ในทางปฏิบัติภาวะเอกฐานมักเกิดขึ้นเมื่อตัวชี้วัดข้อมูลฟิชเชอร์เกิดขึ้นจากแบบจำลองในรูปแบบที่เสื่อมโทรมในรูปแบบที่กำหนดโดยแบบจำลองเช่นกรณีระดับต่ำหรือกระจัดกระจายในงาน "การเรียนรู้เครื่อง"
สิ่งที่วาตานาเบะพูดเกี่ยวกับการลู่เข้าของการเบี่ยงเบนของเคแอลเชิงประจักษ์กับค่าทางทฤษฎีสามารถเข้าใจได้ดังนี้ ต้นกำเนิดหนึ่งของแนวคิดเรื่องความแตกต่างมาจากสถิติที่แข็งแกร่ง M- ประมาณซึ่งรวมถึง MLE เป็นกรณีพิเศษที่มีฟังก์ชั่นความคมชัดมักจะกล่าวถึงการใช้โทโพโลยีที่อ่อนแอ มันมีเหตุผลที่จะหารือเกี่ยวกับพฤติกรรมการลู่เข้าโดยใช้โทโพโลยีที่อ่อนแอเหนือพื้นที่ (ความหลากหลายของมาตรการที่เป็นไปได้ทั้งหมดที่กำหนดไว้ในพื้นที่โปแลนด์ ) เพราะเราต้องการศึกษาพฤติกรรมความทนทานของ MLE ทฤษฎีบทคลาสสิกใน [Huber] ระบุว่ามีการแยกออกจากกันได้ดีฟังก์ชั่นแตกต่างเดลต้า)M ( X ) X D ( θ 0 , θ ) = E θ 0 ρ ( θ , δ ) inf | θ - θ 0 | ≥ ϵ ( | D ( θ 0 , θ ) - D (ρ ( θ , δ( X) ) = - บันทึกp ( X)∣ θ )M( X)XD ( θ0, θ ) = Eθ0ρ ( θ , δ)sup θ | 1
INF| θ- θ0| ≥ϵ( | D ( θ0, θ ) - D ( θ0, θ0) | ) > 0
และการประมาณค่าเชิงประจักษ์ที่ดีของการความแตกต่าง,
พร้อมกับความสม่ำเสมอเราสามารถสร้างความมั่นคงในความรู้สึก
จะมาบรรจบกันที่ในความน่าtheta_0} ผลลัพธ์นี้ต้องใช้เงื่อนไขที่แม่นยำยิ่งขึ้นหากเราเปรียบเทียบกับผลลัพธ์ของ Doob [Doob] ในความสม่ำเสมอของตัวประมาณค่าแบบเบย์
^ θ n :=argจีบθ|||1nΣผมρ ( θ , δ( Xผม) ) - D ( θ0, θ ) ∣||→ 0 , n → ∞
θn^: = a r gm ฉันnθρ ( θ , δ( Xn) )
θ0Pθ0
ดังนั้นที่นี่ตัวประมาณแบบเบย์และ MLE diverges หากเรายังคงใช้โทโพโลยีที่อ่อนแอเพื่อหารือเกี่ยวกับความสอดคล้องของตัวประมาณค่าแบบเบส์มันไม่มีความหมายเพราะตัวประมาณแบบเบย์จะเสมอ ดังนั้นโทโพโลยีที่เหมาะสมกว่าคือโครงสร้างการกระจายแบบชวาตซ์ซึ่งอนุญาตให้ทฤษฎีอนุพันธ์ที่อ่อนแอและทฤษฎีของ von Mises เข้ามามีบทบาทได้ Barron มีรายงานทางเทคนิคที่ดีมากในหัวข้อนี้ว่าเราสามารถใช้ทฤษฎีบท Schwartz เพื่อให้ได้ความสอดคล้องกันได้อย่างไร
ในอีกมุมมองตัวประมาณแบบเบย์คือการแจกแจงและโทโพโลยีของพวกเขาควรมีความแตกต่าง ถ้าเช่นนั้นแล้ว divergenceบทบาทอย่างไรในทอพอโลยีแบบนั้น? คำตอบคือกำหนดการสนับสนุน KL ของนักบวชซึ่งทำให้ตัวประมาณ Bayesian มีความสอดคล้องกันอย่างยิ่งD
"ผลการเรียนรู้เอกพจน์" นั้นได้รับผลกระทบเพราะอย่างที่เราเห็นทฤษฎีบทความมั่นคงของ Doob ทำให้แน่ใจว่าตัวประมาณแบบเบย์มีความอ่อนตัวสม่ำเสมอ (แม้ในรูปแบบเอกพจน์) ในโครงสร้างที่อ่อนแอในขณะที่ MLE
คำเดียว [Watanabe] ไม่ใช่สำหรับผู้เริ่มต้น มันมีความหมายลึกซึ้งในชุดการวิเคราะห์จริงซึ่งต้องการวุฒิภาวะทางคณิตศาสตร์มากกว่านักสถิติส่วนใหญ่จึงอาจไม่ควรอ่านโดยไม่มีแนวทางที่เหมาะสม
■อ้างอิง
[Watanabe] Watanabe, Sumio เรขาคณิตเชิงพีชคณิตและทฤษฎีการเรียนรู้ทางสถิติ ฉบับ 25. สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์, 2552
[Huber] Huber, Peter J. "พฤติกรรมของการประเมินความเป็นไปได้สูงสุดภายใต้เงื่อนไขที่ไม่เป็นมาตรฐาน" การประชุมทางวิชาการของเบิร์กลีย์ครั้งที่ห้าในสถิติและความน่าจะเป็นทางคณิตศาสตร์ ฉบับ 1. ลำดับ 1. 1967
[Doob] Doob, Joseph L. "การประยุกต์ใช้ทฤษฎี martingales" มีการคำนวณความน่าจะเป็นและการประยุกต์ใช้ (1949): 23-27