ทฤษฎีข้อมูล จำกัด ทฤษฎีบทกลาง


11

รูปแบบที่ง่ายที่สุดของ CLT เชิงทฤษฎีข้อมูล ได้แก่ :

ให้จะ IID ที่มีค่าเฉลี่ยและความแปรปรวน1 ปล่อยให้f_nเป็นความหนาแน่นของผลรวม\ frac {\ sum_ {i = 1} ^ n X_i} {\ sqrt {n}}และ\ phiเป็นความหนาแน่นแบบเกาส์มาตรฐาน จากนั้นข้อมูลเชิงทฤษฎี CLT ระบุว่าถ้าD (f_n \ | \ phi) = \ int f_n \ log (f_n / \ phi) dxมีขอบเขตสำหรับnบางตัวดังนั้นD (f_n \ | \ phi) \ to 0เป็นn \ to \X1,X2,01fni=1nXinϕD(fnϕ)=fnlog(fn/ϕ)dxnD(fnϕ)0n

แน่นอนว่าการบรรจบกันนี้ในแง่หนึ่งก็คือ "แข็งแกร่ง" กว่าการบรรจบกันอย่างดีในวรรณคดีการบรรจบกันในการกระจายและการบรรจบกันในL1สมมาตรเนื่องจากความไม่สมดุลของ Pinsker (|fnϕ|)22fnlog(fn/ϕ)พี) นั่นคือการลู่เข้าใน KL-divergence หมายถึงการลู่เข้าในการกระจายและการลู่ในระยะL1

ฉันต้องการทราบสองสิ่ง

  1. มีอะไรดีมากเกี่ยวกับผลลัพธ์D(fnϕ)0 ?

  2. มันเป็นเพียงเพราะเหตุผลที่ระบุไว้ในวรรคสามเราพูดบรรจบกันใน KL-แตกต่าง ( เช่น , D(fnϕ)0 ) แข็งแรง?

NB: ฉันถามคำถามนี้เมื่อไม่นานมานี้ใน math.stackexchange ที่ฉันไม่ได้รับคำตอบใด ๆ


โปรดระบุลิงก์ไปยังคำถาม math.SE ที่ซ้ำกัน
พระคาร์ดินัล

6
ข้อความของคุณดูเหมือนจะมีความหนาแน่นโดยนัย (เทียบกับการวัด Lebesgue) คุณอาจสนใจในบทความสั้นและน่ายินดีนี้: AR Barron (1986), Entropy และทฤษฎีขีด จำกัด กลางของ Ann Probab ปีที่ 14 หมายเลข 1, 336-342 ( เปิดการเข้าถึง )
พระคาร์ดินัล

2
ฉันดูกระดาษแผ่นนั้นแล้ว เขาให้แรงบันดาลใจในมุมมองเชิงทฤษฎีข้อมูลในย่อหน้าที่สองของหน้า 1 มันไม่ชัดเจนสำหรับฉันในเวลานั้น ตอนนี้มันดูโอเค ถึงกระนั้นหากใครสามารถอธิบายสิ่งต่อไปนี้ได้อย่างชัดเจนและโพสต์เป็นคำตอบมันก็คงจะดีมาก "จากทฤษฎีสารสนเทศ, เอนโทรปีสัมพัทธ์นั้นมีค่าน้อยที่สุดบนความซ้ำซ้อน (ความยาวเฉลี่ยของคำอธิบายที่มากเกินไป) ของรหัสแชนนอนตามการแจกแจงแบบปกติเมื่ออธิบายปริมาณของตัวอย่างจาก " ฉันได้ลบคำถามนั้นในวิชาคณิตศาสตร์เพราะมันไม่ได้ดึงดูดใครที่นั่นDnfn
Ashok

@cardinal: tks สำหรับกระดาษที่ดี
Zen

คำตอบ:


5

สิ่งหนึ่งที่ดีกับทฤษฎีบทนี้ก็คือมันแนะนำทฤษฎีบทขีด จำกัด ในการตั้งค่าบางอย่างที่ไม่ได้ใช้ทฤษฎีขีด จำกัด กลางปกติ ตัวอย่างเช่นในสถานการณ์ที่การกระจายเอนโทรปีสูงสุดคือการแจกแจงแบบไม่ปกติบางอย่างเช่นการแจกแจงแบบวงกลมมันเป็นการรวมตัวของการกระจายตัวแบบสม่ำเสมอ


ฉันไม่เข้าใจ ตามที่ฉันได้กล่าวไปแล้วการบรรจบกันใน KL divergence หมายถึงการลู่เข้าหากันในการกระจาย ดังนั้นไม่ว่าจะใช้ทฤษฎีข้อมูล CLT ใด CLT ปกติก็จะใช้เช่นกัน นอกจากนี้ CLT เชิงทฤษฎีข้อมูลยังถือว่าค่าความแปรปรวนแบบ จำกัด หรือฉันกำลังพลาดอะไรอยู่?
Ashok

2
สิ่งที่ฉันหมายถึงคือวิธีการของเอนโทรปีแสดงให้เห็นว่าขีด จำกัด อาจอยู่ในสถานการณ์ที่ขีด จำกัด นั้นไม่ใช่การแจกแจงแบบปกติ ขีด จำกัด คือการแจกแจงที่เพิ่มเอนโทรปีให้มากที่สุด
kjetil b halvorsen

3

หลังจากมองไปรอบ ๆ ฉันไม่สามารถหาตัวอย่างของการบรรจบกันของการกระจายโดยไม่มีการบรรจบกันในเอนโทรปีสัมพัทธ์ดังนั้นนี่เป็นการยากที่จะวัด "ความยิ่งใหญ่" ของผลลัพธ์นั้น

สำหรับฉันดูเหมือนว่าผลลัพธ์นี้จะอธิบายถึงเอนโทรปีสัมพัทธ์ของผลิตภัณฑ์คอนโวลูชัน มันมักถูกมองว่าเป็นการตีความทางเลือกและกรอบการพิสูจน์ของทฤษฎีขีด จำกัด กลางและฉันไม่แน่ใจว่ามันมีความหมายโดยตรงในทฤษฎีความน่าจะเป็น (แม้ว่าจะเป็นในทฤษฎีข้อมูล)

จากทฤษฎีข้อมูลสารสนเทศและทฤษฎีขีด จำกัด กลาง (หน้า 19)

กฎข้อที่สองของอุณหพลศาสตร์กล่าวว่าเอนโทรปีของอุณหพลศาสตร์จะเพิ่มขึ้นตามกาลเวลาซึ่งหมายถึงการลู่เข้าสู่รัฐกิ๊บส์ การอนุรักษ์พลังงานหมายความว่าคงที่ในช่วงเวลานี้วิวัฒนาการดังนั้นเราสามารถบอกได้ตั้งแต่เริ่มต้นว่ารัฐกิ๊บส์จะเป็นขีด จำกัด เราจะพิจารณาทฤษฎีขีด จำกัด กลางด้วยวิธีเดียวกันโดยแสดงให้เห็นว่าเอนโทรปีของข้อมูลเชิงทฤษฎีเพิ่มขึ้นสูงสุดในขณะที่เราใช้การโน้มน้าวใจ การทำให้เป็นมาตรฐานอย่างเหมาะสมหมายถึงความแปรปรวนยังคงที่ในระหว่างการโน้มน้าวใจดังนั้นเราสามารถบอกได้ตั้งแต่เริ่มต้นว่าเกาส์เซียนจะเป็นขีด จำกัดE


2
มีตัวอย่างมากมายของการบรรจบกันของการแจกแจงโดยไม่มีการบรรจบกันในเอนโทรปีสัมพัทธ์ - เมื่อใดก็ตามที่มีการกระจายแบบไม่ต่อเนื่องและ CLT ใช้ Xi
Mark Meckes

1

D(fnϕ)0รับรองว่าไม่มี "ระยะทาง" ระหว่างการกระจายของผลรวมของตัวแปรสุ่มและความหนาแน่นแบบเกาส์เป็นเพียงเพราะนิยามของ KL divergence ดังนั้นมันจึงเป็นข้อพิสูจน์ ตัวเอง บางทีฉันอาจเข้าใจผิดคำถามของคุณn

เกี่ยวกับประเด็นที่สองที่คุณได้รับการตอบรับในย่อหน้าของคุณ


1
CLT (Lindberg) ปกติระบุว่าค่าเฉลี่ยตัวอย่างลู่เข้าสู่การกระจายไปยัง RV ปกติ นั่นหมายความว่าลู่ CDF pointwise ไป\มีความแตกต่างทางทฤษฎีการวัดที่ลึกซึ้งระหว่างสิ่งนั้นกับผลลัพธ์ของ OP ที่ไม่สะท้อนให้เห็นในคำตอบของคุณที่นี่ Φ
AdamO
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.