มีตัวประมาณระยะทางของ Hellinger ระหว่างการแจกแจงสองแบบหรือไม่?


20

ในการตั้งค่าที่หนึ่งสังเกตกระจายออกมาจากการกระจายความหนาแน่นฉันสงสัยว่ามีการประมาณการที่เป็นกลาง (ตามx_i 's) ของระยะทาง Hellinger การกระจายที่มีความหนาแน่นอีกf_0คือ mathfrak \ {H} (f, f_0) = \ left \ {1 - \ int_ \ mathcal {X} \ sqrt {f (x) f_0 (x)} \ text {d} x \ right \} ^ {1/2} \ ,. f X ฉันf 0 H ( f , f 0 ) = { 1 - X X1,,XnfXif0

H(f,f0)={1Xf(x)f0(x)dx}1/2.

4
ดังนั้น f0 จึงเป็นที่รู้จักและได้รับการแก้ไข แต่เป็นที่รู้จักหรือมาจากครอบครัวที่มีพารามิเตอร์หรือกำลังทำอยู่ในกรอบที่ไม่มีพารามิเตอร์พร้อมกับสิ่งที่คุณรู้เกี่ยวกับ f ที่มาจากตัวอย่างของคุณหรือไม่ ฉันคิดว่ามันสร้างความแตกต่างเมื่อพยายามตอบ
Michael R. Chernick

3
@MichaelChernick: ถือว่าสิ่งที่คุณรู้เกี่ยวกับfเป็นตัวอย่างX_1X1,,Xn
ซีอาน

2
ฉันไม่คิดว่ามันถูกคำนวณ (ถ้ามี) หากมีอยู่ AIC ก็มีน้องชายที่สูญหาย

4
การโจมตีปัญหานี้ดูจะเป็นไปได้ถ้าคุณคิดว่าfและf0นั้นไม่ต่อเนื่อง สิ่งนี้นำไปสู่การประมาณที่ชัดเจน (คำนวณระยะทาง Hellinger ระหว่าง EDF และf0 ) การบูตสแตรปปิ้ง (ตามหลักทฤษฏีไม่ใช่ผ่านการจำลอง!) จะให้เราจัดการกับอคติที่เป็นไปได้เช่นเดียวกับวิธีการลด (หรือกำจัด) อคติ ฉันหวังว่าจะประสบความสำเร็จกับระยะทางกำลังสองมากกว่าระยะทางเพราะมันเป็นเวทย์มนตร์ทางคณิตศาสตร์มากกว่า สมมติฐานของfแยกกันfไม่มีปัญหาในการใช้งาน พื้นที่ของf ที่ไม่ต่อเนื่องfเป็นเซตย่อยที่หนาแน่น
whuber

2
มันมาถึงใจหลักฐาน Rosenblatt ว่าไม่มี "สุจริต" ประมาณการเป็นกลางของฉfขอให้เราเอาชนะมันและรับตัวประมาณค่าที่ไม่เป็นกลางของH(f,f0)ไหม ฉันไม่รู้
Zen

คำตอบ:


5

ไม่มีตัวประมาณที่เป็นกลางHหรือH2อยู่สำหรับfจากการแจกแจงแบบ nonparametric class ที่สมเหตุสมผลพอสมควร

เราสามารถแสดงสิ่งนี้ได้ด้วยข้อโต้แย้งง่ายๆ

Bickel และ Lehmann (1969) การประมาณค่าที่เป็นกลางในครอบครัวนูน พงศาวดารของสถิติคณิตศาสตร์, 40 (5) 2066-2078 ( โครงการยูคลิด )

แก้ไขการกระจายบาง ,และ , สอดคล้องกับความหนาแน่น ,และGขอแสดงว่าและให้จะประมาณการบางส่วนของขึ้นอยู่กับตัวอย่าง IIDF F G 0กรัมH ( F ) H ( F , F 0 ) H ( X ) H ( F ) n X ฉัน ~ FF0FGf0fgH(F)H(f,f0)H^(X)H(F)nXiF

สมมติว่าไม่เอนเอียงสำหรับตัวอย่างจากการแจกแบบฟอร์ม แต่แล้ว ดังนั้นต้องเป็นพหุนามใน Mแอลฟา:=αF+(1-α)G Q ( α )H^

Mα:=αF+(1α)G.
Q(α)αn
Q(α)=H(Mα)=x1xnH^(X)dMα(x1)dMα(xn)=x1xnH^(X)[αdF(x1)+(1-α)dG(x1)][αdF(xn)+(1-α)dG(xn)]=αnEX~Fn[H^(X)]++(1-α)nEX~Gn[H^(X)],
Q(α)αปริญญาที่มากที่สุดnn

ตอนนี้เรามาเชี่ยวชาญกับกรณีที่สมเหตุสมผลและแสดงว่าสอดคล้องกันไม่ใช่พหุนามQ

ปล่อยให้เป็นการกระจายตัวที่มีความหนาแน่นคงที่ใน :สำหรับทั้งหมด (พฤติกรรมของมันอยู่นอกช่วงนั้นไม่สำคัญ) ปล่อยให้เป็นการกระจายบางอย่างที่สนับสนุนเฉพาะในและการกระจายบางอย่างที่สนับสนุนบนเท่านั้น [ - 1 , 1 ] f 0 ( x ) = c | x | 1 F [ - 1 , 0 ] G [ 0 , 1 ]F0[-1,1]0(x)=|x|1F[-1,0]G[0,1]

ตอนนี้ ที่และเช่นเดียวกันสำหรับB_Gโปรดทราบว่า ,สำหรับการแจกแจง ,ใด ๆที่มีความหนาแน่นBF:=R

Q(α)=H(ม.α,0)=1-Rม.α(x)0(x)dx=1--10α(x)dx-01(1-α)ก.(x)dx=1-αBF-1-αBG,
BGBF>BF=R(x)0(x)dxBGB G > 0 F GBF>0BG>0FG

G1-αBF-1-αBGไม่ได้เป็นพหุนามขององศาที่แน่นอนใด ๆ ดังนั้นไม่มีตัวประมาณไม่เอนเอียงสำหรับในการแจกแจงทั้งหมดมีตัวอย่างมากมายHMαH^HMα

ในทำนองเดียวกันเนื่องจากยังไม่ใช่พหุนามไม่มีตัวประมาณสำหรับซึ่งไม่เอนเอียงกับการแจกแจงทั้งหมดพร้อมตัวอย่างจำนวน จำกัด H 2Mα1-αBF-1-αBGH2Mα

สิ่งนี้ไม่รวมคลาส nonparametric ที่สมเหตุสมผลทั้งหมดของการแจกแจงยกเว้นกลุ่มที่มีความหนาแน่นล้อมรอบด้านล่าง คุณอาจฆ่าคลาสเหล่านั้นด้วยอาร์กิวเมนต์ที่คล้ายกันโดยเพียงแค่ทำให้ความหนาแน่นคงที่หรือบางสิ่งบางอย่าง


13

ฉันไม่รู้วิธีการสร้าง (ถ้ามี) ตัวประมาณระยะทางของ Hellinger ที่ไม่มีอคติ ดูเหมือนเป็นไปได้ที่จะสร้างตัวประมาณที่สอดคล้องกัน ขณะนี้มีบางส่วนคงเป็นที่รู้จักกันหนาแน่นและตัวอย่างที่สุ่มจากความหนาแน่น 0 เราต้องการประมาณ ที่ซิมฉ โดย SLLN เรารู้ว่า เกือบจะแน่นอนเหมือนX 1 , , X n f >0X1,...,XnH ( f , f 0 ) = >0 =

H(,0)=1-X(x)0(x)dx=1-X0(x)(x)(x)dx
X
=1-E[0(X)(X)],
X~
1-1nΣผม=1n0(Xผม)(Xผม)H(,0),
n. ดังนั้นวิธีที่เป็นกันเองในการประมาณจะใช้ตัวประมาณความหนาแน่น (เช่นตัวประมาณความหนาแน่นของเคอร์เนลดั้งเดิม) ของและคำนวณ H(,0)n^
H^=1-1nΣผม=1n0(Xผม)n^(Xผม).

3
@ เซน: จุดดี! ผมคิดว่าคำตอบนี้เป็นคำตอบเพราะมันทำให้ฉันรู้เสียงมากเช่นค่าเบี่ยงเบนมาตรฐานที่มีอยู่ไม่มีประมาณการที่เป็นกลาง สำหรับความแปรปรวนของไม่ต้องกังวล:หมายความว่าตัวประมาณนี้มีความแปรปรวนแน่นอน HH^n2E[(0(X)/(X))2]=1
ซีอาน

1
ขอบคุณสำหรับการชี้แจงเกี่ยวกับความแปรปรวนของตัวประมาณซีอาน!
Zen

2
งานบางอย่างเกี่ยวกับตัวประมาณความสอดคล้องอื่น ๆ : (a) arxiv.org/abs/1707.03083และงานที่เกี่ยวข้องตามตัวประมาณความหนาแน่น -NN; (b) arxiv.org/abs/1402.2966ตามการแก้ไขความหนาแน่นของเคอร์เนล (c) ieeexplore.ieee.org/document/5605355ขึ้นอยู่กับการเชื่อมต่อกับการจำแนกประเภท (สิ่งเหล่านี้จำนวนมากขึ้นอยู่กับตัวอย่างจากทั้งและเพราะนั่นคืองานที่ฉันรู้เกี่ยวกับมือฉาบ แต่ฉันคิดว่ามีตัวแปรสำหรับรู้จัก)f f 0 f 0k00
Dougal
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.