ในขณะที่ฉันกำลังศึกษาเกี่ยวกับความพอเพียงฉันพบคำถามของคุณเพราะฉันต้องการเข้าใจสัญชาตญาณเกี่ยวกับสิ่งที่ฉันรวบรวมได้จากสิ่งที่ฉันคิดขึ้นมา (แจ้งให้เราทราบว่าคุณคิดอย่างไรถ้าฉันทำผิดพลาด ฯลฯ )
Let จะเป็นตัวอย่างที่สุ่มจากการกระจาย Poisson ที่มีค่าเฉลี่ยθ > 0X1, ...,Xnθ > 0
เรารู้ว่าเป็นสถิติที่เพียงพอสำหรับθเนื่องจากการแจกแจงเงื่อนไขของX 1 , … , X nให้T ( X )เป็นอิสระจากθในคำอื่น ๆ ไม่ได้ ขึ้นอยู่กับθT( X ) = ∑ni = 1XผมθX1, … , XnT( X )θθ
ตอนนี้สถิติรู้ว่าX 1 , ... , X n ฉัน ผม d ~ P o ฉันs s o n ( 4 )และสร้างn =A X1, … , Xn~ผม ผม dPโอฉันs s o n ( 4 )ค่าสุ่มจากการกระจายนี้:n = 400
n<-400
theta<-4
set.seed(1234)
x<-rpois(n,theta)
y=sum(x)
freq.x<-table(x) # We will use this latter on
rel.freq.x<-freq.x/sum(freq.x)
สำหรับค่าสถิติAได้สร้างขึ้นเขาจะนำผลรวมของมันมาใช้และขอให้นักสถิติดังต่อไปนี้:B
"ฉันมีค่าตัวอย่างเหล่านี้นำมาจากการแจกแจงแบบปัวซงรู้ว่า∑ n i = 1 x i =x1, … , xnคุณจะบอกอะไรฉันเกี่ยวกับการกระจายตัวนี้"Σni = 1xผม= y= 4068
ดังนั้นรู้เพียงว่า (และความจริงที่ว่าตัวอย่างเกิดขึ้นจากการแจกแจงปัวซง) เพียงพอสำหรับนักสถิติBΣni = 1xผม= y= 4068Bจะพูดอะไรเกี่ยวกับ ? เนื่องจากเรารู้ว่านี่เป็นสถิติที่เพียงพอเราจึงรู้ว่าคำตอบคือ "ใช่"θ
ในการรับความสนใจบางอย่างเกี่ยวกับความหมายของสิ่งนี้ให้ทำดังต่อไปนี้ (นำมาจาก Hogg & Mckean & Craig ของ "สถิติเบื้องต้นทางคณิตศาสตร์" ของ Craig, ฉบับที่ 7, แบบฝึกหัด 7.1.9):
" ตัดสินใจสร้างการสังเกตการณ์ปลอมซึ่งเขาเรียกว่าz 1 , z 2 , … , z n (ดังที่เขารู้ว่าพวกเขาอาจจะไม่เท่ากับค่าxดั้งเดิม) ดังต่อไปนี้เขาตั้งข้อสังเกตว่าความน่าจะเป็นตามเงื่อนไขของปัวซองอิสระ ตัวแปรสุ่มZ 1 , Z 2 … , Z nเท่ากับz 1 , z 2 , … , z n , ให้∑ z i = y , คือBZ1, z2, … , znxZ1, Z2… , ZnZ1, z2, … , zn∑ zผม= y
θZ1อี- θZ1!θZ2อี- θZ2!⋯ θZnอี- θZn!n θYอี- n θY!= y!Z1! Z2! ⋯ zn!( 1)n)Z1( 1)n)Z2⋯ ( 1n)Zn
ตั้งแต่มีการกระจาย Poisson ที่มีค่าเฉลี่ยn θ การกระจายหลังเป็นพหุนามกับYทดลองอิสระแต่ละยุติในหนึ่งในnวิธีพิเศษร่วมกันและหมดจดแต่ละที่มีความน่าจะเป็นแบบเดียวกัน1 / n ดังนั้นBทำงานเช่นการทดลองพหุนามYทดลองอิสระและ Obtains Z 1 , ... , Z n ."Y= ∑ Zผมn θYn1 / nBYZ1, … , zn
นี่คือสิ่งที่ออกกำลังกายระบุ ดังนั้นขอให้ทำอย่างนั้น:
# Fake observations from multinomial experiment
prob<-rep(1/n,n)
set.seed(1234)
z<-as.numeric(t(rmultinom(y,n=c(1:n),prob)))
y.fake<-sum(z) # y and y.fake must be equal
freq.z<-table(z)
rel.freq.z<-freq.z/sum(freq.z)
และเรามาดูกันว่ามีลักษณะเป็นอย่างไร (ฉันกำลังวางแผนความหนาแน่นของปัวซอง (4) สำหรับk = 0 , 1 , … , 13 - อะไรก็ตามที่สูงกว่า 13 คือศูนย์ pratically - สำหรับการเปรียบเทียบ):Zk = 0 , 1 , … , 13
# Verifying distributions
k<-13
plot(x=c(0:k),y=dpois(c(0:k), lambda=theta, log = FALSE),t="o",ylab="Probability",xlab="k",
xlim=c(0,k),ylim=c(0,max(c(rel.freq.x,rel.freq.z))))
lines(rel.freq.z,t="o",col="green",pch=4)
legend(8,0.2, legend=c("Real Poisson","Random Z given y"),
col = c("black","green"),pch=c(1,4))
ดังนั้นไม่รู้อะไรเลยเกี่ยวกับและรู้เพียงแค่สถิติที่เพียงพอY = ∑ X ฉันเราสามารถเรียกคืน "การแจกแจง" ที่มีลักษณะเหมือนการแจกแจงปัวซอง (4)θY= ∑ Xผมการเพิ่มขึ้นของทั้งสองกลายเป็นเส้นโค้งที่คล้ายกันมากขึ้น)n
ตอนนี้เปรียบเทียบและZ | y :XZ| Y
plot(rel.freq.x,t="o",pch=16,col="red",ylab="Relative Frequency",xlab="k",
ylim=c(0,max(c(rel.freq.x,rel.freq.z))))
lines(rel.freq.z,t="o",col="green",pch=4)
legend(7,0.2, legend=c("Random X","Random Z given y"), col = c("red","green"),pch=c(16,4))
เราเห็นว่าพวกมันคล้ายกันมาก (ตามที่คาดไว้)
XผมY= X1+ X2+ ⋯ + Xn