คำจำกัดความของเวลาความสัมพันธ์อัตโนมัติ (สำหรับขนาดตัวอย่างที่มีประสิทธิภาพ)


23

ฉันได้พบคำจำกัดความสองข้อในวรรณคดีสำหรับช่วงเวลาของความสัมพันธ์อัตโนมัติของอนุกรมเวลาที่ไม่คงที่:

τa=1+2k=1ρkversusτb=1+2k=1|ρk|

ที่เป็นอัตที่ล่าช้าk kρk=Cov[Xt,Xt+h]Var[Xt]k

โปรแกรมประยุกต์หนึ่งของเวลาอัตคือการหา "ขนาดของกลุ่มตัวอย่างที่มีประสิทธิภาพ": ถ้าคุณมีสังเกตของอนุกรมเวลาและคุณรู้ว่าเวลาของอัตแล้วคุณสามารถหลอกว่าคุณมีτnτ

neff=nτ

ตัวอย่างอิสระแทนมีความสัมพันธ์กันเพื่อวัตถุประสงค์ในการหาค่าเฉลี่ย การประมาณจากข้อมูลนั้นไม่ใช่เรื่องไร้สาระ แต่มีวิธีการสองสามวิธี (ดูThompson 2010 )τnτ

คำนิยามที่ไม่มีค่าสัมบูรณ์ดูเหมือนจะพบได้บ่อยในวรรณคดี แต่ก็ยอมรับว่าเป็นไปได้ของ<1 ใช้ R และแพ็คเกจ "coda":τ a < 1τaτa<1

require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000)         # white noise 
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000)    # AR(1)
effectiveSize(ts.uncorr)                             # Sanity check
    # result should be close to 10000
effectiveSize(ts.corr)
    # result is in the neighborhood of 30000... ???

ฟังก์ชั่น "effectiveSize" ใน "coda" ใช้คำจำกัดความของเวลาความสัมพันธ์อัตโนมัติที่เทียบเท่ากับด้านบน มีบางแพคเกจ R อื่น ๆ ออกมีที่มีประสิทธิภาพการคำนวณขนาดของกลุ่มตัวอย่างหรืออัตเวลาและทุกคนที่ผมได้พยายามผลให้สอดคล้องกับการนี้ว่า AR (1) กระบวนการที่มีค่าสัมประสิทธิ์เชิงลบ AR มีมากขึ้นตัวอย่างที่มีประสิทธิภาพกว่าความสัมพันธ์ อนุกรมเวลา ดูเหมือนว่าจะแปลก τa

เห็นได้ชัดว่าสิ่งนี้ไม่สามารถเกิดขึ้นได้ในนิยามของเวลาของความสัมพันธ์อัตโนมัติτb

คำจำกัดความที่ถูกต้องของเวลาของความสัมพันธ์อัตโนมัติคืออะไร? มีบางอย่างผิดปกติหรือไม่ที่ฉันเข้าใจขนาดตัวอย่างที่มีประสิทธิภาพหรือไม่ ผลลัพธ์ที่ปรากฏข้างต้นดูเหมือนว่ามันจะต้องเป็นผิด ... สิ่งที่เกิดขึ้น?neff>n


เพียงเพื่อให้แน่ใจว่าฉันไม่ได้เข้าใจผิดว่าควรจะเป็นแทนที่จะเป็น ? hCov(Xt,Xt+k)h
sachinruk

2
ผมสนใจในความหมายที่สองคือ\คุณสามารถให้วรรณกรรมที่คุณพบมันได้หรือไม่ τb
Harry

คำตอบ:


17

ข้อแรกคำจำกัดความที่เหมาะสมของ "ขนาดตัวอย่างที่มีประสิทธิภาพ" คือ IMO ที่เชื่อมโยงกับคำถามที่เฉพาะเจาะจง ถ้ามีการกระจายตัวเหมือนกันกับค่าเฉลี่ยและความแปรปรวน 1 ค่าเฉลี่ยเชิงประจักษ์ เป็นตัวประมาณค่าที่เป็นกลาง\แต่แล้วความแปรปรวนของมันล่ะ? สำหรับอิสระตัวแปรแปรปรวนเป็น1} สำหรับอนุกรมเวลาที่นิ่งนิ่งความแปรปรวนของคือ μ μ = 1X1,X2,μμn-1 μ 1

μ^=1nk=1nXk
μn1μ^nneff=n/τan - 1 eff nneffneff=n/τa
1n2k,l=1ncov(Xk,Xl)=1n(1+2(n1nρ1+n2nρ2++1nρn1))τan.
ประมาณที่ถูกต้องสำหรับขนาดใหญ่พอที่nหากเรากำหนดความแปรปรวนของค่าเฉลี่ยเชิงประจักษ์สำหรับอนุกรมเวลาที่อยู่นิ่ง ๆ จะอยู่ที่ประมาณซึ่งเป็นความแปรปรวนเดียวกัน ราวกับว่าเรามีตัวอย่างอิสระดังนั้นเป็นคำจำกัดความที่เหมาะสมหากเราขอความแปรปรวนของค่าเฉลี่ยเชิงประจักษ์ มันอาจไม่เหมาะสมสำหรับวัตถุประสงค์อื่นnneff=n/τaneff1neffneff=n/τa

ด้วยความสัมพันธ์เชิงลบระหว่างการสังเกตเป็นไปได้อย่างแน่นอนว่าความแปรปรวนอาจน้อยกว่า ( ) นี่เป็นเทคนิคการลดความแปรปรวนที่เป็นที่รู้จักกันดีในการบูรณาการ Monto Carlo: หากเราแนะนำความสัมพันธ์เชิงลบระหว่างตัวแปรแทนที่จะเป็นความสัมพันธ์ 0 เราสามารถลดความแปรปรวนได้โดยไม่ต้องเพิ่มขนาดตัวอย่าง n eff > nn1neff>n


2
สำหรับผู้ที่ต้องการทราบเพิ่มเติมเกี่ยวกับการใช้ความสัมพันธ์เชิงลบในการจำลอง Monte Carlo ลองใช้ googling "antithetic variates" ข้อมูลอื่น ๆ ในบันทึกหลักสูตรที่นี่หรือที่นี่
andrewtinka

1

ดู http://arxiv.org/pdf/1403.5536v1.pdf

และ

https://cran.r-project.org/web/packages/mcmcse/mcmcse.pdf

สำหรับขนาดตัวอย่างที่มีประสิทธิภาพ ฉันคิดว่าการกำหนดทางเลือกโดยใช้อัตราส่วนของความแปรปรวนตัวอย่างและความแปรปรวนของห่วงโซ่มาร์คอฟแบบอะซิมโทติคผ่านค่าเฉลี่ยแบทช์เป็นตัวประมาณที่เหมาะสมกว่า


4
คุณสามารถขยายเนื้อหาในลิงค์เหล่านั้นได้หรือไม่? เมื่อมันมาถึง sthis สั้นเกินไปสำหรับคำตอบตามมาตรฐานของเรา!
kjetil b halvorsen
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.