คำถามเกี่ยวกับฟังก์ชั่นการเปลี่ยนแปลงตัวอย่างอัตโนมัติ


10

ฉันกำลังอ่านหนังสือการวิเคราะห์อนุกรมเวลาและสูตรสำหรับการคำนวณค่าตัวอย่างอัตโนมัติถูกกำหนดในหนังสือเป็น:

γ^(ชั่วโมง)=n-1Σเสื้อ=1n-ชั่วโมง(xเสื้อ+ชั่วโมง-x¯)(xเสื้อ-x¯)

กับ γ^(-ชั่วโมง)=γ^(ชั่วโมง) สำหรับ ชั่วโมง=0,1,...,n-1. x¯ คือค่าเฉลี่ย

ใครสามารถอธิบายได้โดยสัญชาตญาณว่าทำไมเราหารผลรวมด้วย n และไม่ได้โดย n-ชั่วโมง? หนังสือเล่มนี้อธิบายว่าเป็นเพราะสูตรข้างต้นเป็นฟังก์ชันที่ไม่เป็นลบแน่นอนและหารด้วยnเป็นที่ต้องการ แต่ไม่ชัดเจนสำหรับฉัน บางคนสามารถพิสูจน์สิ่งนี้หรือแสดงตัวอย่างหรือบางสิ่งได้

สำหรับฉันสิ่งที่ใช้งานง่ายในตอนแรกจะแบ่งโดย n-ชั่วโมง. นี่เป็นตัวประมาณค่าแบบเอนเอียงหรือเอนเอียงของ autocovariance หรือไม่?


1
หากอนุกรมเวลาของคุณถูกต้อง x1,x2,...,xn กับคนอื่น ๆ ทั้งหมด xผม, ผม<1 หรือ ผม>n ไม่ทราบจำนวนรวมต้องหยุดที่ เสื้อ=n-ชั่วโมง เมื่อไหร่ xเสื้อ+ชั่วโมง=xn เกิดขึ้นในผลรวม: คำต่อไป (สำหรับ เสื้อ=n-ชั่วโมง+1) ที่จะรวมอยู่ในผลรวมจะมี xn-ชั่วโมง+1+ชั่วโมง=xn+1 ในนั้นและ xn+1ไม่ได้เป็นส่วนหนึ่งของตัวอย่าง
Dilip Sarwate

@Dilip ฉันไม่คิดว่าเป็นปัญหา: คำถามเกี่ยวข้องกับการหารด้วย n หรือ nh ในความหมายของ γ^.
whuber

คำตอบ:


14

γ^ จะใช้ในการสร้างเมทริกซ์ความแปรปรวนร่วม: ได้รับ "ครั้ง" เสื้อ1,เสื้อ2,...,เสื้อkมันประมาณว่าความแปรปรวนร่วมของเวกเตอร์สุ่ม Xเสื้อ1,Xเสื้อ2,...,Xเสื้อk (ที่ได้จากสนามสุ่มในเวลานั้น) คือเมทริกซ์ (γ^(เสื้อผม-เสื้อJ),1ผม,Jk). สำหรับปัญหาหลายอย่างเช่นการทำนายมันเป็นสิ่งสำคัญที่การฝึกอบรมเช่นนั้นจะไม่มีความหมาย ในฐานะที่เป็นเมทริกซ์ความแปรปรวนสมมุติสมมุติว่าพวกเขาไม่สามารถมีค่าลักษณะเฉพาะเชิงลบใด ๆ ดังนั้นพวกเขาจะต้องเป็นบวกแน่นอน

สถานการณ์ที่ง่ายที่สุดซึ่งความแตกต่างระหว่างสองสูตร

γ^(ชั่วโมง)=n-1Σเสื้อ=1n-ชั่วโมง(xเสื้อ+ชั่วโมง-x¯)(xเสื้อ-x¯)

และ

γ^0(ชั่วโมง)=(n-ชั่วโมง)-1Σเสื้อ=1n-ชั่วโมง(xเสื้อ+ชั่วโมง-x¯)(xเสื้อ-x¯)

ปรากฏขึ้นเมื่อ x มีความยาว 2; พูด,x=(0,1). สำหรับเสื้อ1=เสื้อ และ เสื้อ2=เสื้อ+1 มันง่ายในการคำนวณ

γ^0=(14-14-1414),

ซึ่งเป็นเอกพจน์ในขณะที่

γ^=(14-18-1814)

ซึ่งมีค่าลักษณะเฉพาะ 3/8 และ 1/8มันเป็นบวกแน่นอน

ปรากฏการณ์ที่คล้ายกันเกิดขึ้นสำหรับ x=(0,1,0,1)ที่ไหน γ^ เป็นบวกแน่นอน แต่ γ^0- เมื่อนำไปใช้กับเวลา เสื้อผม=(1,2,3,4)พูด - แย่ลงในเมทริกซ์ของอันดับ 1 (รายการนั้นสลับกันระหว่าง 1/4 และ -1/4)

(มีรูปแบบที่นี่: ปัญหาเกิดขึ้นสำหรับใด ๆ x ของแบบฟอร์ม (a,,a,,...,a,).)

ในแอปพลิเคชั่นส่วนใหญ่จะเป็นชุดการสังเกต xเสื้อ นานมากที่สุด ชั่วโมง ที่น่าสนใจ - ซึ่งน้อยกว่ามาก n--ความแตกต่างระหว่าง n-1 และ (n-ชั่วโมง)-1ไม่มีผลใด ๆ ดังนั้นในทางปฏิบัติความแตกต่างไม่ใช่เรื่องใหญ่และในทางทฤษฎีความต้องการในเชิงบวกและความแตกต่างอย่างยิ่งจะแทนที่ความปรารถนาที่เป็นไปได้ใด ๆ สำหรับการประเมินที่เป็นกลาง


1
ฉันคิดว่ามันสำคัญที่จะต้องทราบว่าตัวประมาณค่าทั้งสองเป็นตัวประมาณแบบเอนเอียงแม้ว่าคุณจะหารด้วย nh
Ran

@ รันแม้ว่าคุณจะถูกต้องว่าตัวประมาณเหล่านี้มีอคติ แต่ฉันไม่เห็นด้วยว่านี่เป็นปัญหาสำคัญ: ดังที่ได้กล่าวไว้ในย่อหน้าที่แล้วอคติเล็กน้อยเป็นเรื่องกังวลน้อยที่สุดของใคร ตัวประมาณที่เป็นกลางใช้(n-ชั่วโมง-1)-1แทบแตกต่างจาก γ^ หรือ γ^0.
whuber

2
คำตอบที่ดีมาก +1 บางทีมันอาจมีประโยชน์ในการเพิ่มจุดที่Vγ^0(ชั่วโมง)=O(1/(n-ชั่วโมง))ในขณะที่ Vγ^(ชั่วโมง)=O(1/n), ดังนั้นเมื่อ ชั่วโมง อยู่ใกล้กับ nตัวประมาณ γ^0(ชั่วโมง) สามารถเอาแน่เอานอนไม่ได้ในขณะที่ γ^(ชั่วโมง) จะมีความผันผวนของการสุ่มตัวอย่างเล็ก ๆ น้อย ๆ อย่างสม่ำเสมอ ชั่วโมง. ดูเช่น Priestly (1981) "การวิเคราะห์สเปกตรัมและอนุกรมเวลา" p324 สำหรับการสนทนาโดยละเอียดของประเด็นนี้
Colin T Bowers
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.