ความสัมพันธ์ถือว่ามีความคงที่ของข้อมูลหรือไม่?


27

การวิเคราะห์ระหว่างตลาดเป็นวิธีการสร้างแบบจำลองพฤติกรรมของตลาดโดยใช้วิธีการค้นหาความสัมพันธ์ระหว่างตลาดที่แตกต่างกัน บ่อยครั้งที่ความสัมพันธ์ถูกคำนวณระหว่างสองตลาดพูดว่า S&P 500 และสมบัติ 30 ปีของสหรัฐฯ การคำนวณเหล่านี้มักจะไม่ได้ขึ้นอยู่กับข้อมูลราคาซึ่งเห็นได้ชัดสำหรับทุกคนว่ามันไม่เหมาะกับคำจำกัดความของอนุกรมเวลาคงที่

วิธีแก้ปัญหาที่เป็นไปได้ (ใช้การส่งคืนแทน) การคำนวณความสัมพันธ์ซึ่งข้อมูลไม่อยู่นิ่งแม้จะคำนวณทางสถิติที่ถูกต้องหรือไม่

คุณจะบอกว่าการคำนวณสหสัมพันธ์นั้นค่อนข้างไม่น่าเชื่อถือหรือไร้สาระธรรมดา ๆ ?


1
คุณหมายถึงอะไรโดย "การคำนวณทางสถิติที่ถูกต้อง" คุณควรพูดการคำนวณทางสถิติ (การประมาณค่า) ที่ถูกต้องของบางสิ่ง นี่คือบางสิ่งที่สำคัญมาก ความสัมพันธ์คือการคำนวณที่ถูกต้องของความสัมพันธ์เชิงเส้นระหว่างชุดข้อมูลสองชุด ฉันไม่เห็นว่าทำไมคุณต้องมีความนิ่งคุณหมายถึงความสัมพันธ์อัตโนมัติหรือไม่?
robin girard

2
มีเว็บไซต์ใหม่ซึ่งอาจจะเป็นมากขึ้นเหมาะสำหรับคำถามของคุณ: quant.stackexchange.com ตอนนี้คุณกำลังสับสนกับการตีความอย่างชัดเจน
mpiktas

@mpiktas ชุมชน quant ได้รับการตัดสินโดยใช้ผลตอบแทนเทียบกับราคาเนื่องจากความคงที่ของผลตอบแทนและความไม่แน่นอนของราคา ฉันขออะไรมากกว่าคำอธิบายง่ายๆว่าทำไมถึงเป็นเช่นนั้น
Milktrader

@robin มีหลายสิ่งที่ทำให้คุณต้องถามวิเคราะห์ทางสถิติ ขนาดของกลุ่มตัวอย่างคำนึงถึงสิ่งต่างๆเช่นข้อมูลที่ถูกจัดการ การไม่เรียกข้อมูลที่ไม่ชัดเจนทำให้เกิดการคำนวณสหสัมพันธ์หรือไม่?
Milktrader

ไม่ใช่การคำนวณบางทีการตีความหากความสัมพันธ์ไม่สูง ถ้ามันสูงหมายถึงสหสัมพันธ์สูง (เช่นความสัมพันธ์เชิงเส้นสูง) อนุกรมเวลาที่ไม่ใช่ stationnary พูดและอาจมีความสัมพันธ์สูง (ตัวอย่างเช่นเมื่อ .( Y t ) X t = Y t(Xt)(Yt)Xt=Yt
robin girard

คำตอบ:


37

ความสัมพันธ์วัดความสัมพันธ์เชิงเส้น ความสัมพันธ์ในบริบทที่ไม่เป็นทางการหมายถึงสิ่งที่มีเสถียรภาพ เมื่อเราคำนวณความสัมพันธ์ตัวอย่างสำหรับตัวแปรนิ่งและเพิ่มจำนวนจุดข้อมูลที่มีความสัมพันธ์ตัวอย่างนี้มีแนวโน้มที่จะมีความสัมพันธ์ที่แท้จริง

มันสามารถแสดงให้เห็นว่าสำหรับราคาซึ่งมักจะเป็นเดินสุ่มความสัมพันธ์ตัวอย่างมีแนวโน้มที่จะตัวแปรสุ่ม ซึ่งหมายความว่าไม่ว่าเราจะมีข้อมูลเท่าใดก็ตามผลลัพธ์จะแตกต่างกันเสมอ

หมายเหตุฉันพยายามแสดงสัญชาตญาณทางคณิตศาสตร์โดยไม่ใช้คณิตศาสตร์ จากมุมมองทางคณิตศาสตร์คำอธิบายนั้นชัดเจนมาก: ช่วงเวลาตัวอย่างของกระบวนการคงที่มาบรรจบกันในความน่าจะเป็นกับค่าคงที่ ช่วงเวลาตัวอย่างของการเดินแบบสุ่มมาบรรจบกับอินทิกรัลของการเคลื่อนไหวบราวน์ซึ่งเป็นตัวแปรสุ่ม เนื่องจากความสัมพันธ์มักแสดงเป็นตัวเลขและไม่ใช่ตัวแปรสุ่มเหตุผลในการไม่คำนวณความสัมพันธ์ของตัวแปรที่ไม่อยู่นิ่งจะเห็นได้ชัด

ปรับปรุงเนื่องจากเรามีความสนใจในความสัมพันธ์ระหว่างสองตัวแปรถือว่าเป็นครั้งแรกที่พวกเขามาจากกระบวนการนิ่งY_t) stationarity หมายความว่าและไม่ขึ้นอยู่กับทีดังนั้นความสัมพันธ์E Z t c o v ( Z t , Z t - h ) tZt=(Xt,Yt)EZtcov(Zt,Zth)t

corr(Xt,Yt)=cov(Xt,Yt)DXtDYt

ยังไม่ได้ขึ้นอยู่กับเนื่องจากปริมาณทั้งหมดในสูตรมาจากเมทริกซ์ซึ่งไม่ได้ขึ้นอยู่กับทีดังนั้นการคำนวณความสัมพันธ์ตัวอย่างtcov(Zt)t

ρ^=1Tt=1T(XtX¯)(YtY¯)1T2t=1T(XtX¯)2t=1T(YtY¯)2
ทำให้รู้สึกตั้งแต่เราอาจจะมีความหวังที่เหมาะสมที่ความสัมพันธ์ของกลุ่มตัวอย่างจะประมาณการY_t) มันกลับกลายเป็นว่าความหวังนี้ไม่ได้ไม่มีมูลความจริงเพราะสำหรับกระบวนการคงที่ที่ตอบสนองเงื่อนไขบางอย่างเรามี , เป็นในความน่าจะเป็น นอกจากในการจัดจำหน่ายเพื่อให้เราสามารถทดสอบสมมติฐานเกี่ยวกับ\ρ=corr(Xt,Yt)ρ^ρTT(ρ^ρ)N(0,σρ2)ρ

ตอนนี้สมมติว่าไม่หยุดนิ่ง จากนั้นอาจขึ้นอยู่กับทีดังนั้นเมื่อเราสังเกตตัวอย่างขนาดเราจำเป็นที่จะประเมิน potentialyความสัมพันธ์ที่แตกต่างกัน\นี่เป็นไปไม่ได้แน่นอนดังนั้นในสถานการณ์กรณีที่ดีที่สุดเราสามารถประมาณการทำงานของเช่นค่าเฉลี่ยหรือความแปรปรวน แต่ผลลัพธ์อาจไม่มีการตีความที่สมเหตุสมผลZtcorr(Xt,Yt)tTTρtρt

ตอนนี้ให้เราตรวจสอบสิ่งที่เกิดขึ้นกับสหสัมพันธ์ของการเดินสุ่มที่ไม่ได้ศึกษากระบวนการที่ไม่มีการศึกษา เราเรียกการเดินแบบสุ่มหากโดยที่เป็นกระบวนการที่อยู่กับที่ สำหรับความเรียบง่ายคิดว่า 0 แล้วก็Zt=(Xt,Yt)Zt=s=1t(Ut,Vt)Ct=(Ut,Vt)ECt=0

corr(XtYt)=EXtYtDXtDYt=Es=1tUts=1tVtDs=1tUtDs=1tVt

หากต้องการทำให้เรื่องต่างๆง่ายขึ้นให้สันนิษฐานว่าเป็นเสียงสีขาว ซึ่งหมายความว่ามีความสัมพันธ์ทั้งหมดเป็นศูนย์สำหรับ 0 โปรดทราบว่าสิ่งนี้ไม่ จำกัดเป็นศูนย์Ct=(Ut,Vt)E(CtCt+h)h>0corr(Ut,Vt)

จากนั้น

corr(Xt,Yt)=tEUtVtt2DUtDVt=corr(U0,V0).

จนถึงขั้นตอนที่ดีถึงแม้ว่ากระบวนการจะไม่หยุดนิ่ง แต่ความสัมพันธ์ก็สมเหตุสมผลแม้ว่าเราจะต้องตั้งสมมติฐานอย่างเข้มงวดเช่นเดียวกัน

ตอนนี้เพื่อดูว่าเกิดอะไรขึ้นกับความสัมพันธ์ของตัวอย่างเราจะต้องใช้ข้อเท็จจริงต่อไปนี้เกี่ยวกับการเดินสุ่มซึ่งเรียกว่าทฤษฎีบทขีด จำกัด ศูนย์กลางการทำงาน:

1TZ[Ts]=1Tt=1[Ts]Ct(cov(C0))1/2Ws,
ในการกระจายโดยที่และคือ bivariate Brownian motion (กระบวนการ Wiener สองมิติ) เพื่ออำนวยความสะดวกแนะนำนิยามM_ss[0,1]Ws=(W1s,W2s)Ms=(M1s,M2s)=(cov(C0))1/2Ws

อีกครั้งเพื่อความง่ายให้เรานิยามความสัมพันธ์ตัวอย่างเป็น

ρ^=1Tt=1TXtYt1Tt=1TXt21Tt=1TYt2

ให้เราเริ่มด้วยความแปรปรวน เรามี

E1Tt=1TXt2=1TEt=1T(s=1tUt)2=1Tt=1TtσU2=σUT+12.

สิ่งนี้จะไปที่อนันต์เมื่อเพิ่มขึ้นดังนั้นเราจึงพบปัญหาแรกความแปรปรวนตัวอย่างไม่ได้มาบรรจบ ในอีก ทฤษฎีการทำแผนที่อย่างต่อเนื่องร่วมกับทฤษฎีบทขีด จำกัด กลางการทำงานให้เราT

1T2t=1TXt2=t=1T1T(1Ts=1tUt)201M1s2ds
โดยที่คอนเวอร์เจนซ์คือการบรรจบกันในการกระจายตาม\T

ในทำนองเดียวกันเราได้รับ

1T2t=1TYt201M2s2ds
และ
1T2t=1TXtYt01M1sM2sds

ในที่สุดสำหรับความสัมพันธ์ตัวอย่างของการเดินสุ่มของเรา

T

ρ^01M1sM2sds01M1s2ds01M2s2ds
ในการจัดจำหน่ายเป็น\ T

ดังนั้นแม้ว่าความสัมพันธ์จะถูกกำหนดไว้อย่างดี แต่ความสัมพันธ์ของกลุ่มตัวอย่างไม่ได้มาบรรจบกันดังเช่นในกรณีของกระบวนการคงที่ แต่กลับกลายเป็นตัวแปรสุ่มที่แน่นอน


1
คำอธิบายมุมมองทางคณิตศาสตร์คือสิ่งที่ฉันกำลังมองหา มันทำให้ฉันได้ไตร่ตรองและสำรวจเพิ่มเติม ขอบคุณ
Milktrader

1
การตอบสนองนี้ดูเหมือนจะหลีกเลี่ยงคำถามเดิม: คุณไม่เพียงแค่บอกว่าใช่การคำนวณสหสัมพันธ์มีเหตุผลสำหรับกระบวนการคงที่
whuber

1
@ โฮเบอร์ฉันตอบคำถามโดยคำนึงถึงความคิดเห็น แต่ฉันอ่านคำถามอีกครั้งและเท่าที่ฉันเข้าใจ OP จะถามเกี่ยวกับการคำนวณความสัมพันธ์สำหรับข้อมูลที่ไม่อยู่นิ่ง การคำนวณความสัมพันธ์สำหรับกระบวนการที่อยู่กับที่ทำให้การวิเคราะห์ทางเศรษฐศาสตร์มหภาค (VAR, VECM) ทั้งหมดนั้นขึ้นอยู่กับว่า
mpiktas

ฉันจะพยายามอธิบายคำถามของฉันพร้อมคำตอบ
whuber

3
@ เมื่อฉันนำออกไปจากคำตอบก็คือความสัมพันธ์ที่อิงกับข้อมูลที่ไม่อยู่นิ่งทำให้เกิดตัวแปรสุ่มซึ่งอาจมีประโยชน์หรือไม่ก็ได้ ความสัมพันธ์ที่ยึดตามข้อมูลที่อยู่กับที่จะแปรเปลี่ยนเป็นค่าคงที่ สิ่งนี้อาจอธิบายได้ว่าทำไมผู้ค้าถึงถูกดึงดูดให้“ ความสัมพันธ์แบบกลิ้งข้ามวัน” เพราะพฤติกรรมที่สัมพันธ์กันนั้นหายวับไปและไม่จริง ไม่ว่า "สหสัมพันธ์กลิ้งวัน" ถูกต้องหรือมีประโยชน์สำหรับคำถามอื่น
Milktrader

13

... การคำนวณความสัมพันธ์ซึ่งข้อมูลไม่อยู่นิ่งแม้จะคำนวณทางสถิติที่ถูกต้องหรือไม่

ให้เป็นการเดินสุ่มแบบไม่ต่อเนื่อง เลือกจำนวนบวกชั่วโมงกำหนดกระบวนการและโดย ,ถ้าและอื่น ๆ ; และ(t) ในคำอื่น ๆเริ่มออกเหมือนกับแต่ทุกครั้งที่เพิ่มขึ้นสูงกว่าก็สลับสัญญาณ (มิฉะนั้นการลอกเลียนแบบทุกประการ)h P V P ( 0 ) = 1 P ( t + 1 ) = - P ( t )WhPVP(0)=1P(t+1)=P(t)P ( t + 1 ) = P ( t ) V ( t ) V ( t ) = P ( t ) W ( t ) V W V h WV(t)>hP(t+1)=P(t)V(t)=P(t)W(t)VWVhW

ป้อนคำอธิบายรูปภาพที่นี่

(ในรูปนี้ (สำหรับ )คือสีน้ำเงินและเป็นสีแดงมีสัญญาณสี่สวิตช์ในการลงชื่อเข้าใช้)W Vh=5WV

ในระยะเวลาสั้น ๆมักมีความสัมพันธ์อย่างสมบูรณ์กับหรือมีความสัมพันธ์กับมันอย่างสมบูรณ์แบบ แม้กระนั้นการใช้ฟังก์ชันความสัมพันธ์เพื่ออธิบายความสัมพันธ์ระหว่างและจะไม่เป็นประโยชน์ (คำที่มักจะจับปัญหาได้ดีกว่า "ไม่น่าเชื่อถือ" หรือ "ไร้สาระ")W V WVWVW

รหัส Mathematica เพื่อผลิตภาพ:

With[{h=5},
pv[{p_, v_}, w_] := With[{q=If[v > h, -p, p]}, {q, q w}];
w = Accumulate[RandomInteger[{-1,1}, 25 h^2]];
{p,v} = FoldList[pv, {1,0}, w] // Transpose;
ListPlot[{w,v}, Joined->True]]

มันเป็นเรื่องดีที่คำตอบของคุณชี้ไปที่ แต่ฉันจะไม่พูดว่ากระบวนการนั้นมีความสัมพันธ์กันฉันจะบอกว่ามันขึ้นอยู่กับ นี่คือประเด็น การคำนวณความสัมพันธ์คือวาลเดและที่นี่มันจะพูดว่า "ไม่มีความสัมพันธ์" และเราทุกคนรู้ว่าสิ่งนี้ไม่ได้หมายความว่า "ไม่มีการพึ่งพา"
robin girard

1
@robin นั้นเป็นจุดที่ดี แต่ฉันสร้างตัวอย่างนี้โดยเฉพาะเพื่อให้ระยะเวลานานที่อาจเกิดขึ้นทั้งสองกระบวนการมีความสัมพันธ์กันอย่างสมบูรณ์ ปัญหาไม่ได้เป็นหนึ่งในการพึ่งพาอาศัยกันและความสัมพันธ์ แต่โดยเนื้อแท้จะเกี่ยวข้องกับปรากฏการณ์ subtler: ที่ความสัมพันธ์ระหว่างกระบวนการเปลี่ยนแปลงในช่วงเวลาสุ่ม สั้น ๆ นั่นคือสิ่งที่สามารถเกิดขึ้นได้ในตลาดจริง (หรืออย่างน้อยเราก็ควรกังวลว่ามันจะเกิดขึ้นได้!)
whuber

@whertert ใช่และนี่เป็นตัวอย่างที่ดีมากที่แสดงว่ามีกระบวนการที่มีความสัมพันธ์สูงมากเป็นเวลานานและยังไม่สัมพันธ์กันเลย (แต่ขึ้นอยู่กับสูง) เมื่อเกี่ยวข้องกับขนาดชั่วคราว
robin girard

2
@robin girard ฉันคิดว่ากุญแจที่นี่ก็คือสำหรับกระบวนการที่ไม่หยุดนิ่งความสัมพันธ์เชิงทฤษฎีแตกต่างกันไปตามกาลเวลาเมื่อกระบวนการคงที่ความสัมพันธ์เชิงทฤษฎียังคงเหมือนเดิม ดังนั้นด้วยความสัมพันธ์ตัวอย่างซึ่งโดยทั่วไปคือจำนวนหนึ่งมันเป็นไปไม่ได้ที่จะจับความแปรปรวนของความสัมพันธ์ที่แท้จริงในกรณีของกระบวนการที่ไม่หยุดนิ่ง
mpiktas
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.