อะไรคือความแตกต่างระหว่างรูปแบบกำหนดขึ้นและสุ่ม?


11

โมเดลเชิงเส้นอย่างง่าย:

ϵ t N ( 0 , σ 2 )x=αt+ϵtโดยที่ ~ iidϵtN(0,σ2)

ด้วยและE(x)=αtVar(x)=σ2

AR (1):

Xt=αXt1+ϵtโดยที่ ~ iidϵtN(0,σ2)

ด้วยและE(x)=αtVar(x)=tσ2

ดังนั้นโมเดลเชิงเส้นอย่างง่ายจึงถือได้ว่าเป็นโมเดลที่กำหนดขึ้นมาในขณะที่โมเดล AR (1) นั้นถือเป็นโมเดลสตาคาห์สติก

ตามวิดีโอ Youtube โดย Ben Lambert - Stochastic เทียบกับกำหนดเหตุผลของ AR (1) ที่จะเรียกว่าเป็นแบบจำลองสุ่มเพราะความแปรปรวนของมันเพิ่มขึ้นตามเวลา คุณลักษณะของการแปรปรวนแบบไม่คงที่จะเป็นเกณฑ์ในการพิจารณาสุ่มหรือกำหนดขึ้นหรือไม่?

ฉันยังไม่คิดว่าตัวแบบเชิงเส้นอย่างง่ายจะถูกกำหนดโดยสิ้นเชิงเนื่องจากเรามีคำว่าเกี่ยวข้องกับตัวแบบ ดังนั้นเราจึงมักจะมีการสุ่มในxดังนั้นระดับใดที่เราสามารถบอกว่าแบบจำลองนั้นกำหนดขึ้นหรือสุ่ม? xϵtx


10
แบบจำลองใด ๆ ที่มีคำที่ผิดพลาดคือสุ่ม มันไม่เกี่ยวอะไรกับความแปรปรวนที่ต้องเปลี่ยนตามเวลา
Michael R. Chernick

@MichaelChernick ฉันไม่เข้าใจ แล้วทำไมผู้คนถึงบอกว่าการถดถอยเชิงเส้นอย่างง่ายเป็นรูปแบบที่กำหนดขึ้นได้?
Ken T

2
คุณสามารถให้ลิงค์เพื่อแสดงตำแหน่งที่ถูกพูดและทำไมมันถึงพูด
Michael R. Chernick

มันมาจากบันทึกหลักสูตรของฉันของการวิเคราะห์อนุกรมเวลาไม่กี่ปีที่ผ่านมา บางทีมันผิด
Ken T

คำตอบ:


12

วิดีโอที่มีการพูดคุยเกี่ยวกับการสุ่มกำหนดแนวโน้มไม่รุ่น ไฮไลท์สำคัญมาก ทั้งสองแบบของคุณเป็นแบบสุ่มอย่างไรก็ตามในแบบจำลอง 1 แนวโน้มจะถูกกำหนดไว้แล้ว

โมเดล 2 ไม่มีแนวโน้ม ข้อความคำถามของคุณไม่ถูกต้อง

แบบจำลอง 2 ในคำถามของคุณคือ AR (1) โดยไม่มีค่าคงที่ในขณะที่ในวิดีโอรูปแบบคือการเดินแบบสุ่ม (การเคลื่อนไหว Brownian): แบบจำลองนี้มีแนวโน้มสุ่ม . มันสุ่มเพราะมันโดยเฉลี่ยแล้วเท่านั้น การรับรู้ของการเคลื่อนไหว Brownian แต่ละครั้งจะเบี่ยงเบนไปจากเนื่องจากการสุ่มเทอมซึ่งง่ายต่อการดูโดยการแตกต่าง: α t α t e t Δ x t = x t - x t - 1 = α + e t x t = x 0 + t t = 1 Δ x t = x 0 + α t + t t = 1 e

xt=α+xt1+et
αtαtet
Δxt=xtxt1=α+et
xt=x0+t=1tΔxt=x0+αt+t=1tet

+1 แต่การที่จะสมบูรณ์ชัดเจนและถูกต้องคุณอาจต้องการที่จะชี้ให้เห็นว่าการเบี่ยงเบนจากเกิดจากการสุ่มระยะไม่เพียงe_tαte1+e2++etet
whuber

11

ดังที่ Aksakal ได้กล่าวไว้ในคำตอบของเขาวิดีโอ Ken T ที่เชื่อมโยงอธิบายคุณสมบัติของแนวโน้มไม่ใช่โมเดลโดยตรงน่าจะเป็นส่วนหนึ่งของการสอนเกี่ยวกับหัวข้อที่เกี่ยวข้องกับแนวโน้มและความแตกต่างในด้านเศรษฐศาสตร์ เนื่องจากในคำถามของคุณคุณถามเกี่ยวกับแบบจำลองนี่คือในบริบทของแบบจำลอง :

แบบจำลองหรือกระบวนการสุ่มถ้ามีการสุ่ม ตัวอย่างเช่นหากได้รับอินพุตเดียวกัน (ตัวแปรอิสระ, น้ำหนัก / พารามิเตอร์, พารามิเตอร์ไฮเปอร์พารามิเตอร์ ฯลฯ ) โมเดลอาจสร้างเอาต์พุตที่แตกต่างกัน ในโมเดลที่กำหนดขึ้นแล้วเอาต์พุตจะถูกระบุอย่างสมบูรณ์โดยอินพุตไปยังโมเดล (ตัวแปรอิสระ, น้ำหนัก / พารามิเตอร์, พารามิเตอร์ไฮเปอร์พารามิเตอร์ ฯลฯ ) ซึ่งให้อินพุตเดียวกันกับโมเดลเอาต์พุตนั้นเหมือนกัน ที่มาของคำว่า "สุ่ม" มาจากกระบวนการสุ่ม ตามกฎทั่วไปของหัวแม่มือหากแบบจำลองมีตัวแปรสุ่มมันจะสุ่ม แบบจำลอง Stochastic สามารถเป็นตัวแปรสุ่มแบบง่ายๆได้

ลองแกะคำศัพท์เพิ่มเติมที่จะช่วยให้คุณเข้าใจวรรณกรรมรอบตัวแบบสถิติ (ที่กำหนดขึ้นมาแบบสุ่มหรืออื่น ๆ ... ):

แบบจำลองสโตแคสติกไม่จำเป็นต้องขึ้นกับเวลาหรือแม้แต่กระบวนการมาร์คอฟ (ขึ้นอยู่กับสถานะที่ผ่านมาเช่นคือมาร์คอฟอันดับหนึ่งเนื่องจากมันขึ้นอยู่กับสถานะที่ ) โมเดลเชิงเส้นที่คุณโพสต์ไว้ด้านบนคือสุ่ม (มีตัวแปรสุ่ม) แต่ไม่ใช่มาร์คอฟ (ไม่ขึ้นอยู่กับสถานะที่ผ่านมา) ในตัวแบบเชิงเส้นที่วางไว้ในคำถามข้อผิดพลาดเป็นตัวแปรสุ่มที่เราถือว่าไม่มีการเชื่อมโยง (บางคนไปไกลกว่าที่จะระบุว่าข้อผิดพลาดคือ iid) กระจายแบบสมมาตรเกี่ยวกับค่าเฉลี่ย (บางคนไปไกลกว่า กระจาย) และหมายถึงศูนย์ ( ) ฯลฯ เราทำสมมติฐานเหล่านี้เพื่อทำให้แบบจำลองเชิงเส้นมีประโยชน์ในการประมาณAR(1)t1μϵt=0ตัวแปรตาม (s) โดยการลดบรรทัดฐานของข้อผิดพลาดนั้นให้น้อยที่สุด สมมติฐานเหล่านี้ทำให้เราได้รับคุณสมบัติที่มีประโยชน์ของตัวประมาณและพิสูจน์ว่าตัวประมาณบางตัวดีที่สุดภายใต้สมมติฐานเหล่านั้น ยกตัวอย่างเช่นว่าOLS ประมาณการเป็นสีฟ้า

ตัวอย่างที่เรียบง่ายของรูปแบบสุ่มจะพลิกเหรียญยุติธรรม (หัวหรือหาง) ซึ่งสามารถจำลอง stochastically เป็น IID กระจายตัวแปรสุ่มไบนารีหรือกระบวนการ Bernoulli นอกจากนี้คุณยังสามารถพิจารณาการพลิกเหรียญเป็นระบบทางกายภาพและมาพร้อมกับรูปแบบที่กำหนดขึ้น (ในการตั้งค่าในอุดมคติ) หากคุณคำนึงถึงรูปร่างของเหรียญมุมและแรงกระแทกระยะห่างจากพื้นผิวเป็นต้นหาก แบบจำลองทางกายภาพ (ทางกายภาพ) ของการพลิกเหรียญไม่มีตัวแปรแบบสุ่มในนั้น (เช่นไม่พิจารณาความผิดพลาดในการวัดของอินพุตใด ๆ ในแบบจำลอง) จากนั้นจะถูกกำหนดขึ้น

ในสถิติการสอนมีจุดสับสนระหว่าง stochasticity และheteroscedasticityทั่วไป ตัวอย่างเช่น Ken T มีความสับสนสุ่มสำหรับ heteroscedasticity (หรือความแปรปรวนในความแปรปรวน) ตัวแปรสุ่ม (สุ่ม) เช่นตัวแปรส่งออกของกระบวนการหรือในโมเดลเชิงเส้นคือ heteroscedastic iff ความแปรปรวนของการเปลี่ยนแปลงบางอย่างเช่นเวลา ( ) ใน กรณีนี้เช่นนั้นกลุ่มที่แตกต่างกันภายในประชากรจะมีผลต่างต่างกัน ในวิดีโอที่ Ken T เชื่อมโยง (โดย Ben Lambert) หากคุณหยุดชั่วคราวในเวลา 4:00 น. (4 นาที) คุณจะเห็น R ( 1 ) ε T Y T = x T + ε เสื้อ T V R [ X T ] T V R [ X ทีXtAR(1)ϵtyt=axt+ϵttVar[Xt]ในโมเดลทางด้านขวาเปลี่ยนแปลงด้วย (heteroscedastic) ในขณะที่ในโมเดลเชิงเส้นเป็นค่าคงที่ (homoscedastic)tVar[Xt]

นอกจากนี้ยังมีความสับสนในบางครั้งระหว่างกระบวนการสุ่มแบบนิ่งและแบบสุ่มนิ่ง Stationarity แสดงว่าสถิติเช่นค่าเฉลี่ยหรือความแปรปรวนไม่เปลี่ยนแปลงตลอดเวลาในตัวแบบ ทั้งสองยังถือว่าเป็นตัวแบบสุ่ม / กระบวนการตราบใดที่มีการสุ่มเกี่ยวข้อง ในฐานะเพื่อนมารูนแมทธิวกันน์กล่าวถึงคำตอบของเขาการสลายตัวของ Woldระบุว่ากระบวนการ Stochastic แบบคงที่ใด ๆ สามารถเขียนเป็นผลรวมของกระบวนการที่กำหนดขึ้นมาและกระบวนการสุ่ม


2
คำตอบที่ดี! คำถาม: ทำไมคุณถึงเขียนว่า "... iff ความแปรปรวนของมันเปลี่ยนแปลงไปจากพารามิเตอร์บางตัว ... " ไม่ควรที่จะเปลี่ยนแปลงมากกว่าตัวแปรบางตัว (หรือฟังก์ชั่นของตัวแปร)?
Alexis

1
@ Alexis ฉันอ้างถึงเวลาเป็นพารามิเตอร์ของแบบจำลอง คุณถูกต้องภาษานั้นไม่แน่ชัด แก้ไขแล้ว. ขอบคุณ. :-)
ido

ความแปรปรวนของ AR (1) เปลี่ยนแปลงอย่างไร
Aksakal

@Aksakalไม่เปลี่ยนแปลงตามเวลาและคือแต่สำหรับถ้า ... (หมายถึงโมเดลที่อธิบายโดย Ken T. )Var[εt]σ2Var[Xt]=tσ2Xt=α+Xt1+εtεtN(0,σ2)AR(1)
ido

เพียงแสดงผลงานต่อไปในกรณีที่คุณขอถาม Aksakal:และคงที่เพราะเป็น iid หรืออย่างน้อยไม่เกี่ยวข้องกัน นอกจากนี้ไปโดยไม่บอก แต่เนื่องจากมี IID0 Var[Xt]=Var[Xt1]+Var[εt]=i=1tVar[εi]=tσ2Var[εi]=σ2εtεtCov[Xt,Xt1]=0
ido

3

คำจำกัดความบางอย่างไม่เป็นทางการ

  • กำหนดเวลาแบบสามารถเขียนเป็นฟังก์ชั่นเฉพาะของเวลา ไม่มีการสุ่ม ตัวอย่างบางส่วน: {yt}
    • y(t)=2t
    • y(t)=et
  • กระบวนการสุ่ม {Yt}เป็นชุดของตัวแปรสุ่ม จำได้ว่าตัวแปรสุ่มเป็นฟังก์ชั่นจากพื้นที่ตัวอย่างถึงผลลัพธ์ กระบวนการสุ่มเป็นหน้าที่ของทั้งสองครั้งที่และผลจากพื้นที่ตัวอย่าง\ตัวอย่าง:ΩY(t,ω)tωΩ

    • yt=ϵtโดยที่ (เช่นตามการแจกแจงแบบปกติมาตรฐาน)ϵtN(0,1)
    • yt=.7yt1+ϵt

    นอกจากนี้คุณยังสามารถคิดของกระบวนการสุ่มเป็นเส้นทางที่กำหนดขึ้นสำหรับทุกผลในพื้นที่ตัวอย่าง\สุ่มวาดและคุณได้รับเส้นทางomega)โอห์มω โอห์มY T ( ω )ωΩωΩYt(ω)

ความคิดเห็นบางส่วน ...

... เหตุผลที่ AR (1) ถูกเรียกว่าเป็นแบบจำลองสุ่มเพราะความแปรปรวนของมันเพิ่มขึ้นตามเวลา

นั่นไม่ใช่เหตุผล! เหตุผลที่ AR (1) กำหนดกระบวนการสโทแคสติกเนื่องจากกระบวนการสุ่ม ค่าที่แตกต่างกันเป็นไปได้ที่เวลาดังนั้นกระบวนการสุ่มt

ฉันยังไม่คิดว่าตัวแบบเชิงเส้นอย่างง่ายจะถูกกำหนดโดยสิ้นเชิงเนื่องจากเรามีคำว่าเกี่ยวข้องกับตัวแบบϵt

คุณได้เขียนขึ้นไม่มีกำหนด หากคุณมีกระบวนการอนุกรมเวลาโดยที่เป็นกระบวนการที่มีเสียงรบกวนสีขาวดังนั้นอนุกรมเวลาจะไม่ถูกกำหนดขึ้น มันสุ่มเพราะมีการสุ่ม!x t = α t + ϵ t { ϵ t } { x t }xtxt=αt+ϵt{ϵt}{xt}

อนุกรมเวลาจะถูกกำหนดไว้ คุณสามารถย่อยสลายเป็นสองส่วน: ส่วนประกอบกำหนดและส่วนประกอบสุ่ม\{ x t } α t ϵ tyt=αt{xt}αtϵt

สิ่งนี้นำไปสู่ทฤษฎีบทของ Woldว่ากระบวนการแปรปรวนแบบคงที่ใด ๆ สามารถถูกย่อยสลายเป็นองค์ประกอบที่กำหนดขึ้นมาและองค์ประกอบสุ่ม

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.