ฟังก์ชั่น autocorrelation อธิบายกระบวนการสุ่มอย่างสมบูรณ์หรือไม่?


31

กระบวนการสโตคาสติกอธิบายโดยฟังก์ชันความสัมพันธ์อัตโนมัติหรือไม่

ถ้าไม่จำเป็นต้องใช้คุณสมบัติเพิ่มเติมใด

คำตอบ:


44

คำอธิบายที่สมบูรณ์ของกระบวนการสโทคาสติกคืออะไร ดีทางคณิตศาสตร์เป็นกระบวนการสุ่มเป็นคอลเลกชัน{X(t):tT}ของตัวแปรสุ่มหนึ่งสำหรับแต่ละครั้งทันทีtในดัชนีชุด Tที่มักTเป็นบรรทัดจริงทั้งหมดหรือเส้นจริงบวก และคำอธิบายที่สมบูรณ์หมายความว่าสำหรับแต่ละจำนวนเต็มn1และnเวลา instants t1,t2,,tnTเรารู้ (ร่วม) การกระจายของnตัวแปรสุ่มX(t1) ,X(t2) ,,X(tn) ) นี่เป็นข้อมูลจำนวนมหาศาล: เราจำเป็นต้องรู้ CDF ของX(t)ในแต่ละครั้งที่t , ร่วมกัน (สองมิติ) CDF ของX(t1)และX(t2)สำหรับตัวเลือกทั้งหมดของเวลา instantst1และt2 , CDFs (สามมิติ) ของX(t1) ,X(t2) , และX(t3) , ฯลฯ เป็นต้น

คนทั่วไปจึงมองหาคำอธิบายที่ง่ายกว่าและแบบจำลองที่เข้มงวดมากขึ้น การทำให้เข้าใจง่ายอย่างหนึ่งเกิดขึ้นเมื่อกระบวนการไม่แปรเปลี่ยนไปจากการเปลี่ยนแปลงของเวลา สิ่งนี้หมายความว่าอะไร

  • ทั้งหมดตัวแปรสุ่มในกระบวนการมี CDFS เหมือน: FX(t1)(x)=FX(t2)(x)ทั้งหมดt1,t2 2
  • สองตัวแปรสุ่มแยกออกจากกันโดยบางส่วนระยะเวลาที่ระบุมี CDF ร่วมเช่นเดียวกับคนอื่น ๆคู่ของตัวแปรสุ่มแยกจากกันโดยเดียวกันปริมาณของเวลา ตัวอย่างเช่นตัวแปรสุ่มX(t1)และX(t1+τ)จะถูกคั่นด้วยτวินาทีเช่นเดียวกับตัวแปรสุ่มX(t2)และX(t2+τ)และทำให้FX(t1),X(t1+τ)(x,y)=FX(t2),X(t2+τ)(x,y)
  • ตัวแปรสุ่มสามตัวใด ๆX(t1) , X(t1+τ1) , X(t1+τ1+τ2)เว้นระยะτ1และτ2แยกมี CDF ร่วมกันเช่นเดียวกับX(t2) , X(t2+τ1) , X(t2+τ1+τ2)ซึ่งเป็นระยะห่างยังτ1และτ2ออกจากกัน
  • และอื่น ๆ สำหรับCDF หลายมิติทั้งหมด ตัวอย่างเช่นคำตอบของ Peter K. สำหรับรายละเอียดของกรณีหลายมิติ

ได้อย่างมีประสิทธิภาพรายละเอียดความน่าจะเป็นของกระบวนการสุ่มไม่ได้ขึ้นอยู่กับสิ่งที่เราเลือกที่จะเรียกต้นกำเนิดอยู่กับเวลาที่แกน: ขยับจังหวะเวลาทั้งหมดt1,t2,,tnโดยจำนวนคงที่บางτไปt1+τ,t2+τ,,tn+τให้คำอธิบายที่น่าจะเป็นเหมือนกันของตัวแปรสุ่ม คุณสมบัตินี้เรียกว่าstationarity แบบเข้มงวด และกระบวนการสุ่มที่สนุกกับคุณสมบัตินี้เรียกว่ากระบวนการสุ่มที่อยู่กับที่อย่างเข้มงวดหรือกระบวนการสุ่มที่คงที่

โปรดทราบว่า stationarity ที่เข้มงวดด้วยตัวเองไม่จำเป็นต้องมีรูปแบบเฉพาะของ CDF ตัวอย่างเช่นไม่ได้บอกว่าตัวแปรทั้งหมดเป็น Gaussian

คำคุณศัพท์แสดงให้เห็นอย่างเคร่งครัดว่าเป็นไปได้ที่จะกำหนดรูปแบบของความนิ่ง หากCDF ร่วม ลำดับที่NthX(t1),X(t2),,X(tN)จะเหมือนกับCDF ร่วมลำดับที่NthX(t1+τ),X(t2+τ),,X(tN+τ)สำหรับตัวเลือกทั้งหมดของt1,t2,,tNและτแล้วกระบวนการสุ่มกล่าวจะนิ่งกับการสั่งซื้อNและเป็นที่เรียกว่าNth -order นิ่งกระบวนการสุ่ม ทราบว่า Nth -order นิ่งกระบวนการสุ่มยังนิ่งกับการสั่งซื้อnสำหรับแต่ละบวกn<N N (นี่เป็นเพราะCDF ที่ใช้ร่วมกันลำดับที่nthคือขีด จำกัด ของCDFลำดับที่Nthที่Nnของการขัดแย้งวิธี : ลักษณะทั่วไปของ FX(x)=limyFX,Y(x,y) ) กระบวนการสุ่มนิ่งอย่างเคร่งครัดแล้วเป็นกระบวนการสุ่มที่นิ่งทุกคำสั่งซื้อยังไม่มีข้อความN

หากกระบวนการสุ่มอยู่กับที่ (อย่างน้อย) ลำดับ1ดังนั้นX(t)จะมีการแจกแจงแบบเดียวกันดังนั้นสมมติว่าค่าเฉลี่ยมีอยู่E[X(t)]=μนั้นเหมือนกันสำหรับtทั้งหมด. ในทำนองเดียวกัน E[(X(t))2]นั้นเหมือนกันสำหรับtทั้งหมดและถูกเรียกว่าพลังของกระบวนการ กระบวนการทางกายภาพทั้งหมดมีพลังงานจำกัดดังนั้นจึงเป็นเรื่องปกติที่จะสมมติว่า E[(X(t))2]<ในกรณีนี้และโดยเฉพาะอย่างยิ่งในวรรณคดีวิศวกรรมเก่ากระบวนการนี้เรียกว่ากระบวนการลำดับที่สอง ทางเลือกของชื่อเป็นโชคร้ายเพราะมันเชิญชวนให้สับสนกับสองสั่ง stationarity(cfคำตอบของฉันใน stats.SE นี้) และเพื่อให้ที่นี่เราจะเรียกกระบวนการที่E[(X(t))2]มี จำกัด สำหรับtทั้งหมด(หรือไม่ว่าE[(X(t))2]เป็นค่าคงที่) เป็นกระบวนการจำกัด กำลังและหลีกเลี่ยงความสับสน แต่ทราบอีกว่า

กระบวนการคงที่ลำดับที่หนึ่งไม่จำเป็นต้องเป็นกระบวนการ จำกัด กำลัง

พิจารณากระบวนการสุ่มที่นิ่งการสั่งซื้อสินค้า22ตอนนี้เนื่องจากการกระจายข้อต่อของX(t1)และX(t1+τ)เท่ากับฟังก์ชั่นการแจกแจงร่วมของX(t2)และX(t2+τ) , E[X(t1)X(t1+τ)]=E[X(t2)X(t2+τ)]และความคุ้มค่าขึ้นอยู่กับττความคาดหวังเหล่านี้มี จำกัด สำหรับกระบวนการขอบเขตอำนาจและความคุ้มค่าของพวกเขาจะเรียกว่าฟังก์ชั่นอัตของกระบวนการ:RX(τ)=E[X(t)X(t+τ)]เป็นหน้าที่ของτแยกเวลา ของตัวแปรสุ่มX(t)และX(t+τ)และไม่ขึ้นอยู่กับtเลย โปรดทราบว่า

E[X(t)X(t+τ)]=E[X(t+τ)X(t)]=E[X(t+τ)X(t+ττ)]=RX(τ),
และอื่น ๆ ฟังก์ชั่นอัตเป็นฟังก์ชั่นของการโต้แย้งของมัน

กระบวนการสุ่มแบบคงที่ลำดับที่สองกำลังสองมีคุณสมบัติที่

  1. ค่าเฉลี่ยE[X(t)]เป็นค่าคงที่
  2. ฟังก์ชัน autocorrelation RX(τ)=E[X(t)X(t+τ)]คือฟังก์ชันของτ , การแยกเวลาของตัวแปรสุ่มX(t)และX(t+τ)และไม่ได้ ขึ้นอยู่กับtเลย

สมมติฐานของ stationarity ช่วยลดความซับซ้อนของคำอธิบายของกระบวนการสุ่มในระดับหนึ่ง แต่สำหรับวิศวกรและนักสถิติที่สนใจในการสร้างแบบจำลองจากข้อมูลการทดลองการประเมิน CDFs ทั้งหมดนั้นเป็นงานที่ไม่สำคัญโดยเฉพาะอย่างยิ่งเมื่อมีเพียงส่วนหนึ่งของเส้นทางตัวอย่างเดียว การรับรู้) x(t)ซึ่งสามารถทำการวัดได้ การวัดสองแบบที่ทำได้ค่อนข้างง่าย (เนื่องจากวิศวกรมีเครื่องมือที่จำเป็นใน workbench แล้ว (หรือโปรแกรมใน MATLAB / Python / Octave / C ++ ในไลบรารีซอฟต์แวร์ของเขา) คือค่า DC 1T0Tx(t)dtของx(t)และฟังก์ชัน autocorrelationRx(τ)=1T0Tx(t)x(t+τ)dt (หรือการแปลงฟูริเยร์, สเปกตรัมกำลังของx(t) ) การวัดค่าเหล่านี้เป็นค่าประมาณของค่าเฉลี่ยและฟังก์ชั่นออโต้คอร์เรชั่นของกระบวนการ จำกัด กำลังไฟจะนำไปสู่แบบจำลองที่มีประโยชน์มากที่เราจะพูดถึงต่อไป


จำกัด พลังงานกระบวนการสุ่มเรียกว่านิ่งกว้างความรู้สึก (WSS) กระบวนการ (ยังไม่ค่อยกระบวนการสุ่มนิ่งซึ่งโชคดีที่ยังมี WSS ย่อเดียวกัน) ถ้ามันมีค่าคงที่ค่าเฉลี่ยและฟังก์ชั่นอัตของRX(t1,t2)=E[X(t1)X(t2)]ขึ้นอยู่กับความแตกต่างของเวลาt1t2 (หรือt2t1 )

โปรดทราบว่าคำจำกัดความไม่ได้เกี่ยวกับ CDF ของตัวแปรสุ่มที่ประกอบไปด้วยกระบวนการ มันเป็นข้อ จำกัด อย่างสมบูรณ์ในช่วงเวลาลำดับที่หนึ่งและลำดับที่สองของตัวแปรสุ่ม แน่นอนว่าการ จำกัด ลำดับที่สองของกำลังไฟนิ่ง (หรือNthนิ่งอยู่นิ่ง (สำหรับN>2 ) หรือการเคลื่อนที่แบบสุ่ม) เป็น กระบวนการ WSS แต่การสนทนาไม่จำเป็นต้องเป็นจริง

กระบวนการ WSS ไม่จำเป็นต้องอยู่กับคำสั่งใด ๆ

พิจารณาตัวอย่างเช่นกระบวนการสุ่ม {X(t):X(t)=cos(t+Θ),<t<} โดยที่Θใช้ค่าที่มีโอกาสเท่ากันสี่ค่า0,π/2,πและ3π/2 2 (ไม่ต้องกลัว: เส้นทางตัวอย่างสี่เส้นทางที่เป็นไปได้ของกระบวนการสุ่มนี้เป็นเพียงรูปคลื่นสี่สัญญาณของสัญญาณ QPSK) โปรดทราบว่าแต่ละX(t)เป็นตัวแปรสุ่มที่ไม่ต่อเนื่องซึ่งโดยทั่วไปแล้วจะใช้ค่าสี่ค่าที่น่าจะเท่ากันcos(t),cos(t+π/2)=sin(t),cos(t+π)=cos(t)และcos(t+3π/2)=sin(t), มันง่ายที่จะเห็นว่าโดยทั่วไปX(t)และX(s)มีการแจกแจงที่แตกต่างกัน, และดังนั้นกระบวนการไม่ได้เป็นคำสั่งแรกที่นิ่ง. ในทางกลับกัน

E[X(t)]=14cos(t)+14(sin(t))+14(cos(t))+14sin(t)=0
สำหรับทุกๆtในขณะที่
E[X(t)X(s)]=14[cos(t)cos(s)+(cos(t))(cos(s))+sin(t)sin(s)+(sin(t))(sin(s))]=12[cos(t)cos(s)+sin(t)sin(s)]=12cos(ts).
ในระยะสั้นกระบวนการมีศูนย์ค่าเฉลี่ยและฟังก์ชั่นอัตมันขึ้นอยู่กับเวลาที่แตกต่างกันtsและเพื่อให้กระบวนการเป็นความรู้สึกนิ่งกว้าง แต่มันไม่ได้อยู่ที่การสั่งซื้อครั้งแรกดังนั้นจึงไม่สามารถหยุดอยู่กับคำสั่งซื้อที่สูงขึ้นได้เช่นกัน

แม้สำหรับกระบวนการ WSS ที่เป็นกระบวนการสุ่มอันดับสองที่อยู่กับที่ (หรืออยู่กับที่อย่างเข้มงวด) อาจกล่าวได้เพียงเล็กน้อยเกี่ยวกับรูปแบบเฉพาะของการแจกแจงของตัวแปรสุ่ม ในระยะสั้น

กระบวนการ WSS นั้นไม่จำเป็นต้องอยู่กับที่เสมอไป (กับคำสั่งใด ๆ ) และฟังก์ชันค่าเฉลี่ยและความสัมพันธ์อัตโนมัติของกระบวนการ WSS นั้นไม่เพียงพอที่จะให้คำอธิบายทางสถิติที่สมบูรณ์ของกระบวนการ

ในที่สุดสมมติว่ากระบวนการสุ่มถือว่าเป็นกระบวนการเกาส์เซียน ("พิสูจน์" สิ่งนี้ด้วยความมั่นใจในระดับที่สมเหตุสมผลไม่ได้เป็นงานที่ไม่สำคัญ) ซึ่งหมายความว่าสำหรับแต่ละt , X(t)เป็นตัวแปรสุ่มแบบเกาส์และสำหรับจำนวนเต็มบวกทั้งหมดn2และทางเลือกของnแต่ละเวลาโดยt1 , t2 , ,tnที่N ตัวแปรสุ่มX(t1) , X(t2) ,,X(tn)เป็นตัวแปรสุ่มแบบเกาส์กัน ตอนนี้ร่วมฟังก์ชั่นความหนาแน่นของเกาส์จะสมบูรณ์กำหนดโดยวิธีการที่แปรปรวนและ covariances ของตัวแปรสุ่มและในกรณีนี้รู้ฟังก์ชั่นเฉลี่ยμX(t)=E[X(t)] (มันไม่จำเป็นต้องเป็น ค่าคงที่ตามที่จำเป็นสำหรับไวด์สเตชั่น - ความคงที่) และฟังก์ชันความสัมพันธ์อัตโนมัติRX(t1,t2)=E[X(t1)X(t2)]สำหรับทุกคนt1,t2 (มันไม่จำเป็นต้องขึ้นอยู่กับt1t2เท่าที่จำเป็นสำหรับไวด์สเตชั่นที่กว้าง) เพียงพอที่จะกำหนดสถิติของ ดำเนินการอย่างสมบูรณ์

หากกระบวนการเกาส์เซียนเป็นกระบวนการWSS แสดงว่าเป็นกระบวนการเสียนแบบคงที่เช่นกัน โชคดีสำหรับวิศวกรและตัวประมวลผลสัญญาณกระบวนการทางกายภาพทางเสียงจำนวนมากสามารถทำตัวเป็นแบบกระบวนการ WSS Gaussian (และดังนั้นกระบวนการคงที่อย่างเคร่งครัด) ดังนั้นการสังเกตการทดลองของฟังก์ชั่น autocorrelation นอกจากนี้ตั้งแต่กระบวนการ Gaussian รักษาตัวอักษรแบบเกาส์ของพวกเขาที่พวกเขาผ่านระบบเชิงเส้นและฟังก์ชั่นอัตเอาท์พุทที่เกี่ยวข้องกับ TH ฟังก์ชั่นการป้อนข้อมูลอัตเป็น

Ry=hh~RX
เพื่อให้สามารถกำหนดสถิติเอาต์พุตได้อย่างง่ายดายกระบวนการ WSS โดยทั่วไปและกระบวนการ WSS Gaussian โดยเฉพาะนั้นมีความสำคัญอย่างยิ่งในการใช้งานด้านวิศวกรรม


คุณช่วยกรุณาแสดงความคิดเห็นเกี่ยวกับ "เสียงสีขาว" ในแง่นั้นได้หรือไม่? ตามนิยาม Autocorrelation ที่ คือความแปรปรวนของตัวแปรสุ่ม หมายความว่า AWGN (เสียงรบกวนแบบเกาส์สีขาวแบบเสริม) มีความแปรปรวนแบบไม่สิ้นสุดหรือไม่? ฉันขอให้มันเพราะคนมักจะเขียนn ( T ) N ( 0 , N 0 / 2 )เป็นผิดหรือเปล่า? มันควรจะเขียนn ( T ) N ( 0 , δ ( 0 ) N 0 / 2 ) ? ขอบคุณ τ=0n(t) N(0,N0/2)n(t) N(0,δ(0)N0/2)
Royi

1
@Drazick Please ask a separate question.
Dilip Sarwate

1
This is a fantastic mini-course in the definition of stationary processes. I've never seen anything like it--laid out so methodically and clearly. Community Wiki?
abalter

@Dilip Sarwate Excuse me for my ignorance. In the example. Why is E[X(t)]=0 for all t ? Did you assume ergodicity? How did you derive the probability density function of X(t) from the probability density function of theta to compute the expected value? E[X(t)X(s)] = E[cos(t+theta)*cos(s+theta)] right? Which steps did you take to simplify this expression and get to what you wrote? Thanks
VMMF

1
@VMMF There is NO ergodicity used. X(t)=cos(t+Θ) is a discrete random variable because Θ is a discrete random variable and it takes on values ±cos(t) and ±sin(t) with equal probability 14. Ergo, E[X(t)]=0. X(t)X(s) takes on values cos(t)cos(s), (cos(t))(cos(s))=cos(t)cos(s), sin(t)sin(s) and (sin(t))(sin(s))=sin(t)sin(s) with equal probability 14. Hence, E[X(t)(X(s)]=12(cos(t)cos(s)+sin(t)sin(s))=12cos(ts). Hence,
Dilip Sarwate
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.