ความแปรปรวนของฟังก์ชันหนึ่งตัวแปรสุ่ม


33

ให้บอกว่าเรามีตัวแปรสุ่มมีความแปรปรวนและค่าเฉลี่ยที่รู้จัก คำถามคืออะไรความแปรปรวนของสำหรับบางฟังก์ชั่นที่กำหนด วิธีทั่วไปเท่านั้นที่ฉันรู้คือวิธีเดลต้า แต่ให้เพียงประมาณ ตอนนี้ฉันสนใจในแต่มันก็ดีที่จะรู้วิธีการทั่วไปบางอย่างX(X)(x)=x

แก้ไข 29.12.2010
ฉันได้ทำการคำนวณโดยใช้ซีรี่ส์ Taylor แต่ฉันไม่แน่ใจว่ามันถูกต้องหรือไม่ดังนั้นฉันจึงดีใจถ้ามีคนยืนยันได้

ก่อนอื่นเราต้องประมาณE[(X)]
E[f(X)]E[f(μ)+f(μ)(Xμ)+12f(μ)(Xμ)2]=f(μ)+12f(μ)Var[X]

ตอนนี้เราสามารถประมาณ E [(f (X) -E [f (X)]) ^ 2] \ ประมาณ E [(f (\ mu) + f '(\ mu) ( X- \ mu) + \ frac {1} {2} \ cdot f '' (\ mu) (X- \ mu) ^ 2 -E [f (X)]) ^ 2]D2[f(X)]
E[(f(X)E[f(X)])2]E[(f(μ)+f(μ)(Xμ)+12f(μ)(Xμ)2E[f(X)])2]

การใช้การประมาณของE[f(X)]เรารู้ว่าf(μ)Ef(x)12f(μ)Var[X]

เราใช้สิ่งนี้ได้:
D2[f(X)]1D2[f(X)]14f(μ)2Var[X]212f(μ)2Var[X]2+f(μ)2Var[X]+14f(μ)2E[(Xμ)4]+12f(μ)f(μ)E[(Xμ)3]
D2[(X)]14"(μ)2[D4X-(D2X)2]+'(μ)D2X+12'(μ)"(μ)D3X


วิธีเดลต้าใช้สำหรับการแจกแจงแบบไม่ระบุชื่อ คุณไม่สามารถใช้เมื่อคุณมีตัวแปรสุ่มเพียงตัวเดียว
mpiktas

@mpiktas: จริงๆแล้วฉันไม่รู้เกี่ยวกับวิธีเดลต้าฉันเพิ่งอ่านอะไรบางอย่างในวิกิพีเดีย นี่คือคำพูดจากวิกิ: "วิธีการเดลต้าใช้การขยายเทย์เลอร์ลำดับที่สองเพื่อประมาณความแปรปรวนของฟังก์ชันของตัวแปรสุ่มหนึ่งตัวหรือมากกว่า"
Tomek Tarczynski

ดูเหมือนว่าวิกิพีเดียมีสิ่งที่คุณต้องการ: en.wikipedia.org/wiki/... ฉันจะแก้ไขคำตอบของฉันใหม่ดูเหมือนว่าฉันประเมินการขยายตัวของเทย์เลอร์ต่ำเกินไป
mpiktas

Tomek ถ้าคุณไม่เห็นด้วยกับการแก้ไขที่ทำ (ไม่ใช่ฉัน) คุณสามารถเปลี่ยนแปลงได้อีกครั้งหรือย้อนกลับหรือเพียงชี้ให้เห็นความแตกต่างและขอคำชี้แจง
Glen_b -Reinstate Monica

2
@Glen_b: ฉันเห็นด้วยกับพวกเขา E (X-mu) = 0 ไม่ได้หมายความว่า E [(X-mu) ^ 3] = 0.
Tomek Tarczynski

คำตอบ:


33

ปรับปรุง

ฉันประเมินการขยายตัวของเทย์เลอร์ต่ำเกินไป พวกเขาใช้งานได้จริง ฉันคิดว่าส่วนที่เหลือของคำที่เหลือสามารถถูก จำกัด ได้ แต่ด้วยการทำงานเพียงเล็กน้อยก็สามารถแสดงให้เห็นว่านี่ไม่ใช่กรณี

การขยายตัวของเทย์เลอร์ใช้งานได้กับฟังก์ชั่นในช่วงเวลาปิดล้อมรอบ สำหรับตัวแปรสุ่มที่มีความแปรปรวน จำกัด Chebyshevให้ความไม่เท่าเทียมกัน

P(|X-EX|>)VaR(X)

ดังนั้นสำหรับการใด ๆเราสามารถหาขนาดใหญ่พอเพื่อให้cε>0

P(X[EX-,EX+])=P(|X-EX|)<1-ε

แรกให้เราประเมิน(X) เรามี ที่เป็นฟังก์ชั่นการจัดจำหน่ายxE f ( X ) = | x - E X | c f ( x ) d F ( x ) + | x - E X | > c f ( x ) d F ( x ) F ( x ) XE(X)

E(X)=|x-EX|(x)dF(x)+|x-EX|>(x)dF(x)
F(x)X

เนื่องจากโดเมนของอินทิกรัลแรกคือช่วงเวลาซึ่งล้อมรอบช่วงเวลาปิดเราสามารถใช้การขยายเทย์เลอร์: ที่ , และความเท่าเทียมกันถือสำหรับทุกC] ฉันใช้เวลาแค่ 4 เทอมในการขยายเทย์เลอร์ แต่โดยทั่วไปเราสามารถรับได้มากเท่าที่เราต้องการตราบใดที่ฟังก์ชั่นราบรื่นพอf ( x ) = f ( E X ) + f ( E X ) ( x - E X ) + f ( E X )[EX-,EX+]อัลฟ่า[EX-C,EX+C]x[EX-C,EX+C]

(x)=(EX)+'(EX)(x-EX)+"(EX)2(x-EX)2+(α)3(x-EX)3
α[EX-,EX+]x[EX-,EX+]

การแทนที่สูตรนี้เป็นสูตรก่อนหน้านี้ที่เราได้รับ

E(X)=|x-EX|(EX)+'(EX)(x-EX)+"(EX)2(x-EX)2dF(x)+|x-EX|(α)3(x-EX)3dF(x)+|x-EX|>(x)dF(x)
ตอนนี้เราสามารถเพิ่มโดเมนของการรวมเพื่อรับสูตรต่อไปนี้

E(X)=(EX)+"(EX)2E(X-EX)2+R3
โดยที่ ขณะนี้ภายใต้เงื่อนไขบางช่วงเวลาเราสามารถแสดงให้เห็นว่าระยะที่สองของคำที่เหลือนี้มีขนาดใหญ่เท่ากับซึ่งมีขนาดเล็ก น่าเสียดายที่เทอมแรกยังคงอยู่ดังนั้นคุณภาพของการประมาณขึ้นอยู่กับและพฤติกรรมของอนุพันธ์อันดับสามของในช่วงเวลาที่ จำกัด ประมาณดังกล่าวควรจะทำงานที่ดีที่สุดสำหรับตัวแปรสุ่มที่มี 0
R3=(α)3E(X-EX)3++|x-EX|>((EX)+'(EX)(x-EX)+"(EX)2(x-EX)2+(X))dF(x)
P(|X-EX|>)E(X-EX)3E(X-EX)3=0

ทีนี้สำหรับความแปรปรวนเราสามารถใช้การประมาณเทย์เลอร์สำหรับ , ลบสูตรสำหรับและลบความแตกต่าง แล้วก็(x)E(x)

E(f(x)Ef(x))2=(f(EX))2Var(X)+T3

ที่เกี่ยวข้องกับช่วงเวลาที่สำหรับkเราสามารถมาถึงสูตรนี้ได้โดยใช้การขยายเทย์เลอร์ลำดับที่หนึ่งเท่านั้นเช่นการใช้อนุพันธ์อันดับหนึ่งและสองเท่านั้น คำผิดพลาดจะคล้ายกันT3E(XEX)kk=4,5,6

วิธีอื่นคือขยาย : f2(x)

f2(x)=f2(EX)+2f(EX)f(EX)(xEX)+[(f(EX))2+f(EX)f(EX)](XEX)2+(f2(β))3(XEX)3

ในทำนองเดียวกันเราจะได้รับ ที่คล้ายกับR_3

Ef2(x)=f2(EX)+[(f(EX))2+f(EX)f(EX)]Var(X)+R~3
R~3R3

สูตรสำหรับความแปรปรวนจะกลายเป็น โดยที่มีช่วงเวลาที่สามขึ้นไป

Var(f(X))=[f(EX)]2Var(X)[f(EX)]24Var2(X)+T~3
T~3

ฉันไม่จำเป็นต้องรู้ค่าที่แน่นอนของความแปรปรวนการประมาณค่าควรเหมาะกับฉัน
Tomek Tarczynski

อันที่จริงสูตรโดยประมาณสำหรับใน OP มักใช้ในการวิเคราะห์ความเสี่ยงในด้านเศรษฐศาสตร์การเงินและการประกันภัย E[f(X)]
Raskolnikov

@ Raskolnikov ใช่ แต่มันขัดแย้งกับความรู้เก่าของฉันที่ยอมรับอย่างกว้างขวางเกี่ยวกับการขยายตัวของเทย์เลอร์ เห็นได้ชัดว่าระยะเวลาที่เหลือจะต้องนำมาพิจารณา ถ้าตัวแปรสุ่มถูก จำกัด ขอบเขตก็ไม่มีปัญหาเนื่องจากพหุนามมีฟังก์ชันต่อเนื่องโดยประมาณในช่วงเวลาที่ จำกัด แต่เราจัดการกับตัวแปรสุ่มที่ไม่มีขอบเขต แน่นอนว่าสำหรับการสุ่มปกติเราสามารถพูดได้ว่ามันถูก จำกัด ขอบเขตอย่างมีประสิทธิภาพ แต่ในกรณีทั่วไปความประหลาดใจที่น่ารังเกียจบางอย่างสามารถเกิดขึ้นได้หรือไม่ ฉันจะแก้ไขคำตอบของฉันเมื่อฉันจะได้คำตอบที่ชัดเจน
mpiktas

2
@Tomek Tarczynski อนุพันธ์อันดับสามของไปที่ศูนย์อย่างรวดเร็วสำหรับมีขนาดใหญ่แต่ไม่มีขีด จำกัด ใกล้ศูนย์ ดังนั้นถ้าคุณเลือกการกระจายแบบสม่ำเสมอด้วยการสนับสนุนใกล้กับศูนย์คำที่เหลือจะมีขนาดใหญ่ xx
mpiktas

1
โปรดทราบว่าในลิงก์ของคุณ ในคำตอบนี้สมการทั้งหมดนั้นแน่นอน นอกจากนี้สำหรับบันทึกความแปรปรวนที่อนุพันธ์แรกเป็นที่คาดกันที่ไม่xนอกจากนี้ฉันไม่เคยระบุว่าสิ่งนี้จะไม่ทำงานสำหรับเฉพาะที่สำหรับสูตรโดยประมาณอาจมีข้อผิดพลาดอย่างมากหากโดเมนใกล้กับศูนย์ EXxxxX
mpiktas

8

หากต้องการทราบว่าช่วงเวลาสองช่วงแรกของ X (ค่าเฉลี่ยและความแปรปรวน) ไม่เพียงพอหากฟังก์ชัน f (x) เป็นแบบสุ่ม (ไม่ใช่แบบเชิงเส้น) ไม่เพียง แต่สำหรับการคำนวณความแปรปรวนของตัวแปรแปรสภาพ Y แต่ยังรวมถึงค่าเฉลี่ยด้วย หากต้องการดูสิ่งนี้ - และบางทีอาจเป็นการโจมตีปัญหาของคุณ - คุณสามารถสันนิษฐานได้ว่าฟังก์ชั่นการแปลงของคุณมีการขยายเทย์เลอร์รอบค่าเฉลี่ยของ X และทำงานจากที่นั่น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.