คำถามติดแท็ก variance

ความเบี่ยงเบนกำลังสองของตัวแปรสุ่มที่คาดหวังจากค่าเฉลี่ย หรือค่าเบี่ยงเบนยกกำลังสองเฉลี่ยของข้อมูลเกี่ยวกับค่าเฉลี่ย

2
ทำไมรุ่น“ ข้อผิดพลาดใน X” จึงไม่ใช้กันอย่างแพร่หลาย?
เมื่อเราคำนวณผิดพลาดมาตรฐานของค่าสัมประสิทธิ์การถดถอยเราไม่บัญชีสำหรับแบบแผนในการออกแบบเมทริกซ์Xใน OLS เราจะคำนวณเป็นXXXvar(β^)var(β^)\text{var}(\hat{\beta})var((XTX)−1XTY)=σ2(XTX)−1var((XTX)−1XTY)=σ2(XTX)−1\text{var}((X^TX)^{-1}X^TY) = \sigma^2(X^TX)^{-1} หากถูกพิจารณาแบบสุ่มกฎความแปรปรวนโดยรวมจะเรียกร้องการสนับสนุนเพิ่มเติมของความแปรปรวนของเช่นกัน กล่าวคือXXXXXX วาร์( β^) = var ( E.)( β^| X) ) + E( var ( β)^| X) )var(β^)=var(E(β^|X))+E(var(β^|X)).\text{var}(\hat{\beta}) = \text{var}(E(\hat{\beta}|X)) + E(\text{var}(\hat{\beta}|X)). ซึ่งหากตัวประมาณค่า OLS ไม่มีความเป็นกลางอย่างแท้จริงเทอมแรกก็หายไปเนื่องจากความคาดหวังนั้นคงที่ ระยะที่สองจะกลายเป็นจริง:1}σ2cov ( X)- 1σ2cov(X)−1\sigma^2 \text{cov}(X)^{-1} หากเป็นที่รู้จักกันในแบบจำลองพารามิเตอร์สำหรับทำไมเราไม่แทนที่ด้วยการประมาณความแปรปรวนร่วมที่แท้จริง ตัวอย่างเช่นถ้าเป็นการสุ่มมอบหมายการรักษาความแปรปรวนทวินามควรเป็นการประมาณที่มีประสิทธิภาพมากกว่าหรือไม่XXXXTXXTXX^TXXXXE( X) ( 1 - E( X) )E(X)(1−E(X))E(X)(1-E(X)) ทำไมเราไม่พิจารณาใช้โมเดลที่ไม่ใช่พารามิเตอร์ที่ยืดหยุ่นเพื่อประเมินแหล่งที่มาของความเอนเอียงที่เป็นไปได้ในการประมาณค่า OLS และพิจารณาความไวในการออกแบบ (เช่นการกระจายของ ) ในเทอมที่แปรปรวนเทอมแรก …

1
ทำไม Netflix จึงเปลี่ยนจากระบบการจัดอันดับห้าดาวเป็นระบบ Like / Dislike
Netflix ใช้เพื่อจัดทำข้อเสนอแนะของผู้ใช้เกี่ยวกับการให้คะแนนภาพยนตร์ / รายการอื่น ๆ ระบบการจัดอันดับนี้มีห้าดาว ตอนนี้ Netflix อนุญาตให้ผู้ใช้ชอบ / ไม่ชอบ (thumbs-up / thumbs-down) ภาพยนตร์ / รายการ พวกเขาอ้างว่าให้คะแนนภาพยนตร์ได้ง่ายกว่า การจำแนกแบบสองทางนี้จะไม่สามารถคาดการณ์ทางสถิติได้น้อยกว่าระบบการจำแนกแบบ 5 ทิศทางหรือไม่? มันจะไม่จับการเปลี่ยนแปลงที่น้อยลงหรือไม่

4
ทำไมการกระจายตัวจึงใช้งานง่ายกว่าศูนย์กลาง
ดูเหมือนว่าจะมีบางอย่างในความเข้าใจของมนุษย์ของเราที่สร้างความยากลำบากในการเข้าใจความแปรปรวน ในความหมายที่แคบคำตอบคือทันที: การยกกำลังสองทำให้เราหลุดพ้นจากความเข้าใจที่สะท้อนกลับของเรา แต่มันเป็นเพียงความแปรปรวนที่นำเสนอปัญหาหรือเป็นความคิดทั้งหมดของการแพร่กระจายในข้อมูลหรือไม่ เราขอความคุ้มครองในช่วงหรือเพียงแค่ระบุค่าต่ำสุดและค่าสูงสุด แต่เราเพียงแค่หลีกเลี่ยงความยากลำบากจริงหรือ ในความหมาย (โหมดหรือค่ามัธยฐาน) เราพบศูนย์กลางการสรุป ... การทำให้เข้าใจง่าย ความแปรปรวนกระจายไปรอบ ๆ และทำให้พวกเขาอึดอัด มนุษย์ดึกดำบรรพ์จะใช้ประโยชน์จากค่าเฉลี่ยในการล่าสัตว์โดยการใช้รูปสามเหลี่ยมกับการสวดอ้อนวอน แต่ฉันคิดว่ามันช้ากว่ามากที่เรารู้สึกถึงความจำเป็นในการหาปริมาณการแพร่กระจายของสิ่งต่าง ๆ ในความเป็นจริงคำแปรปรวนเป็นครั้งแรกโดย Ronald Fisher เมื่อเร็ว ๆ นี้ในปี 1918ในกระดาษ "ความสัมพันธ์ระหว่างญาติในการสนับสนุนของการถ่ายทอดทางพันธุกรรม Mendelian" คนส่วนใหญ่ที่ติดตามข่าวจะได้ยินเรื่องราวของคำพูดที่โชคร้ายของLarry Summers เกี่ยวกับความถนัดทางคณิตศาสตร์ตามเพศซึ่งอาจเกี่ยวข้องกับการจากไปของเขาจากฮาร์วาร์ด โดยสรุปแล้วเขาเสนอความแปรปรวนที่กว้างขึ้นในการกระจายความสามารถทางคณิตศาสตร์ในเพศชายเมื่อเทียบกับเพศหญิงแม้ว่าเพศทั้งสองจะมีค่าเฉลี่ยเท่ากัน โดยไม่คำนึงถึงความเหมาะสมหรือผลกระทบทางการเมืองนี้ดูเหมือนว่าจะได้รับการพิสูจน์ในทางวิทยาศาสตร์ ที่สำคัญกว่านั้นบางทีความเข้าใจในประเด็นต่าง ๆ เช่นการเปลี่ยนแปลงสภาพภูมิอากาศ - โปรดยกโทษให้ฉันเมื่อนำหัวข้อที่อาจนำไปสู่การอภิปรายที่ไม่มีเหตุผลสำหรับการอภิปรายโดยประชาชนทั่วไปอาจได้รับความช่วยเหลือจากความคุ้นเคยที่ดีขึ้นกับแนวคิดเรื่องความแปรปรวน ปัญหาที่ได้รับการประกอบเมื่อเราพยายามที่จะเข้าใจความแปรปรวนดังแสดงในโพสต์นี้เนื้อเรื่องที่ดีและคำตอบที่มีสีสันโดย @whuber ที่นี่ มันอาจจะดึงดูดการยกเลิกคำถามนี้ทั่วไปเกินไป แต่ก็เป็นที่ชัดเจนว่าเราจะคุยทางอ้อมเช่นเดียวกับในโพสต์นี้ที่คณิตศาสตร์เล็กน้อย แต่แนวคิดช่วยในการเป็นที่เข้าใจยาก belying การยอมรับสะดวกสบายมากขึ้นของช่วงเป็น ตรงข้ามกับความแปรปรวนของแนวคิดที่เหมาะสมยิ่งขึ้น ในจดหมายจากฟิชเชอร์ถึง EBFordซึ่งอ้างถึงการโต้เถียงเกี่ยวกับความสงสัยของเขาเกี่ยวกับการทดลองของ Mendelian เราอ่านว่า: "ตอนนี้เมื่อข้อมูลมีการแกล้งฉันรู้ดีว่าคนทั่วไปประเมินความถี่ของการเบี่ยงเบนโอกาสน้อยเกินไป …

1
การประมาณค่าความแปรปรวนของประชากรถ้ารู้ค่าเฉลี่ยประชากร
ฉันรู้ว่าเราใช้เพื่อประเมินความแปรปรวนของประชากร ฉันจำได้ว่าวิดีโอจาก Khan Academy ที่สัญชาตญาณที่ได้รับคือค่าเฉลี่ยที่เราคาดไว้อาจจะเล็กน้อยจากค่าจริงดังนั้นระยะทางจะยิ่งใหญ่กว่าจริง ๆ ดังนั้นเราหารด้วยน้อยกว่า (แทน ) เพื่อให้ได้ค่าที่มากขึ้นส่งผลให้การประเมินดีขึ้น และผมจำได้อ่านที่ไหนสักแห่งที่ฉันไม่จำเป็นต้องแก้ไขนี้ถ้าฉันมีที่เกิดขึ้นจริงของประชากรเฉลี่ยแทน{x} ดังนั้นฉันจะประมาณ แต่ฉันไม่สามารถหามันได้อีก มันจริงหรอ? ใครช่วยชี้ให้ฉันได้บ้าง1n−1∑i(xi−x¯)21n−1∑i(xi−x¯)2\frac1{n-1}\sum\limits_i(x_i - \bar{x})^2xi−x¯xi−x¯x_i - \bar{x}n−1n−1n-1nnnμμ\mux¯x¯\bar{x}1n∑i(xi−μ)21n∑i(xi−μ)2\frac1{n}\sum\limits_i(x_i - \mu)^2
11 variance  sample 

1
ค่าเฉลี่ยและความแปรปรวนมีอยู่เสมอสำหรับการแจกแจงแบบครอบครัวชี้แจงหรือไม่?
สมมติว่าตัวแปรสเกลาร์แบบสุ่มเป็นของตระกูลเอ็กซ์โพเนนเชียลที่มีพารามิเตอร์แบบเวกเตอร์พร้อม pdfXXX fX(x|θ)=h(x)exp(∑i=1sηi(θ)Ti(x)−A(θ))fX(x|θ)=h(x)exp⁡(∑i=1sηi(θ)Ti(x)−A(θ)) f_X(x|\boldsymbol \theta) = h(x) \exp\left(\sum_{i=1}^s \eta_i({\boldsymbol \theta}) T_i(x) - A({\boldsymbol \theta}) \right) โดยที่θ=(θ1,θ2,⋯,θs)Tθ=(θ1,θ2,⋯,θs)T{\boldsymbol \theta} = \left(\theta_1, \theta_2, \cdots, \theta_s \right )^Tเป็นเวกเตอร์พารามิเตอร์และT(x)=(T1(x),T2(x),⋯,Ts(x))TT(x)=(T1(x),T2(x),⋯,Ts(x))T\mathbf{T}(x)= \left(T_1(x), T_2(x), \cdots,T_s(x) \right)^Tเป็นสถิติที่เพียงพอร่วม สามารถแสดงให้เห็นว่าค่าเฉลี่ยและความแปรปรวนสำหรับแต่ละTi(x)Ti(x)T_i(x)มีอยู่ อย่างไรก็ตามค่าเฉลี่ยและความแปรปรวนสำหรับXXX (เช่นE(X)E(X)E(X)และVar(X)Var(X)Var(X) ) มีอยู่เสมอเช่นกัน? ถ้าไม่มีมีตัวอย่างของการแจกแจงแบบครอบครัวแทนของรูปแบบนี้ซึ่งไม่มีค่าเฉลี่ยและตัวแปรอยู่หรือไม่? ขอบคุณ.

1
ความแปรปรวนของผลตอบแทนประจำปีขึ้นอยู่กับความแปรปรวนของผลตอบแทนรายเดือน
ฉันพยายามที่จะเข้าใจความแตกต่างทั้งหมด / ข้อผิดพลาดมาตรฐานของชุดเวลาของผลตอบแทนทางการเงินและฉันคิดว่าฉันติดอยู่ ฉันมีชุดข้อมูลการส่งคืนสินค้ารายเดือน (เรียกว่า ) ซึ่งคาดว่ามีค่า 1.00795 และผลต่าง 0.000228 (std. dev คือ 0.01512) ฉันพยายามคำนวณกรณีเลวร้ายที่สุดของผลตอบแทนรายปี (สมมุติว่ามูลค่าที่คาดหวังลบด้วยข้อผิดพลาดมาตรฐานสองเท่า) วิธีไหนเป็นวิธีที่ดีที่สุดที่จะทำ? ก . คำนวณเป็นเดือนเดียว ( ) แล้วคูณด้วยตัวมันเอง 12 ครั้ง (= 0.7630 ) ข . สมมติว่าเดือนมีความเป็นอิสระกำหนด 12 ครั้งพบว่าเป็นค่าที่คาดหวังXXX μX−2⋅σX=0.977μX−2⋅σX=0.977\mu_X-2\cdot \sigma_X=0.977 Y=X⋅X⋅...⋅XY=X⋅X⋅...⋅XY=X\cdot X\cdot ...\cdot XE[Y]=(E[X])12E[Y]=(E[X])12E[Y]=(E[X])^{12}) และความแปรปรวน{12} สำหรับการพัฒนามาตรฐานในกรณีนี้คือ 0.0572 และค่าที่คาดหวังลบสองมาตรฐาน. dev เป็น0.9853 . ซี . คูณมาตรฐานรายเดือน. dev …

2
การอ้างอิงสำหรับ ?
ในคำตอบของเขาสำหรับคำถามก่อนหน้านี้@Erik P.ให้นิพจน์ ที่คือส่วนเกินของการแจกแจง อ้างอิงถึงรายการวิกิพีเดียเกี่ยวกับการแจกแจงความแปรปรวนตัวอย่างแต่หน้าวิกิพีเดียบอกว่า "อ้างอิงที่จำเป็น"κVar[s2]=σ4(2n−1+κn),Var[s2]=σ4(2n−1+κn), \mathrm{Var}[s^2]=\sigma^4 \left(\frac{2}{n-1} + \frac{\kappa}{n}\right) \>, κκ\kappa คำถามหลักของฉันคือมีการอ้างอิงสำหรับสูตรนี้หรือไม่? มัน 'เล็กน้อย' ที่จะได้มาและถ้าเป็นเช่นนั้นมันสามารถพบได้ในตำราเรียน? (@Erik P. ไม่พบในสถิติคณิตศาสตร์และการวิเคราะห์ข้อมูลหรือฉันในการอนุมานทางสถิติโดย Casella และ Bergerแม้ว่าหัวข้อจะครอบคลุม มันจะดีถ้ามีการอ้างอิงตำราเรียน แต่มีประโยชน์มากกว่าที่จะมีการอ้างอิงหลัก (the) (คำถามที่เกี่ยวข้องคือ: การแจกแจงความแปรปรวนของตัวอย่างจากการแจกแจงที่ไม่รู้จักคืออะไร ) อัปเดต : @ cardinalชี้ให้เห็นสมการอื่นในmath.SE : โดยที่คือช่วงเวลากลางที่สี่ μ4Var(S2)=μ4n−σ4(n−3)n(n−1)Var(S2)=μ4n−σ4(n−3)n(n−1) \mathrm{Var}(S^2)={\mu_4\over n}-{\sigma^4\,(n-3)\over n\,(n-1)} μ4μ4\mu_4 มีวิธีที่จะจัดเรียงสมการใหม่และแก้ไขทั้งสองหรือสมการในชื่อผิดหรือไม่?

1
การแปลง r เป็นฟิชเชอร์ซีมีประโยชน์ต่อการวิเคราะห์อภิมานหรือไม่?
โดยปกติจะถูกแปลงเป็น Fisher zเพื่อทดสอบความแตกต่างระหว่างค่าrสองค่า แต่เมื่อต้องทำการวิเคราะห์เมตาดาต้าทำไมเราควรทำตามขั้นตอนดังกล่าว มันถูกต้องสำหรับข้อผิดพลาดในการวัดหรือข้อผิดพลาดที่ไม่ใช่การสุ่มตัวอย่างและทำไมเราควรสันนิษฐานว่าrเป็นการประมาณค่าที่ไม่สมบูรณ์ของสหสัมพันธ์ของประชากรrrrzzzrrrrrr

4
วิธีการแนวความคิดข้อผิดพลาดในรูปแบบการถดถอยหรือไม่?
ฉันกำลังเข้าร่วมชั้นเรียนวิเคราะห์ข้อมูลและแนวคิดที่หยั่งรากลึกของฉันบางอย่างกำลังสั่นไหว ความคิดที่ว่าข้อผิดพลาด (เอปไซลอน) รวมถึงความแปรปรวนประเภทอื่น ๆ นั้นมีผลเฉพาะกับ (ฉันคิดว่า) กับกลุ่ม (ตัวอย่างหรือประชากรทั้งหมด) ตอนนี้เรากำลังได้รับการสอนว่าหนึ่งในสมมติฐานการถดถอยคือความแปรปรวนคือ "เหมือนกันสำหรับทุกคน" นี่เป็นเรื่องที่ทำให้ฉันตกใจ ฉันคิดเสมอว่ามันเป็นความแปรปรวนใน Y ที่สอดคล้องกับค่าทั้งหมดของ X ที่คิดว่าคงที่ ฉันได้คุยกับศาสตราจารย์ผู้ซึ่งบอกฉันว่าเมื่อเราถดถอยเราคิดว่าแบบจำลองของเราเป็นจริง และฉันคิดว่านั่นเป็นส่วนที่ยุ่งยาก สำหรับฉันคำว่าข้อผิดพลาด (epsilon) หมายถึงบางสิ่งบางอย่างเช่น "องค์ประกอบใดก็ตามที่เราไม่ทราบและอาจส่งผลต่อตัวแปรผลลัพธ์ของเรารวมถึงข้อผิดพลาดในการวัด" ในวิธีการสอนในชั้นเรียนไม่มีสิ่งเช่น "สิ่งอื่น ๆ "; แบบจำลองของเราถือว่าเป็นจริงและสมบูรณ์ ซึ่งหมายความว่าการเปลี่ยนแปลงส่วนที่เหลือทั้งหมดจะต้องถูกคิดว่าเป็นผลมาจากความผิดพลาดในการวัด ฉันรู้สึกว่ามีบางอย่างผิดปกติฉันอยากจะมีความเห็นจากผู้เชี่ยวชาญเกี่ยวกับเรื่องนี้ ... มีห้องสำหรับการตีความหรือไม่ว่าคำผิดพลาดคืออะไร

1
ค่าเฉลี่ยและความแปรปรวนของการแจกแจงปัวซองแบบ zero-inflated
ทุกคนสามารถแสดงให้เห็นว่าค่าที่คาดหวังและความแปรปรวนของปัวซองที่สูงเกินศูนย์ด้วยฟังก์ชันความน่าจะเป็นเป็นอย่างไร f(y)={π+(1−π)e−λ,(1−π)λye−λy!,if y=0if y=1,2....f(y)={π+(1−π)e−λ,if y=0(1−π)λye−λy!,if y=1,2.... f(y) = \begin{cases} \pi+(1-\pi)e^{-\lambda}, & \text{if }y=0 \\ (1-\pi)\frac{\lambda^{y}e^{-\lambda}}{y!}, & \text{if }y=1,2.... \end{cases} ที่คือความน่าจะเป็นที่การสังเกตเป็นศูนย์โดยกระบวนการทวินามและλคือค่าเฉลี่ยของปัวซอง, ได้มา?ππ\piλλ\lambda ผลลัพธ์คือค่าที่คาดหวังและความแปรปรวนคือμ + πμ=(1−π)λμ=(1−π)λ\mu =(1-\pi)\lambda2μ+π1−πμ2μ+π1−πμ2\mu+ \frac{\pi}{1-\pi}\mu^{2} เพิ่ม: ฉันกำลังมองหากระบวนการ ตัวอย่างเช่นคุณสามารถใช้ฟังก์ชั่นสร้างช่วงเวลาได้หรือไม่? ในที่สุดฉันต้องการที่จะเห็นวิธีการทำเช่นนี้เพื่อทำความเข้าใจแกมมาที่สูงเกินจริงและอื่น ๆ เช่นกัน

3
สูตรเหล่านี้สำหรับการเปลี่ยน P, LSD, MSD, HSD, CI เพื่อ SE เป็นประมาณการแน่นอนหรือพอง / อนุลักษณ์ของ
พื้นหลัง ฉันกำลังทำการวิเคราะห์เมตาซึ่งรวมถึงข้อมูลที่เผยแพร่ก่อนหน้านี้ บ่อยครั้งที่รายงานความแตกต่างระหว่างการรักษาด้วยค่า P, ความแตกต่างอย่างมีนัยสำคัญน้อยที่สุด (LSD) และสถิติอื่น ๆ แต่ไม่มีการประมาณความแปรปรวนโดยตรง ในบริบทของแบบจำลองที่ฉันใช้ความแปรปรวนสูงเกินไปก็โอเค ปัญหา นี่คือรายการของการแปลงเป็นโดยที่S E = √SESESE (Saville 2003)ที่ฉันกำลังพิจารณาข้อเสนอแนะชื่นชม; ด้านล่างฉันสมมติว่าα=0.05ดังนั้น1- α / 2=0.975 และตัวแปรจะกระจายตามปกติเว้นแต่จะระบุไว้เป็นอย่างอื่น:SE= MSE/ n-------√SE=MSE/nSE=\sqrt{MSE/n} α = 0.05α=0.05\alpha=0.051 -α/2= 0.9751-α/2=0.9751-^{\alpha}/_2=0.975 คำถาม: กำหนด , nและการรักษาหมายถึงˉ X 1และˉ X 2 S E = ˉ X 1 - ˉ X 2PPPnnnX¯1X¯1\bar X_1X¯2X¯2\bar X_2 SE= …

2
ทำไมต้นไม้ที่ถูกถุง / ต้นไม้ป่าสุ่มมีอคติสูงกว่าต้นไม้ตัดสินใจเดี่ยว?
หากเราพิจารณาแผนภูมิการตัดสินใจที่โตเต็มที่ (เช่นแผนผังการตัดสินใจที่ไม่มีการแบ่ง) มันมีความแปรปรวนสูงและมีอคติต่ำ การบรรจุถุงและป่าสุ่มใช้โมเดลความแปรปรวนสูงเหล่านี้และรวมเข้าด้วยกันเพื่อลดความแปรปรวนและเพิ่มความแม่นยำในการทำนาย ทั้งการบรรจุถุงและการสุ่มป่าใช้การสุ่มตัวอย่าง Bootstrap และตามที่อธิบายไว้ใน "องค์ประกอบของการเรียนรู้ทางสถิติ" สิ่งนี้จะเพิ่มความลำเอียงในต้นไม้ต้นเดียว นอกจากนี้เนื่องจากวิธีการสุ่มฟอเรสต์ จำกัด ตัวแปรที่อนุญาตให้แยกในแต่ละโหนดอคติสำหรับฟอเรสต์แบบสุ่มเดียวจะเพิ่มมากขึ้น ดังนั้นความแม่นยำในการทำนายจะเพิ่มขึ้นหากการเพิ่มขึ้นของอคติของต้นไม้ต้นเดียวในการบรรจุหีบห่อและการสุ่มป่าไม่ได้ "เกินความจริง" การลดความแปรปรวน สิ่งนี้นำฉันไปสู่คำถามสองข้อต่อไปนี้: 1) ฉันรู้ว่าด้วยการสุ่มตัวอย่าง bootstrap เราจะ (เกือบทุกครั้ง) มีการสังเกตแบบเดียวกันในตัวอย่าง bootstrap แต่ทำไมสิ่งนี้นำไปสู่การเพิ่มอคติของต้นไม้แต่ละต้นในป่าที่ห่อหุ้ม / สุ่ม 2) นอกจากนี้ทำไมข้อ จำกัด ของตัวแปรที่มีให้แยกในแต่ละการแยกทำให้มีอคติสูงกว่าในต้นไม้แต่ละต้นในป่าสุ่ม

3
ค่าเฉลี่ยของการแจกแจงเลขชี้กำลังผกผัน
ให้ตัวแปรสุ่มค่าเฉลี่ยและความแปรปรวนของG = 1 คืออะไรY= Ex p ( λ )Y=Exp(λ)Y = Exp(\lambda)ไหมG = 1YG=1YG=\dfrac{1}{Y} ฉันดูการแจกแจงผกผันแกมม่า แต่ค่าเฉลี่ยและความแปรปรวนถูกกำหนดเฉพาะสำหรับและα > 2ตามลำดับ ...α > 1α>1\alpha>1α > 2α>2\alpha>2

2
ความสัมพันธ์ระหว่างไซน์และโคไซน์
สมมติว่ากระจายอย่างสม่ำเสมอบน[ 0 , 2 π ] Let Y = บาปXและZ = cos X แสดงให้เห็นว่าความสัมพันธ์ระหว่างYและZเป็นศูนย์XXX[ 0 , 2 π][0,2π][0, 2\pi]Y= บาปXY=sin⁡XY = \sin XZ= cosXZ=cos⁡XZ = \cos XYYYZZZ ดูเหมือนว่าฉันจะต้องรู้ค่าเบี่ยงเบนมาตรฐานของไซน์และโคไซน์และความแปรปรวนร่วมของพวกมัน ฉันจะคำนวณสิ่งเหล่านี้ได้อย่างไร ฉันคิดว่าฉันต้องถือว่ามีการกระจายชุดและดูที่ตัวแปรเปลี่ยนY = บาป( X )และZ = cos ( X ) จากนั้นกฎของนักสถิติที่ไม่รู้สึกตัวจะให้คุณค่าที่คาดหวังXXXY= บาป( X)Y=sin⁡(X)Y=\sin(X)Z= cos( X)Z=cos⁡(X)Z=\cos(X) และE[Z]=1E[ Y] = 1ข-∫∞- ∞บาป( x …

2
ความแปรปรวนของฟังก์ชั่น * * ใน * หมายถึงการเรียนรู้เชิงสถิติ * หมายถึงอะไร
บนหน้า 34 ของการเรียนรู้สถิติเบื้องต้น : \newcommand{\Var}{{\rm Var}} แม้ว่าหลักฐานทางคณิตศาสตร์จะอยู่นอกเหนือขอบเขตของหนังสือเล่มนี้ก็เป็นไปได้ที่จะแสดงให้เห็นว่าการทดสอบที่คาดหวัง MSE สำหรับค่าที่กำหนดx0x0x_0สามารถแบ่งย่อยเป็นผลรวมของสามปริมาณพื้นฐาน: ความแปรปรวนของf^(x0)f^(x0)\hat{f}(x_0)ที่ยกกำลังสองอคติของf^(x0)f^(x0)\hat{f}(x_0)และความแปรปรวนของข้อตกลงข้อผิดพลาด\εε\varepsilonนั่นคือ, E(y0−f^(x0))2=Var(f^(x0))+[Bias(f^(x0))]2+Var(ε)E(y0−f^(x0))2=Var(f^(x0))+[Bias(f^(x0))]2+Var(ε) E\left(y_0 - \hat{f}(x_0)\right)^2 = \Var\big(\hat{f}(x_0)\big) + \Big[{\rm Bias}\big(\hat{f}(x_0)\big)\Big]^2 + \Var(\varepsilon) [... ] ความแปรปรวนหมายถึงจำนวนที่f^f^\hat{f}จะเปลี่ยนแปลงหากเราประเมินโดยใช้ชุดข้อมูลการฝึกอบรมอื่น คำถาม:เนื่องจากVar(f^(x0))Var(f^(x0))\Var\big(\hat{f}(x_0)\big)ดูเหมือนจะแสดงถึงความแปรปรวนของฟังก์ชั่นสิ่งนี้หมายความว่าอย่างเป็นทางการ? นั่นคือฉันคุ้นเคยกับแนวคิดของความแปรปรวนของตัวแปรสุ่มXXXแต่สิ่งที่เกี่ยวกับความแปรปรวนของชุดฟังก์ชัน นี่อาจเป็นความแปรปรวนของตัวแปรสุ่มอีกค่าที่มีรูปแบบของฟังก์ชันหรือไม่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.