คำถามติดแท็ก variance

ความเบี่ยงเบนกำลังสองของตัวแปรสุ่มที่คาดหวังจากค่าเฉลี่ย หรือค่าเบี่ยงเบนยกกำลังสองเฉลี่ยของข้อมูลเกี่ยวกับค่าเฉลี่ย

1
ความแปรปรวนแบบถ่วงน้ำหนักอีกครั้ง
ความแปรปรวนแบบถ่วงน้ำหนักที่ไม่เอนเอียงได้ถูกกล่าวถึงแล้วที่นี่และที่อื่น ๆแต่ก็ยังมีความสับสนอย่างน่าประหลาด มีปรากฏเป็นฉันทามติต่อการสูตรที่นำเสนอในลิงค์แรกเช่นเดียวกับในบทความวิกิพีเดีย ดูเหมือนว่าสูตรที่ใช้โดย R, Mathematica และ GSL (แต่ไม่ใช่ MATLAB) อย่างไรก็ตามบทความ Wikipedia ยังมีบรรทัดต่อไปนี้ซึ่งดูเหมือนว่ามีสติที่ดีสำหรับการดำเนินการแปรปรวนน้ำหนัก: ตัวอย่างเช่นหากค่า {2,2,4,5,5,5} ถูกดึงมาจากการแจกแจงแบบเดียวกันเราสามารถถือว่าชุดนี้เป็นตัวอย่างที่ไม่ได้ถ่วงน้ำหนักหรือเราสามารถถือว่าเป็นตัวอย่างที่มีน้ำหนัก {2,4 5} ด้วยน้ำหนักที่สอดคล้องกัน {2,1,3} และเราควรได้ผลลัพธ์เดียวกัน การคำนวณของฉันให้ค่า 2.1667 สำหรับความแปรปรวนของค่าดั้งเดิมและ 2.9545 สำหรับความแปรปรวนแบบถ่วงน้ำหนัก ฉันควรคาดหวังให้พวกเขาเหมือนกันหรือไม่? ทำไมหรือทำไมไม่?

3
ค่าสูงสุดของสัมประสิทธิ์การแปรผันสำหรับชุดข้อมูลที่มีขอบเขต
ในการอภิปรายทำตามคำถามล่าสุดเกี่ยวกับว่าส่วนเบี่ยงเบนมาตรฐานสามารถสูงกว่าค่าเฉลี่ยได้หรือไม่คำถามหนึ่งถูกยกให้สั้น ๆ แต่ไม่เคยตอบอย่างสมบูรณ์ ดังนั้นฉันถามมันที่นี่ พิจารณาชุดของnnnตัวเลขไม่ติดลบ xixix_iที่0≤xi≤c0≤xi≤c0 \leq x_i \leq cสำหรับ1≤i≤n1≤i≤n1 \leq i \leq n n ไม่จำเป็นต้องให้xixix_iแตกต่างนั่นคือเซตอาจเป็นหลายเซ็ต ค่าเฉลี่ยและความแปรปรวนของชุดถูกกำหนดเป็น x¯=1n∑i=1nxi, σ2x=1n∑i=1n(xi−x¯)2=(1n∑i=1nx2i)−x¯2x¯=1n∑i=1nxi, σx2=1n∑i=1n(xi−x¯)2=(1n∑i=1nxi2)−x¯2\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i, ~~ \sigma_x^2 = \frac{1}{n}\sum_{i=1}^n (x_i - \bar{x})^2 = \left(\frac{1}{n}\sum_{i=1}^n x_i^2\right) - \bar{x}^2 และค่าเบี่ยงเบนมาตรฐานคือσxσx\sigma_xx โปรดทราบว่าชุดของตัวเลขไม่ใช่ตัวอย่างจากประชากรและเราไม่ได้ประมาณค่าเฉลี่ยประชากรหรือความแปรปรวนของประชากร คำถามคือ: ค่าสูงสุดของσ xคืออะไรσxx¯σxx¯\dfrac{\sigma_x}{\bar{x}}สัมประสิทธิ์ของการเปลี่ยนแปลงมากกว่าตัวเลือกทั้งหมดของxixix_i's ในช่วง[0,c][0,c][0,c]? ค่าสูงสุดที่ฉันสามารถหาได้สำหรับσxx¯σxx¯\frac{\sigma_x}{\bar{x}}คือn−1−−−−−√n−1\sqrt{n-1} ซึ่งทำได้เมื่อn−1n−1n-1ของxixix_iมีค่า000และส่วนที่เหลือ (นอก)xixix_i มีค่าccc, ให้ แต่นี่ไม่ได้ขึ้นอยู่กับcเลยและฉันสงสัยว่าถ้าค่าที่มากขึ้นอาจขึ้นอยู่กับทั้งnและcสามารถทำได้x¯=cn, 1n∑x2i=c2n⇒σx=c2n−c2n2−−−−−−−√=cnn−1−−−−−√.x¯=cn, 1n∑xi2=c2n⇒σx=c2n−c2n2=cnn−1.\bar{x} = …

3
การวิเคราะห์องค์ประกอบหลัก“ ย้อนหลัง”: อธิบายความแปรปรวนของข้อมูลโดยชุดค่าผสมเชิงเส้นที่กำหนดของตัวแปรอย่างไร
ผมได้ดำเนินการวิเคราะห์องค์ประกอบหลักหกตัวแปร, B , C , D , EและF ถ้าฉันเข้าใจอย่างถูกต้อง PC1 ที่ไม่ได้ทำการบอกจะบอกสิ่งที่การรวมกันเชิงเส้นของตัวแปรเหล่านี้อธิบาย / อธิบายความแปรปรวนมากที่สุดในข้อมูลและ PC2 บอกฉันว่าการรวมกันเชิงเส้นของตัวแปรเหล่านี้จะอธิบายความแปรปรวนมากที่สุดต่อไปของข้อมูลAABBCCDDEEFF ฉันแค่อยากรู้อยากเห็น - มีวิธีการทำ "ย้อนกลับ" นี้หรือไม่? สมมติว่าฉันเลือกชุดค่าผสมเชิงเส้นของตัวแปรเหล่านี้เช่นA + 2 B + 5 CA+2B+5CA+2B+5Cฉันจะคำนวณความแปรปรวนของข้อมูลที่อธิบายได้หรือไม่

4
กำลังคำนวณขนาดตัวอย่างที่ต้องการความแม่นยำของการประมาณค่าความแปรปรวน?
พื้นหลัง ฉันมีตัวแปรที่มีการแจกแจงที่ไม่รู้จัก ฉันมีตัวอย่าง 500 ตัวอย่าง แต่ฉันต้องการแสดงความแม่นยำที่ฉันสามารถคำนวณความแปรปรวนได้เช่นเพื่อยืนยันว่าขนาดตัวอย่าง 500 เพียงพอ ฉันสนใจยังอยู่ในรู้ขนาดของกลุ่มตัวอย่างขั้นต่ำที่จะต้องประเมินความแปรปรวนที่มีความแม่นยำของ\%X%X%X\% คำถาม ฉันจะคำนวณได้อย่างไร ความแม่นยำของการประมาณค่าความแปรปรวนของฉันมีขนาดตัวอย่างเป็นหรือไม่ ของ ?n=500n=500n=500n=Nn=Nn=N ฉันจะคำนวณจำนวนตัวอย่างขั้นต่ำที่จำเป็นในการประมาณค่าความแปรปรวนด้วยความแม่นยำอย่างไรXXX ตัวอย่าง รูปที่ 1 การประมาณความหนาแน่นของพารามิเตอร์อ้างอิงจาก 500 ตัวอย่าง รูปที่ 2นี่คือพล็อตของขนาดตัวอย่างบนแกน x เทียบกับค่าประมาณความแปรปรวนบนแกน y ที่ฉันคำนวณโดยใช้ชุดย่อยจากตัวอย่าง 500 ความคิดคือการประมาณจะมาบรรจบกับความแปรปรวนจริงเมื่อ n เพิ่มขึ้น . อย่างไรก็ตามการประมาณการไม่ถูกต้องเนื่องจากตัวอย่างที่ใช้ในการประมาณความแปรปรวนสำหรับไม่ได้เป็นอิสระจากกันหรือตัวอย่างที่ใช้ในการคำนวณความแปรปรวนที่n ∈ [ 20 , 40 , 80 ]n∈[10,125,250,500]n∈[10,125,250,500]n \in [10,125,250,500]n∈[20,40,80]n∈[20,40,80]n\in [20,40,80]

5
การวัด“ ความแปรปรวน” จากเมทริกซ์ความแปรปรวนร่วม?
หากข้อมูลเป็น 1d ความแปรปรวนจะแสดงขอบเขตที่จุดข้อมูลแตกต่างกัน หากข้อมูลเป็นหลายมิติเราจะได้เมทริกซ์ความแปรปรวนร่วม มีการวัดที่ให้จำนวนจุดข้อมูลแตกต่างกันโดยทั่วไปสำหรับข้อมูลหลายมิติหรือไม่? ฉันรู้สึกว่าอาจมีวิธีแก้ไขมากมายอยู่แล้ว แต่ฉันไม่แน่ใจว่าคำที่ถูกต้องที่จะใช้ในการค้นหาพวกเขา บางทีฉันอาจทำบางอย่างเช่นการเพิ่มค่าลักษณะเฉพาะของเมทริกซ์ความแปรปรวนร่วมได้, นั่นฟังดูสมเหตุสมผลหรือไม่?

2
ทำไมค่าเบี่ยงเบนมาตรฐานถูกกำหนดเป็น sqrt ของความแปรปรวนและไม่เป็น sqrt ของผลรวมของกำลังสองเหนือ N
วันนี้ฉันสอนชั้นสถิติเบื้องต้นและมีนักเรียนคนหนึ่งถามคำถามซึ่งฉันได้เรียบเรียงใหม่ที่นี่: "ทำไมค่าเบี่ยงเบนมาตรฐานที่กำหนดเป็น sqrt ของความแปรปรวนและไม่ใช่ผลรวมของสี่เหลี่ยมจัตุรัสเหนือ N" เรากำหนดความแปรปรวนประชากร: σ2=1N∑(xi−μ)2σ2=1N∑(xi−μ)2\sigma^2=\frac{1}{N}\sum{(x_i-\mu)^2} และค่าเบี่ยงเบนมาตรฐาน: σ=σ2−−√=1N√∑(xi−μ)2−−−−−−−−−−√σ=σ2=1N∑(xi−μ)2\sigma=\sqrt{\sigma^2}=\frac{1}{\sqrt{N}}\sqrt{\sum{(x_i-\mu)^2}} 2 ในความหมายที่เราจะได้มอบให้σσ\sigmaคือว่ามันจะช่วยให้ค่าเบี่ยงเบนเฉลี่ยของหน่วยในประชากรจากค่าเฉลี่ยของประชากรXXXX อย่างไรก็ตามในคำจำกัดความของ sd เราหาร sqrt ของผลรวมของกำลังสองผ่านN−−√N\sqrt{N} . คำถามที่นักเรียนยกคือทำไมเราไม่หาร sqrt ของ sume of squares โดยNNNแทน ดังนั้นเรามาถึงสูตรการแข่งขัน: σnew=1N∑(xi−μ)2−−−−−−−−−−√.σnew=1N∑(xi−μ)2.\sigma_{new}=\frac{1}{N}\sqrt{\sum{(x_i-\mu)^2}}.นักเรียนให้เหตุผลว่าสูตรนี้ดูเหมือนว่าส่วนเบี่ยงเบน "เฉลี่ย" มากกว่าค่าเฉลี่ยเมื่อหารด้วยN−−√N\sqrt{N}ในขณะที่σσσ\sigma ฉันคิดว่าคำถามนี้ไม่ได้โง่ ฉันต้องการที่จะให้คำตอบกับนักเรียนที่ไปไกลกว่าที่บอกว่า sd หมายถึง sqrt ของความแปรปรวนซึ่งเป็นค่าเบี่ยงเบนมาตรฐานกำลังสอง ทำไมนักเรียนถึงใช้สูตรที่ถูกต้องและไม่ทำตามความคิดของเธอ? คำถามนี้เกี่ยวข้องกับด้ายเก่าและคำตอบที่ให้ไว้ที่นี่ คำตอบมีสามทิศทาง: σσ\sigmaคือค่าเบี่ยงเบน root-Mean-squared (RMS) ไม่ใช่ส่วนเบี่ยงเบน "ทั่วไป" จากค่าเฉลี่ย (เช่นσnewσnew\sigma_{new} ) ดังนั้นจึงถูกกำหนดแตกต่างกัน มันมีคุณสมบัติทางคณิตศาสตร์ที่ดี นอกจากนี้ sqrt จะนำ …

2
การกระจายก่อนหน้านี้สามารถ / ควรใช้สำหรับความแปรปรวนในตัวแบบเบย์เอซันแบบลำดับชั้นเมื่อความแปรปรวนเฉลี่ยมีความน่าสนใจอย่างไร
ในกระดาษของเขาอ้างกันอย่างแพร่หลายกระจายก่อนหน้าสำหรับพารามิเตอร์ความแปรปรวนในรูปแบบลำดับชั้น (916 การอ้างอิงจนถึง Google Scholar) Gelman เสนอว่าการแจกแจงก่อนหน้าแบบไม่ให้ข้อมูลที่ดีสำหรับความแปรปรวนในแบบจำลอง Bayesian แบบลำดับชั้นคือการกระจายแบบสม่ำเสมอและการกระจายครึ่งหนึ่ง หากฉันเข้าใจสิ่งที่ถูกต้องสิ่งนี้จะทำงานได้ดีเมื่อเป็นพารามิเตอร์ตำแหน่ง (เช่นค่าเฉลี่ย) เป็นสิ่งที่น่าสนใจหลัก บางครั้งพารามิเตอร์ความแปรปรวนเป็นที่สนใจหลักอย่างไรก็ตามเช่นเมื่อวิเคราะห์ข้อมูลการตอบสนองของมนุษย์จากงานเวลาหมายถึงความแปรปรวนของเวลามักจะวัดที่น่าสนใจ ในกรณีเหล่านั้นมันไม่ชัดเจนสำหรับฉันว่าความสามารถแปรผันตามลำดับชั้นได้อย่างไรเช่นการแจกแจงแบบเดียวกันเนื่องจากฉันหลังจากการวิเคราะห์ต้องการได้รับความน่าเชื่อถือของความแปรปรวนเฉลี่ยทั้งในระดับผู้เข้าร่วมและในระดับกลุ่ม คำถามของฉันคือ: การกระจายแบบใดที่แนะนำเมื่อสร้างแบบจำลองแบบเบย์แบบลำดับชั้นเมื่อความแปรปรวนของข้อมูลเป็นความสนใจหลัก ฉันรู้ว่าการแจกแจงแกมมาสามารถแก้ไขได้โดยระบุค่าเฉลี่ยและ SD ยกตัวอย่างเช่นแบบลำดับชั้นด้านล่างเป็นจากหนังสือ Kruschke ของการทำเบส์วิเคราะห์ข้อมูล แต่ Gelman สรุปปัญหาบางอย่างกับการกระจายแกมม่าในบทความของเขาและฉันจะขอบคุณสำหรับคำแนะนำทางเลือกโดยเฉพาะอย่างยิ่งทางเลือกที่ไม่ยากที่จะทำงานใน BUGS / JAGS

3
เมื่อใดที่เหมาะสมที่จะรายงานความแปรปรวนแทนที่จะเป็นค่าเบี่ยงเบนมาตรฐาน
ฉันได้ทำการวิเคราะห์ที่ฉันสร้างแบบจำลองส่วนประกอบความแปรปรวนที่แตกต่างกัน เมื่อรายงานผลลัพธ์ในตารางจะมีความรัดกุมมากกว่าการรายงานส่วนเบี่ยงเบนมาตรฐานแทนที่จะเป็นความแปรปรวน ดังนั้นสิ่งนี้นำมาสู่คำถาม - มีเหตุผลที่จะรายงานความแปรปรวนแทนที่จะเบี่ยงเบนมาตรฐานหรือไม่? มันเหมาะสมกว่าไหมที่จะรายงานอีกตัวหนึ่ง?

2
เส้นตรงของความแปรปรวน
ฉันคิดว่าสองสูตรต่อไปนี้เป็นจริง: Var(aX)=a2Var(X)Var(aX)=a2Var(X) \mathrm{Var}(aX)=a^2 \mathrm{Var}(X) ในขณะที่ a เป็นค่าคงตัว Var(X+Y)=Var(X)+Var(Y)Var(X+Y)=Var(X)+Var(Y) \mathrm{Var}(X + Y)=\mathrm{Var}(X)+\mathrm{Var}(Y) ถ้าXXX ,YYYเป็นอิสระ อย่างไรก็ตามฉันไม่แน่ใจว่ามีอะไรผิดปกติด้านล่าง: Var(2X)=Var(X+X)=Var(X)+Var(X)Var(2X)=Var(X+X)=Var(X)+Var(X)\mathrm{Var}(2X) = \mathrm{Var}(X+X) = \mathrm{Var}(X) + \mathrm{Var}(X) ซึ่งไม่เท่ากับ22Var(X)22Var(X)2^2 \mathrm{Var}(X)คือ4Var(X)4Var(X)4\mathrm{Var}(X) ) ถ้ามันจะสันนิษฐานว่าXXXคือตัวอย่างที่นำมาจากประชากรผมคิดว่าเราสามารถสมมติXXXจะเป็นอิสระจากที่อื่น ๆXXX s ดังนั้นเกิดอะไรขึ้นกับความสับสนของฉัน

5
ความแปรปรวนร่วม“ ความจริง” หมายถึงอะไร?
ฉันเป็นคนที่ไม่มีสถิติดังนั้นพวกคุณได้โปรดช่วยฉันที่นี่ด้วย คำถามของฉันมีดังต่อไปนี้: ความแปรปรวนร่วมหมายถึงอะไรจริง ๆ เมื่อฉันมองหาสูตรสำหรับความแปรปรวนแบบรวมในอินเทอร์เน็ตฉันพบวรรณกรรมจำนวนมากที่ใช้สูตรต่อไปนี้ (ตัวอย่างเช่นที่นี่: http://math.tntech.edu/ISR/Mathematical_Statistics/Introduction_to_Statistical_Tests/thispage/newnode19.html ): S2p=S21(n1−1)+S22(n2−1)n1+n2−2Sp2=S12(n1−1)+S22(n2−1)n1+n2−2\begin{equation} \label{eq:stupidpooledvar} \displaystyle S^2_p = \frac{S_1^2 (n_1-1) + S_2^2 (n_2-1)}{n_1 + n_2 - 2} \end{equation} แต่จริง ๆ แล้วมันคำนวณอะไร เพราะเมื่อฉันใช้สูตรนี้ในการคำนวณค่าความแปรปรวนรวมของฉันมันให้คำตอบที่ผิด ตัวอย่างเช่นพิจารณา "ตัวอย่างหลัก" เหล่านี้: 2,2,2,2,2,8,8,8,8,82,2,2,2,2,8,8,8,8,8\begin{equation} \label{eq:parentsample} 2,2,2,2,2,8,8,8,8,8 \end{equation} ความแปรปรวนของกลุ่มตัวอย่างผู้ปกครองนี้เป็นและค่าเฉลี่ยของมันคือˉ x P = 5S2p=10Sp2=10S^2_p=10x¯p=5x¯p=5\bar{x}_p=5 ตอนนี้สมมติว่าฉันแยกตัวอย่างผู้ปกครองนี้ออกเป็นสองตัวอย่างย่อย: ครั้งแรกที่ย่อยตัวอย่างเป็น 2,2,2,2,2 ที่มีค่าเฉลี่ยและแปรปรวนS 2 1 = 0x¯1=2x¯1=2\bar{x}_1=2S21=0S12=0S^2_1=0 ที่สองย่อยตัวอย่างเป็น 8,8,8,8,8 ที่มีค่าเฉลี่ยและแปรปรวนS …
15 variance  mean  pooling 

5
การเปลี่ยนแปลงทางสถิติในสองรูปแบบที่มีคุณสมบัติตามสูตร 1
ฉันเพิ่งอ่านบทความ BBC นี้เกี่ยวกับรูปแบบที่เหมาะสมในสูตร 1 ผู้จัดงานต้องการทำให้การคาดการณ์มีคุณสมบัติน้อยลงเช่นเพื่อเพิ่มความแปรปรวนทางสถิติในผลลัพธ์ การรวบรวมรายละเอียดที่ไม่เกี่ยวข้องในตอนนี้ผู้ขับขี่ได้รับการจัดอันดับจากรอบที่ดีที่สุดจากสองรอบ นายฌองท็อดท์หัวหน้า F1 คนหนึ่งเสนอว่าการจัดอันดับผู้ขับขี่โดยเฉลี่ยสองรอบจะเพิ่มความแปรปรวนทางสถิติเนื่องจากไดรเวอร์อาจมีความผิดพลาดเป็นสองเท่า แหล่งข้อมูลอื่นแย้งว่าค่าเฉลี่ยใด ๆ ย่อมลดความผันแปรทางสถิติ เราสามารถพูดได้ว่าใครถูกภายใต้สมมติฐานที่สมเหตุสมผล? ฉันคิดว่ามันเดือดลงกับความแปรปรวนแบบสัมพัทธ์ของค่าเฉลี่ย( x , y)ค่าเฉลี่ย(x,Y)\text{mean}(x,y)เทียบกับโดยที่และเป็นตัวแปรสุ่มที่เป็นตัวแทนของสองรอบตัก?x yขั้นต่ำ( x , y)นาที(x,Y)\text{min}(x,y)xxxYYy
15 variance 

2
คำถามเกี่ยวกับการแลกเปลี่ยนอคติแปรปรวน
ฉันพยายามที่จะเข้าใจการแลกเปลี่ยนอคติความแปรปรวนความสัมพันธ์ระหว่างอคติของตัวประมาณและอคติของตัวแบบและความสัมพันธ์ระหว่างความแปรปรวนของตัวประมาณและความแปรปรวนของตัวแบบ ฉันมาถึงข้อสรุปเหล่านี้: เรามีแนวโน้มที่จะทำให้ข้อมูลมีค่ามากเกินไปเมื่อเราละเลยอคติของตัวประมาณนั่นคือเมื่อเราตั้งเป้าหมายที่จะลดอคติของแบบจำลองให้น้อยที่สุดโดยละเลยความแปรปรวนของแบบจำลอง (กล่าวอีกนัยหนึ่งคือเรามุ่งที่จะลดความแปรปรวนของ ความเอนเอียงของตัวประมาณเช่นกัน) ในทางกลับกันเรามีแนวโน้มที่จะลดข้อมูลเมื่อเราเพิกเฉยความแปรปรวนของตัวประมาณนั่นคือเมื่อเรามุ่งที่จะลดความแปรปรวนของตัวแบบที่ละเลยความเอนเอียงของแบบจำลอง (กล่าวอีกนัยหนึ่งคือเรามุ่งที่จะลดอคติของ ตัวประมาณโดยไม่พิจารณาความแปรปรวนของตัวประมาณด้วย) ข้อสรุปของฉันถูกต้องหรือไม่?

3
การทำนายความแปรปรวนของข้อมูล heteroscedastic
ฉันพยายามทำการถดถอยกับข้อมูลแบบเฮเทอโรเซสติกซึ่งฉันพยายามทำนายความแปรปรวนข้อผิดพลาดรวมถึงค่าเฉลี่ยในแง่ของตัวแบบเชิงเส้น บางสิ่งเช่นนี้ y(x,t)ξ(x,t)y¯(x,t)σ(x,t)=y¯(x,t)+ξ(x,t),∼N(0,σ(x,t)),=y0+ax+bt,=σ0+cx+dt.y(x,t)=y¯(x,t)+ξ(x,t),ξ(x,t)∼N(0,σ(x,t)),y¯(x,t)=y0+ax+bt,σ(x,t)=σ0+cx+dt.\begin{align}\\ y\left(x,t\right) &= \bar{y}\left(x,t\right)+\xi\left(x,t\right),\\ \xi\left(x,t\right) &\sim N\left(0,\sigma\left(x,t\right)\right),\\ \bar{y}\left(x,t\right) &= y_{0}+ax+bt,\\ \sigma\left(x,t\right) &= \sigma_{0}+cx+dt. \end{align} ในคำพูดของข้อมูลที่ประกอบด้วยวัดซ้ำของที่ค่าต่างๆของxและเสื้อ ฉันถือว่าการวัดเหล่านี้ประกอบด้วยค่า "จริง" หมายถึงค่าˉ y ( x , t )ซึ่งเป็นฟังก์ชันเชิงเส้นของxและtพร้อมกับเสียงเกาส์แบบเติมadd ( x , t )ซึ่งค่าเบี่ยงเบนมาตรฐาน (หรือความแปรปรวนฉันไม่ได้ ตัดสินใจ) นอกจากนี้ยังขึ้นอยู่กับเส้นตรงกับx ,เสื้อ (ฉันอาจอนุญาตการพึ่งพาที่ซับซ้อนมากขึ้นในxและy(x,t)y(x,t)y(x,t)xxxttty¯(x,t)y¯(x,t)\bar{y}(x,t)xxxtttξ(x,t)ξ(x,t)\xi(x,t)x,tx,เสื้อx,txxx - ไม่มีแรงกระตุ้นเชิงทฤษฎีที่แข็งแกร่งสำหรับรูปแบบเชิงเส้น - แต่ฉันไม่อยากจะเข้าใจสิ่งต่าง ๆ ในตอนนี้)ttt ฉันรู้ว่าคำค้นหาที่นี่คือ "heteroscedasticity" แต่ทั้งหมดที่ฉันสามารถค้นหาได้คือการอภิปรายเกี่ยวกับวิธีการลด / ลบคำศัพท์เพื่อทำนายดีขึ้นแต่ไม่มีอะไรในแง่ของการพยายามทำนายσในแง่ของ ตัวแปรอิสระ. ฉันต้องการประมาณy 0 …

6
วิธีการตรวจสอบความคิดเห็นของผู้ใช้โพลาไรซ์ (ระดับดาวสูงและต่ำ)
หากฉันมีระบบการจัดอันดับดาวที่ผู้ใช้สามารถแสดงความพึงพอใจต่อผลิตภัณฑ์หรือรายการได้ฉันจะตรวจสอบสถิติได้อย่างไรหากคะแนนโหวต "แบ่ง" สูง ความหมายแม้ว่าค่าเฉลี่ยคือ 3 จาก 5 สำหรับผลิตภัณฑ์ที่กำหนดฉันจะตรวจสอบได้อย่างไรว่านั่นคือการแบ่ง 1-5 เมื่อเทียบกับฉันทามติ 3 โดยใช้ข้อมูล (ไม่มีวิธีกราฟิก)

1
สัญชาตญาณของตัวอย่างที่แลกเปลี่ยนได้ภายใต้สมมติฐานว่างคืออะไร
การทดสอบการเปลี่ยนรูป (เรียกอีกอย่างว่าการทดสอบแบบสุ่มการทดสอบแบบสุ่มอีกครั้งหรือการทดสอบที่แน่นอน) มีประโยชน์มากและมีประโยชน์เมื่อสมมติฐานของการแจกแจงปกติที่ต้องการโดยตัวอย่างเช่นt-testไม่พบและเมื่อการเปลี่ยนแปลงของค่าโดยการจัดอันดับ การทดสอบแบบไม่มีพารามิเตอร์Mann-Whitney-U-testจะนำไปสู่การสูญเสียข้อมูลมากขึ้น อย่างไรก็ตามไม่ควรมองข้ามสมมุติฐานข้อเดียวและข้อเดียวเพียงข้อเดียวเมื่อใช้การทดสอบชนิดนี้คือข้อสมมติฐานของความสามารถแลกเปลี่ยนได้ของตัวอย่างภายใต้สมมติฐานว่าง เป็นที่น่าสังเกตว่าวิธีการแบบนี้สามารถใช้ได้เมื่อมีตัวอย่างมากกว่าสองตัวอย่างเช่นสิ่งที่นำไปใช้ในcoinแพ็คเกจ R คุณช่วยกรุณาใช้ภาษาที่เป็นรูปเป็นร่างหรือปรีชาเชิงแนวคิดในภาษาอังกฤษธรรมดาเพื่อแสดงสมมติฐานนี้ได้หรือไม่? นี่จะมีประโยชน์มากในการอธิบายปัญหาที่ถูกมองข้ามในหมู่ผู้ที่ไม่ใช่นักสถิติเช่นฉัน หมายเหตุ: จะเป็นประโยชน์อย่างมากหากพูดถึงกรณีที่การใช้การทดสอบการเปลี่ยนแปลงไม่ถือหรือไม่ถูกต้องภายใต้สมมติฐานเดียวกัน ปรับปรุง: สมมติว่าฉันมี 50 วิชาที่รวบรวมจากคลินิกท้องถิ่นในเขตของฉันโดยการสุ่ม พวกเขาถูกสุ่มให้รับยาหรือยาหลอกในอัตราส่วน 1: 1 พวกเขาทั้งหมดถูกวัดสำหรับ Paramerter 1 Par1ที่ V1 (พื้นฐาน), V2 (3 เดือนต่อมา) และ V3 (1 ปีต่อมา) วิชาทั้งหมด 50 กลุ่มสามารถแบ่งเป็น 2 กลุ่มตามคุณสมบัติ A; ค่าบวก = 20 และค่าลบ = 30 นอกจากนี้ยังสามารถจัดกลุ่มย่อยได้อีก 2 กลุ่มตามคุณลักษณะ B; B positive = …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.