คำถามติดแท็ก normal-distribution

การแจกแจงแบบปกติหรือแบบเกาส์เซียนนั้นมีฟังก์ชั่นความหนาแน่นซึ่งเป็นเส้นโค้งรูประฆังแบบสมมาตร มันเป็นหนึ่งในการแจกแจงที่สำคัญที่สุดในสถิติ ใช้แท็ก [normality] เพื่อสอบถามเกี่ยวกับการทดสอบหา normality

3
ความสัมพันธ์ระหว่างการแจกแจงแกมม่ากับการแจกแจงแบบปกติ
ฉันเพิ่งพบว่าจำเป็นต้องได้รับ PDF สำหรับสแควร์ของตัวแปรสุ่มปกติที่มีค่าเฉลี่ย 0 ไม่ว่าด้วยเหตุผลใดก็ตามฉันเลือกที่จะไม่ทำให้ค่าความแปรปรวนเป็นปกติก่อน ถ้าฉันทำอย่างถูกต้องแล้วไฟล์ PDF นี้เป็นดังนี้: N2(x;σ2)=1σ2π−−√x−−√e−x2σ2N2(x;σ2)=1σ2πxe−x2σ2 N^2(x; \sigma^2) = \frac{1}{\sigma \sqrt{2 \pi} \sqrt{x}} e^{\frac{-x}{2\sigma^2}} ฉันสังเกตเห็นว่านี่เป็นความจริงเพียงแค่การกระจายตัวของแกมม่า: N2(x;σ2)=Gamma(x;12,2σ2)N2(x;σ2)=Gamma⁡(x;12,2σ2) N^2(x; \sigma^2) = \operatorname{Gamma}(x; \frac{1}{2}, 2 \sigma^2) และจากข้อเท็จจริงที่ว่าผลรวมของ gammas สองตัว (ที่มีพารามิเตอร์มาตราส่วนเดียวกัน) เท่ากับแกมม่าอีกอันหนึ่งมันก็จะบอกว่าแกมม่านั้นเทียบเท่ากับผลรวมของตัวแปรสุ่มปกติkkkกำลังสอง N2Σ(x;k,σ2)=Gamma(x;k2,2σ2)NΣ2(x;k,σ2)=Gamma⁡(x;k2,2σ2) N^2_\Sigma(x; k, \sigma^2) = \operatorname{Gamma}(x; \frac{k}{2}, 2 \sigma^2) ฉันรู้สึกประหลาดใจเล็กน้อย แม้ว่าฉันจะรู้ว่าการแจกแจงχ2χ2\chi^2 - การกระจายของผลรวมของRVs มาตรฐานแบบธรรมดา - เป็นกรณีพิเศษของแกมม่า, ฉันไม่ได้ตระหนักว่าแกมม่านั้นเป็นเพียงลักษณะทั่วไปที่อนุญาตให้ใช้ผลรวมของตัวแปรสุ่มปกติ ของความแปรปรวนใด ๆ …

5
การประมาณความน่าจะเป็นสูงสุด - ทำไมจึงถูกใช้แม้ว่าจะมีอคติในหลาย ๆ กรณี
การประมาณความเป็นไปได้สูงสุดมักส่งผลให้ตัวประมาณแบบเอนเอียง (เช่นการประมาณค่าความแปรปรวนตัวอย่างนั้นมีความลำเอียงสำหรับการแจกแจงแบบเกาส์) อะไรทำให้เป็นที่นิยมมาก ทำไมมันถูกใช้อย่างมาก? นอกจากนี้สิ่งใดที่ทำให้ดีกว่าวิธีอื่น - วิธีการของช่วงเวลา นอกจากนี้ฉันสังเกตเห็นว่าสำหรับเกาส์เซียนตัวประมาณค่า MLE ที่เรียบง่ายทำให้มันไม่เอนเอียง เหตุใดการปรับขนาดนี้จึงไม่ใช่ขั้นตอนมาตรฐาน ฉันหมายถึง - เพราะเหตุใดหลังจากการคำนวณ MLE จึงไม่ใช่กิจวัตรในการค้นหามาตราส่วนที่จำเป็นเพื่อทำให้ตัวประมาณมีความเป็นกลาง การปฏิบัติมาตรฐานดูเหมือนจะเป็นการคำนวณธรรมดาของการประมาณค่า MLE ยกเว้นแน่นอนสำหรับกรณี Gaussian ที่รู้จักกันดีซึ่งเป็นที่รู้จักกันดีว่าปัจจัยการปรับสเกล

3
ช่วงความเชื่อมั่นสำหรับความแปรปรวนที่กำหนดหนึ่งการสังเกต
นี่เป็นปัญหาจาก "7th Kolmogorov Student Olympiad in The Probability Theory Theory": เมื่อทำการสังเกตจาก aโดยไม่ทราบพารามิเตอร์ทั้งสองให้ช่วงความมั่นใจสำหรับด้วยระดับความมั่นใจอย่างน้อย 99%XXXNormal(μ,σ2)Normal⁡(μ,σ2)\operatorname{Normal}(\mu,\sigma^2)σ2σ2\sigma^2 สำหรับฉันแล้วมันน่าจะเป็นไปไม่ได้ ฉันมีวิธีแก้ปัญหา แต่ยังไม่ได้อ่าน ความคิดใด ๆ ฉันจะโพสต์โซลูชันในอีกสองสามวัน [การแก้ไขการติดตาม: การแก้ปัญหาอย่างเป็นทางการที่โพสต์ด้านล่าง วิธีแก้ปัญหาของ Cardinal นั้นยาวกว่า แต่ให้ช่วงความมั่นใจที่ดีกว่า ขอบคุณ Max และ Glen_b สำหรับอินพุตของพวกเขา]

4
ชาปิโร่ - วิลค์เป็นแบบทดสอบปกติที่ดีที่สุดหรือไม่? ทำไมมันจะดีกว่าการทดสอบอื่น ๆ เช่น Anderson-Darling
ฉันได้อ่านบางแห่งในวรรณคดีว่าการทดสอบ Shapiro – Wilk นั้นถือว่าเป็นการทดสอบเชิงบรรทัดฐานที่ดีที่สุดเพราะสำหรับระดับนัยสำคัญที่กำหนดความน่าจะเป็นที่จะปฏิเสธสมมติฐานว่างถ้ามันเป็นเท็จมากกว่าในกรณีอื่น ๆ การทดสอบปกติαα\alpha คุณช่วยอธิบายให้ฉันหน่อยได้มั้ยถ้าใช้วิธีการทางคณิตศาสตร์เทียบกับการทดสอบปกติอื่น ๆ (พูดแบบทดสอบ Anderson – Darling)

1
ช่วงการทำนายการถดถอยเชิงเส้น
หากการประมาณเชิงเส้นที่ดีที่สุด (โดยใช้กำลังสองน้อยที่สุด) ของจุดข้อมูลของฉันคือเส้นฉันจะคำนวณข้อผิดพลาดการประมาณได้อย่างไร ถ้าฉันคำนวณค่าเบี่ยงเบนมาตรฐานของความแตกต่างระหว่างการสังเกตและการคาดการณ์ฉันจะพูดในภายหลังว่าค่าจริง (แต่ไม่ได้สังเกต)เป็นของช่วง ( ) ที่มีความน่าจะเป็น ~ 68% สมมติว่ามีการแจกแจงแบบปกติหรือไม่?e i = r e a l ( x i ) - ( m x i + b ) y r = r e a l ( x 0 ) [ y p - σ , y p + σ …

3
การแจกจ่ายนี้มีชื่อหรือไม่?
มันเกิดขึ้นกับฉันวันนี้ว่าการกระจาย อาจถูกมองว่าเป็นการประนีประนอมระหว่าง Gaussian และ Laplace การแจกแจงสำหรับและการแจกจ่ายดังกล่าวมีชื่อหรือไม่? และมันมีนิพจน์สำหรับค่าคงที่การทำให้เป็นมาตรฐานหรือไม่? แคลคูลัสทำให้ฉันตกเพราะฉันไม่รู้ว่าจะเริ่มแก้หาCในอินทิกรัล 1 = C \ cdot \ int _ {- \ infty} ^ \ infty \ exp \ left (- \ frac {| x- \ mu | ^ p} {\ beta} \ right) dx f(x)∝exp(−|x−μ|pβ)f(x)∝exp⁡(−|x−μ|pβ) f(x)\propto\exp\left(-\frac{|x-\mu|^p}{\beta}\right) x∈R,p∈[1,2]x∈R,p∈[1,2]x\in\mathbb{R}, p\in[1,2]β>0.β>0.\beta>0.CCC1 = C⋅ ∫∞- ∞ประสบการณ์( - …

2
ฉันควรใช้ตัวอักษร "N" ใน "การแจกแจงแบบปกติ" ในภาษาอังกฤษแบบอังกฤษหรือไม่
คำถามนี้เป็นฟิลด์ซ้ายเล็กน้อย แต่ฉันคิดว่าชุมชนที่นี่อาจมีมุมมองที่แข็งแกร่งในเรื่อง! ฉันกำลังเขียนวิทยานิพนธ์เอกของฉัน อย่างต่อเนื่องเมื่อพูดถึงปริมาณที่เกี่ยวข้องอย่างเป็นทางการกับการแจกแจงแบบเกาส์เซียนฉันได้ใช้ "N" ใน "ปกติ" เพื่ออ้างอิงถึงพวกมัน ตัวอย่างเช่น "[... ภายใต้สถานการณ์เช่นนี้] การกระจายที่ได้นั้นไม่ปกติ แต่อธิบายโดย [... ]" หัวหน้างานของฉันได้อ่านบทที่เกี่ยวข้องและแทนที่พวกเขาทุกคนด้วยตัวพิมพ์เล็ก 'n' ฉันไม่สามารถหาวรรณกรรมที่ชัดเจนใด ๆ ในเรื่อง - สปริงเกอร์เห็นได้ชัดว่าต้องการชื่อทุนอย่างถูกต้องและเป็นไปตามอีกครับสุ่มบนอินเทอร์เน็ตพะวงชื่อกระจายเป็นความคิดที่ดี การขาดแนวทางสไตล์ที่ชัดเจนสำหรับวิทยานิพนธ์ของฉันฉันคิดว่าฉันจะหันไปหาชุมชนผู้เชี่ยวชาญ - สิ่งที่ทำกันทั่วไปและทำไม

1
ทำไมการกระจายตัวตัวอย่างของความแปรปรวนเป็นการแจกแจงแบบไคสแควร์
คำสั่ง การแจกแจงตัวอย่างของความแปรปรวนตัวอย่างคือการแจกแจงแบบไคสแควร์ที่มีระดับความเป็นอิสระเท่ากับโดยที่คือขนาดตัวอย่าง (เนื่องจากตัวแปรสุ่มที่น่าสนใจกระจายอยู่ตามปกติ)n−1n−1n-1nnn แหล่ง สัญชาตญาณของฉัน มันค่อนข้างสมเหตุสมผลกับฉัน 1) เพราะการทดสอบไคสแควร์ดูเหมือนผลรวมของสแควร์และ 2) เพราะการแจกแจงแบบไคสแควร์เป็นเพียงผลรวมของการแจกแจงแบบปกติกำลังสอง แต่ถึงกระนั้นฉันไม่เข้าใจมัน คำถาม คำพูดนั้นเป็นจริงหรือไม่? ทำไม?

3
จะตรวจสอบการแจกแจงปกติโดยใช้ Excel สำหรับทำการทดสอบแบบทดสอบได้อย่างไร
ฉันต้องการทราบวิธีการตรวจสอบข้อมูลการตั้งค่าสำหรับภาวะปกติใน Excel เพียงเพื่อตรวจสอบว่ามีความต้องการสำหรับการใช้ t-test ถูกพบ สำหรับหางด้านขวาเหมาะสมหรือไม่ที่จะคำนวณค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานเพิ่ม 1, 2 และ 3 ส่วนเบี่ยงเบนมาตรฐานจากค่าเฉลี่ยเพื่อสร้างช่วงจากนั้นเปรียบเทียบกับค่าปกติปกติ 68/95 / 99.7 สำหรับการกระจายปกติ ฟังก์ชัน norm.dist ใน excel เพื่อทดสอบค่าเบี่ยงเบนมาตรฐานแต่ละรายการ หรือมีวิธีที่ดีกว่าในการทดสอบความเป็นปกติ?

2
การรวมข้อมูลจากการศึกษาหลายครั้งเพื่อประเมินค่าเฉลี่ยและความแปรปรวนของข้อมูลที่กระจายตามปกติ - วิธีเบย์และวิธีการวิเคราะห์เชิงเมตา
ฉันได้รับการตรวจสอบชุดของเอกสารรายงานการสังเกตค่าเฉลี่ยและ SD ของการวัดของแต่ละในกลุ่มตัวอย่างของแต่ละขนาดที่รู้จักกัน n ฉันต้องการคาดเดาที่ดีที่สุดเกี่ยวกับการกระจายตัวของมาตรการเดียวกันในการศึกษาใหม่ที่ฉันกำลังออกแบบและความไม่แน่นอนในการเดานั้น ฉันยินดีที่จะรับX ∼ N ( μ , σ 2 )XXXnnnX∼ N( μ , σ2X~ยังไม่มีข้อความ(μ,σ2X \sim N(\mu, \sigma^2 ความคิดแรกของฉันคือการวิเคราะห์อภิมาน แต่โดยทั่วไปแล้วตัวแบบจะใช้การประมาณจุดและช่วงความมั่นใจที่สอดคล้องกัน แต่ผมอยากจะบอกอะไรบางอย่างเกี่ยวกับการกระจายเต็มรูปแบบของซึ่งในกรณีนี้จะรวมทั้งยังทำให้การคาดเดาเกี่ยวกับความแปรปรวนσ 2 XXXσ2σ2\sigma^2 ฉันได้อ่านเกี่ยวกับวิธีการของ Bayeisan ที่เป็นไปได้ในการประมาณค่าพารามิเตอร์ชุดสมบูรณ์ของการแจกแจงที่กำหนดในแง่ของความรู้ก่อนหน้า โดยทั่วไปแล้วสิ่งนี้เหมาะสมสำหรับฉัน แต่ฉันไม่มีประสบการณ์ในการวิเคราะห์แบบเบย์ นี่เป็นปัญหาที่ค่อนข้างง่ายและตรงไปตรงมาที่จะตัดฟันของฉัน 1) จากปัญหาของฉันวิธีการใดที่เหมาะสมที่สุดและเพราะเหตุใด การวิเคราะห์เมตาดาต้าหรือวิธีการแบบเบย์? 2) ถ้าคุณคิดว่าวิธีการแบบเบย์นั้นดีที่สุดคุณสามารถชี้ให้ฉันเห็นวิธีการที่จะนำไปใช้ (ควรเป็น R) หรือไม่? คำถามที่เกี่ยวข้อง การแก้ไข: ฉันพยายามทำสิ่งนี้ในสิ่งที่ฉันคิดว่าเป็นแบบเบย์เรียบง่าย ดังที่ฉันได้กล่าวไว้ข้างต้นฉันไม่เพียง แต่สนใจค่าเฉลี่ยที่ประมาณแต่ยังรวมถึงความแปรปรวนσ 2ในแง่ของข้อมูลก่อนหน้าเช่นP ( μ , σ …

3
เมทริกซ์ความแปรปรวนแปรปรวนเชิงบวกที่ไม่แน่นอนบอกอะไรฉันได้บ้างเกี่ยวกับข้อมูลของฉัน
ฉันมีการสังเกตหลายตัวแปรหลายครั้งและต้องการประเมินความหนาแน่นของความน่าจะเป็นของตัวแปรทั้งหมด สันนิษฐานว่าเป็นข้อมูลที่กระจายตามปกติ ที่ตัวแปรจำนวนต่ำทุกอย่างทำงานได้ตามที่คาดหวัง แต่การย้ายไปหาจำนวนที่มากขึ้นส่งผลให้เมทริกซ์ความแปรปรวนร่วมแปรเปลี่ยนเป็นค่าบวกแน่นอน ฉันได้ลดปัญหาใน Matlab ไปที่: load raw_data.mat; % matrix number-of-values x number of variables Sigma = cov(data); [R,err] = cholcov(Sigma, 0); % Test for pos-def done in mvnpdf. หากข้อผิดพลาด> 0 แสดงว่า Sigma ไม่ใช่ค่าบวกแน่นอน มีอะไรที่ฉันสามารถทำได้เพื่อประเมินข้อมูลการทดลองของฉันในระดับที่สูงขึ้นหรือไม่ มันบอกฉันว่ามีอะไรที่เป็นประโยชน์เกี่ยวกับข้อมูลของฉันหรือไม่? ฉันค่อนข้างเป็นผู้เริ่มต้นในพื้นที่นี้ดังนั้นจึงขออภัยถ้าฉันพลาดบางสิ่งที่ชัดเจน

3
การแจกแจงความแตกต่างระหว่างการแจกแจงสองแบบปกติ
ฉันมีฟังก์ชันความหนาแน่นของความน่าจะเป็นสองแบบของการแจกแจงแบบปกติ: f1(x1|μ1,σ1)=1σ12π−−√e−(x−μ1)22σ21f1(x1|μ1,σ1)=1σ12πe−(x−μ1)22σ12f_1(x_1 \; | \; \mu_1, \sigma_1) = \frac{1}{\sigma_1\sqrt{2\pi} } \; e^{ -\frac{(x-\mu_1)^2}{2\sigma_1^2} } และ f2(x2|μ2,σ2)=1σ22π−−√e−(x−μ2)22σ22f2(x2|μ2,σ2)=1σ22πe−(x−μ2)22σ22f_2(x_2 \; | \; \mu_2, \sigma_2) = \frac{1}{\sigma_2\sqrt{2\pi} } \; e^{ -\frac{(x-\mu_2)^2}{2\sigma_2^2} } ฉันกำลังมองหาฟังก์ชั่นความหนาแน่นของความน่าจะเป็นของการแยกระหว่างx1x1x_1และx2x2x_2 2 ฉันคิดว่านั่นหมายถึงฉันกำลังมองหาฟังก์ชันความหนาแน่นของความน่าจะเป็นของ|x1−x2||x1−x2||x_1 - x_2|. ถูกต้องหรือไม่ ฉันจะหาสิ่งนั้นได้อย่างไร

2
ทฤษฎี Extreme Value - แสดง: Normal ถึง Gumbel
จำนวนสูงสุดของ IID Standardnormals ลู่กับมาตรฐานกัมเบลจัดจำหน่ายตามมากราคาทฤษฎีX1,…,Xn.∼X1,…,Xn.∼X_1,\dots,X_n. \sim เราจะแสดงสิ่งนั้นได้อย่างไร เรามี P(maxXi≤x)=P(X1≤x,…,Xn≤x)=P(X1≤x)⋯P(Xn≤x)=F(x)nP(maxXi≤x)=P(X1≤x,…,Xn≤x)=P(X1≤x)⋯P(Xn≤x)=F(x)nP(\max X_i \leq x) = P(X_1 \leq x, \dots, X_n \leq x) = P(X_1 \leq x) \cdots P(X_n \leq x) = F(x)^n เราจำเป็นต้องค้นหา / เลือกan>0,bn∈Ran>0,bn∈Ra_n>0,b_n\in\mathbb{R}ลำดับของค่าคงที่เช่น: F(anx+bn)n→n→∞G(x)=e−exp(−x)F(anx+bn)n→n→∞G(x)=e−exp⁡(−x)F\left(a_n x+b_n\right)^n\rightarrow^{n\rightarrow\infty} G(x) = e^{-\exp(-x)} คุณสามารถแก้ไขหรือค้นหามันในวรรณคดี? มีบางตัวอย่างหน้า 6/71แต่ไม่ใช่สำหรับกรณีปกติ: Φ(anx+bn)n=(12π−−√∫anx+bn−∞e−y22dy)n→e−exp(−x)Φ(anx+bn)n=(12π∫−∞anx+bne−y22dy)n→e−exp⁡(−x)\Phi\left(a_n x+b_n\right)^n=\left(\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{a_n x+b_n} e^{-\frac{y^2}{2}}dy\right)^n\rightarrow e^{-\exp(-x)}

1
กระบวนการ Gaussian Wavelet-Domain: ความแปรปรวนร่วมคืออะไร?
ฉันได้อ่านMaraun et al , "กระบวนการ Gaussian Nonstationary ในโดเมนเวฟเล็ต: การสังเคราะห์, การประมาณค่าและการทดสอบที่สำคัญ" (2007) ซึ่งกำหนดคลาสของ GP ที่ไม่คงที่ซึ่งสามารถระบุได้โดยตัวคูณในโดเมนเวฟเล็ต การตระหนักถึงหนึ่งใน GP ดังกล่าวคือ: ที่เป็นเสียงสีขาว,คือการแปลงเวฟเล็ตต่อเนื่องที่เกี่ยวข้องกับ wavelet ,เป็นตัวคูณ (kinda เช่นค่าสัมประสิทธิ์ฟูริเยร์) ที่มีขนาดและเวลาและเป็นผกผันแปลงเวฟเล็ตกับการฟื้นฟูเวฟชั่วโมงη ( t ) W g g m ( b , a ) a b M hชมs ( t ) = Mชั่วโมงm ( b , a ) Wก.η( …

5
เหตุใดเราจึงใช้สูตรเบี่ยงเบนมาตรฐานแบบเอนเอียงและทำให้เข้าใจผิดสำหรับ
มันค่อนข้างน่าตกใจสำหรับฉันในครั้งแรกที่ฉันทำการจำลองแบบมอนติคาร์โลและพบว่าค่าเฉลี่ยของส่วนเบี่ยงเบนมาตรฐาน100100100ค่าจาก100100100ตัวอย่างทั้งหมดมีขนาดตัวอย่างเพียงn=2n=2n=2ซึ่งพิสูจน์ได้ว่าน้อยกว่ามาก กว่าคือค่าเฉลี่ย2π−−√2π \sqrt{\frac{2}{\pi }} ,σσ\sigmaใช้สำหรับสร้างประชากร อย่างไรก็ตามนี่เป็นที่รู้จักกันดีหากไม่ค่อยมีใครจำได้และฉันก็ไม่รู้เหมือนกันหรือฉันจะไม่ทำแบบจำลอง นี่คือการจำลอง นี่คือตัวอย่างสำหรับการทำนายช่วงความเชื่อมั่น 95% ของN(0,1)N(0,1)N(0,1)โดยใช้ 100, n=2n=2n=2 , ค่าประมาณของSDSD\text{SD} , และE(sn=2)=π2−−√SDE(sn=2)=π2SD\text{E}(s_{n=2})=\sqrt\frac{\pi}{2}\text{SD} SD RAND() RAND() Calc Calc N(0,1) N(0,1) SD E(s) -1.1171 -0.0627 0.7455 0.9344 1.7278 -0.8016 1.7886 2.2417 1.3705 -1.3710 1.9385 2.4295 1.5648 -0.7156 1.6125 2.0209 1.2379 0.4896 0.5291 0.6632 -1.8354 1.0531 2.0425 2.5599 1.0320 …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.