คำถามติดแท็ก normal-distribution

การแจกแจงแบบปกติหรือแบบเกาส์เซียนนั้นมีฟังก์ชั่นความหนาแน่นซึ่งเป็นเส้นโค้งรูประฆังแบบสมมาตร มันเป็นหนึ่งในการแจกแจงที่สำคัญที่สุดในสถิติ ใช้แท็ก [normality] เพื่อสอบถามเกี่ยวกับการทดสอบหา normality

9
เมื่อสอนสถิติให้ใช้ "ปกติ" หรือ "เกาส์เซียน"?
ฉันใช้ "การกระจายแบบเกาส์" เป็นส่วนใหญ่ในหนังสือของฉัน แต่มีคนแนะนำว่าฉันเปลี่ยนเป็น "การกระจายแบบปกติ" ฉันทามติใดที่คำว่าจะใช้สำหรับผู้เริ่มต้น แน่นอนว่าคำทั้งสองนี้เป็นคำพ้องความหมายดังนั้นนี่ไม่ใช่คำถามเกี่ยวกับเนื้อหา แต่เป็นเรื่องที่ใช้กันอย่างแพร่หลาย และแน่นอนฉันใช้ทั้งสองคำ แต่สิ่งที่ควรใช้เป็นส่วนใหญ่?

3
การกระจายระยะทางแบบยุคลิดระหว่างตัวแปรสุ่มแบบกระจายสองตัวคืออะไร?
สมมติว่าคุณจะได้รับวัตถุทั้งสองมีสถานที่ที่แน่นอนไม่เป็นที่รู้จัก แต่จะมีการกระจายไปตามการแจกแจงปรกติกับพารามิเตอร์ที่รู้จักกัน (เช่นและ(วีที)) เราสามารถสันนิษฐานได้ว่าสิ่งเหล่านี้เป็นทั้งบรรทัดฐาน bivariate เช่นตำแหน่งที่ถูกอธิบายโดยการกระจายข้ามพิกัด ( (เช่นและเป็นเวกเตอร์ที่มีพิกัดคาดหวังสำหรับและตามลำดับ) เราจะถือว่าวัตถุนั้นเป็นอิสระa ∼ N( m , s )a~ยังไม่มีข้อความ(ม.,s)a \sim N(m, s)b ∼ N( v , t ) )ข~ยังไม่มีข้อความ(โวลต์,เสื้อ))b \sim N(v, t))( x , y)(x,Y)(x,y)ม.ม.mโวลต์โวลต์v( x , y)(x,Y)(x,y)aaaขขb ไม่มีใครรู้ว่าการกระจายตัวของปริภูมิแบบยุคลิดแบบสแควร์ระหว่างวัตถุสองชิ้นนี้คือการแจกแจงแบบพารามิเตอร์หรือไม่? หรือวิธีการหา PDF / CDF สำหรับฟังก์ชั่นนี้วิเคราะห์?

3
ฉันสามารถคำนวณ
สมมติว่าϕ(⋅)φ(⋅)\phi(\cdot)และΦ(⋅)Φ(⋅)\Phi(\cdot)เป็นฟังก์ชันความหนาแน่นและฟังก์ชันการกระจายของการแจกแจงแบบปกติมาตรฐาน เราจะคำนวณอินทิกรัลได้อย่างไร: ∫∞−∞Φ(w−ab)ϕ(w)dw∫−∞∞Φ(w−ab)ϕ(w)dW\int^{\infty}_{-\infty}\Phi\left(\frac{w-a}{b}\right)\phi(w)\,\mathrm dw

3
อะไรคือความแตกต่างระหว่างการแจกแจงแบบปกติและแบบเกาส์เซียน
มีความแตกต่างอย่างลึกซึ้งระหว่างการแจกแจงแบบปรกติและแบบเกาส์เซียนฉันเคยเห็นเอกสารจำนวนมากที่ใช้พวกเขาโดยไม่มีความแตกต่างและฉันมักจะอ้างถึงพวกเขาในสิ่งเดียวกัน อย่างไรก็ตาม PI ล่าสุดของฉันบอกฉันว่าปกติเป็นกรณีเฉพาะของ Gaussian ที่มีค่าเฉลี่ย = 0 และ std = 1 ซึ่งฉันได้ยินเมื่อไม่นานมานี้ในร้านอื่นฉันทามติเกี่ยวกับเรื่องนี้อย่างไร ตามวิกิพีเดียสิ่งที่พวกเขาเรียกว่าปกติคือการแจกแจงแบบปกติมาตรฐานในขณะที่ Normal เป็นคำพ้องความหมายของ Gaussian แต่หลังจากนั้นอีกครั้งฉันก็ไม่แน่ใจเกี่ยวกับ Wikipedia เช่นกัน ขอบคุณ

3
พิจารณาผลรวมของ
ฉันสงสัยเกี่ยวกับอันนี้มาระยะหนึ่งแล้ว ฉันพบว่ามันแปลกเล็กน้อยว่าเกิดขึ้นโดยฉับพลันได้อย่างไร โดยพื้นฐานแล้วทำไมเราถึงต้องการเครื่องแบบเพียงสามชุดสำหรับเพื่อให้เรียบเนียนเหมือนที่เคยทำ? และทำไมการปรับให้เรียบจึงเกิดขึ้นค่อนข้างเร็วZnZnZ_n Z2Z2Z_2 : Z3Z3Z_3 : (ภาพที่ถูกขโมยไปอย่างไร้สาระจากบล็อกของ John D. Cook: http://www.johndcook.com/blog/2009/02/12/sums-of-uniform-random-values/ ) ทำไมมันไม่ใช้พูดสี่ชุด? หรือห้า หรือ...?

3
ค่าเบี่ยงเบนมาตรฐานบอกอะไรเราในการแจกแจงแบบไม่ปกติ
ในการแจกแจงแบบปกติกฎ 68-95-99.7ให้ค่าความเบี่ยงเบนมาตรฐานมีความหมายมากมาย แต่ค่าเบี่ยงเบนมาตรฐานจะมีความหมายอย่างไรในการแจกแจงแบบไม่ปกติ (Multimodal หรือเบ้) ค่าข้อมูลทั้งหมดจะยังคงอยู่ภายใน 3 ส่วนเบี่ยงเบนมาตรฐานหรือไม่ เรามีกฎเช่น 68-95-99.7 สำหรับการแจกแจงแบบไม่ปกติหรือไม่?

4
สถิติการสั่งซื้อโดยประมาณสำหรับตัวแปรสุ่มปกติ
มีสูตรที่รู้จักกันดีสำหรับสถิติการสั่งซื้อของการแจกแจงแบบสุ่มบางอย่างหรือไม่? โดยเฉพาะอย่างยิ่งสถิติลำดับแรกและสุดท้ายของตัวแปรสุ่มปกติ แต่คำตอบทั่วไปก็น่าจะได้รับการชื่นชมเช่นกัน แก้ไข:เพื่อชี้แจงฉันกำลังมองหาสูตรการประมาณที่สามารถประเมินมากขึ้นหรือน้อยลงอย่างชัดเจนไม่ใช่นิพจน์รวมที่แน่นอน ตัวอย่างเช่นฉันได้เห็นการประมาณสองค่าต่อไปนี้สำหรับสถิติลำดับแรก (เช่นค่าต่ำสุด) ของ rv ปกติ: e1:n≥μ−n−12n−1√σe1:n≥μ−n−12n−1σe_{1:n} \geq \mu - \frac{n-1}{\sqrt{2n-1}}\sigma และ e1:n≈μ+Φ−1(1n+1)σe1:n≈μ+Φ−1(1n+1)σe_{1:n} \approx \mu + \Phi^{-1} \left( \frac{1}{n+1} \right)\sigma ครั้งแรกของเหล่าสำหรับn=200n=200n=200ให้ประมาณe1:200≥μ−10σe1:200≥μ−10σe_{1:200} \geq \mu - 10\sigmaซึ่งดูเหมือนว่าลำพองผูกไว้หลวม ประการที่สองให้e1:200≈μ−2.58σe1:200≈μ−2.58σe_{1:200} \approx \mu - 2.58\sigmaขณะที่รวดเร็ว Monte Carlo ให้e1:200≈μ−2.75σe1:200≈μ−2.75σe_{1:200} \approx \mu - 2.75\sigmaดังนั้นมันจึงไม่ได้เป็นประมาณไม่ดี แต่ไม่ดีอย่างใดอย่างหนึ่งและที่สำคัญผมไม่ได้มีสัญชาติญาณใด ๆ เกี่ยวกับ มันมาจากไหน ความช่วยเหลือใด ๆ

1
ความแปรปรวนของส่วนผสมน้ำหนักของสอง gaussians คืออะไร?
บอกว่าผมมีสองการแจกแจงปรกติ A และ B ด้วยวิธีการและและแปรปรวนและ\ฉันต้องการที่จะใช้เป็นส่วนผสมถ่วงน้ำหนักของทั้งสองการกระจายการใช้น้ำหนักและที่และ1-P ฉันรู้ว่าค่าเฉลี่ยของส่วนผสมนี้จะเป็นmu_B)μAμA\mu_AμBμB\mu_BσAσA\sigma_AσBσB\sigma_Bpppqqq0≤p≤10≤p≤10\le p \le 1q=1−pq=1−pq = 1-pμAB=(p×μA)+(q×μB)μAB=(p×μA)+(q×μB)\mu_{AB} = (p\times\mu_A) + (q\times\mu_B) ความแปรปรวนจะเป็นอย่างไร ตัวอย่างที่ชัดเจนคือถ้าฉันรู้พารามิเตอร์สำหรับการกระจายความสูงของเพศชายและเพศหญิง หากฉันมีห้องของคนที่เป็นเพศชาย 60% ฉันสามารถสร้างความสูงเฉลี่ยที่คาดไว้สำหรับทั้งห้อง แต่ความแปรปรวนล่ะ?

6
นักวิทยาศาสตร์ได้คำนวณรูปร่างของฟังก์ชันความหนาแน่นของความน่าจะเป็นกระจายแบบปกติได้อย่างไร
นี่อาจเป็นคำถามสมัครเล่น แต่ฉันสนใจว่านักวิทยาศาสตร์เกิดขึ้นได้อย่างไรกับรูปร่างของฟังก์ชันความหนาแน่นของความน่าจะเป็นการแจกแจงแบบปกติ โดยทั่วไปสิ่งที่ฉันเป็นคนนั้นอาจจะง่ายกว่าที่ฟังก์ชันความน่าจะเป็นของข้อมูลที่แจกแจงแบบปกติมีรูปร่างของรูปสามเหลี่ยมหน้าจั่วแทนที่จะเป็นรูปโค้งและคุณจะพิสูจน์ให้คนฟังก์ชั่นว่าความหนาแน่นของความน่าจะเป็นของ ข้อมูลที่กระจายตามปกติทั้งหมดมีรูปทรงระฆังหรือไม่ โดยการทดลอง? หรือโดยการคำนวณทางคณิตศาสตร์ ท้ายที่สุดแล้วเราจะพิจารณาข้อมูลที่กระจายไปตามปกติอย่างไร? ข้อมูลที่ตามหลังรูปแบบความน่าจะเป็นของการแจกแจงแบบปกติหรืออย่างอื่น? โดยทั่วไปคำถามของฉันคือทำไมฟังก์ชั่นความหนาแน่นของความน่าจะเป็นการแจกแจงปกติมีรูปร่างเป็นรูปทรงระฆัง และนักวิทยาศาสตร์ได้จำแนกสถานการณ์จริงที่สามารถใช้การแจกแจงแบบปกติโดยการทดลองหรือการศึกษาธรรมชาติของข้อมูลต่าง ๆ ได้อย่างไร ดังนั้นฉันจึงพบว่าลิงก์นี้มีประโยชน์จริง ๆ ในการอธิบายการได้มาของรูปแบบการทำงานของเส้นโค้งการแจกแจงแบบปกติและจึงตอบคำถามว่า อย่างน้อยก็มีเหตุผลสำหรับฉัน

2
การกระจายของผลรวมของตัวแปรที่ไม่ใช่ iid gaussian คืออะไร?
ถ้ากระจายN ( μ X , σ 2 X ) , YกระจายN ( μ Y , σ 2 Y ) และZ = X + Y , ฉันรู้ว่าZกระจายN ( μ X + μ Y , σ 2 X + σ 2 Y )ถ้า X และ Y เป็นอิสระXXXยังไม่มีข้อความ( μX, σ2X)N(μX,σX2)N(\mu_X, \sigma^2_X)YYYยังไม่มีข้อความ( μY, σ2Y)N(μY,σY2)N(\mu_Y, …

4
วิธีตัวอย่างจากการแจกแจงแบบปกติที่มีค่าเฉลี่ยและความแปรปรวนที่ทราบโดยใช้ภาษาโปรแกรมทั่วไป
ฉันไม่เคยเรียนวิชาสถิติมาก่อนดังนั้นฉันหวังว่าฉันจะถามถูกที่แล้ว สมมติว่าฉันมีเพียงสองอธิบายข้อมูลการกระจายปกติ: ค่าเฉลี่ยและความแปรปรวน 2 ฉันต้องการใช้คอมพิวเตอร์เพื่อสุ่มตัวอย่างจากการแจกแจงนี้ซึ่งฉันเคารพสถิติทั้งสองนี้σ 2μμ\muσ2σ2\sigma^2 เห็นได้ชัดว่าฉันสามารถจัดการค่าเฉลี่ยด้วยการทำ normalizing ประมาณ 0: เพียงเพิ่มให้กับแต่ละตัวอย่างก่อนส่งออกตัวอย่าง แต่ผมไม่เห็นว่าโปรแกรมสร้างตัวอย่างที่จะเคารพ 2σ 2μμ\muσ2σ2\sigma^2 โปรแกรมของฉันจะเป็นภาษาโปรแกรมทั่วไป ฉันไม่สามารถเข้าถึงแพ็คเกจสถิติใด ๆ ได้

3
จะหาอนุพันธ์ของความหนาแน่นปกติหลายตัวแปรได้อย่างไร
สมมติว่าฉันมีความหนาแน่นหลายตัวแปรปกติฉันต้องการที่จะได้รับที่สอง (บางส่วน) WRT อนุพันธ์\ไม่แน่ใจว่าจะหาอนุพันธ์ของเมทริกซ์ได้อย่างไรN(μ,Σ)N(μ,Σ)N(\mu, \Sigma)μμ\mu Wiki กล่าวว่านำองค์ประกอบอนุพันธ์โดยองค์ประกอบภายในเมทริกซ์ ฉันกำลังทำงานกับ Laplace ประมาณ โหมดคือ\θ = μlogPN(θ)=logPN−12(θ−θ^)TΣ−1(θ−θ^).log⁡PN(θ)=log⁡PN−12(θ−θ^)TΣ−1(θ−θ^).\log{P}_{N}(\theta)=\log {P}_{N}-\frac{1}{2}{(\theta-\hat{\theta})}^{T}{\Sigma}^{-1}(\theta-\hat{\theta}) \>.θ^=μθ^=μ\hat\theta=\mu ฉันได้รับสิ่งนี้เกิดขึ้นได้อย่างไร?Σ−1=−∂2∂θ2logp(θ^|y),Σ−1=−∂2∂θ2log⁡p(θ^|y),{\Sigma}^{-1}=-\frac{{{\partial }^{2}}}{\partial {{\theta }^{2}}}\log p(\hat{\theta }|y), สิ่งที่ฉันได้ทำ: logP(θ|y)=−k2log2π−12log|Σ|−12(θ−θ^)TΣ−1(θ−θ^)log⁡P(θ|y)=−k2log⁡2π−12log⁡|Σ|−12(θ−θ^)TΣ−1(θ−θ^)\log P(\theta|y) = -\frac{k}{2} \log 2 \pi - \frac{1}{2} \log \left| \Sigma \right| - \frac{1}{2} {(\theta-\hat \theta)}^{T}{\Sigma}^{-1}(\theta-\hat\theta) ดังนั้นฉันเอาอนุพันธ์ wrt มาที่ก่อนอื่นมีการแปลงที่สองคือเมทริกซ์ ดังนั้นฉันติดอยู่θθ\theta หมายเหตุ: หากอาจารย์ของฉันพบสิ่งนี้ฉันหมายถึงการบรรยาย

3
ค่าปกติของตัวแปรตาม = ค่าปกติของเศษเหลือ?
ดูเหมือนว่าปัญหานี้จะทำให้หัวของมันน่าเกลียดอยู่ตลอดเวลาและฉันพยายามที่จะประหารชีวิตเพื่อความเข้าใจสถิติของตัวเอง (และมีสติ!) สมมติฐานของตัวแบบเชิงเส้นทั่วไป (t-test, ANOVA, การถดถอย ฯลฯ ) รวมถึง "สมมติฐานของความปกติ" แต่ฉันได้พบว่าสิ่งนี้ไม่ค่อยได้อธิบายอย่างชัดเจน ฉันมักจะเจอสถิติตำรา / คู่มือ / ฯลฯ เพียงแค่ระบุว่า "ข้อสันนิษฐานของภาวะปกติ" นำไปใช้กับแต่ละกลุ่ม (เช่นตัวแปร X เด็ดขาด) และเราเราควรจะตรวจสอบการออกเดินทางจากปกติสำหรับแต่ละกลุ่ม คำถาม : สมมติฐานนี้อ้างถึงค่าของ Y หรือค่าตกค้างของ Y หรือไม่ สำหรับกลุ่มใดเป็นไปได้ไหมที่จะมีการแจกแจงค่า Y ที่ไม่ปกติอย่างรุนแรง(เช่นเอียง) แต่การกระจายตัวของ Y ที่เหลืออยู่โดยประมาณ (หรืออย่างน้อยกว่าปกติ) แหล่งข้อมูลอื่น ๆ อธิบายว่าข้อสันนิษฐานที่เกี่ยวข้องกับส่วนที่เหลือของแบบจำลอง (ในกรณีที่มีกลุ่มเช่น t-tests / ANOVA) และเราควรตรวจสอบการออกจากภาวะปกติของสิ่งตกค้างเหล่านี้ (เช่นเพียง QQ plot / test …

6
มีตัวอย่างใดบ้างที่ทฤษฎีบทขีด จำกัด กลางไม่ถือ?
Wikipedia พูดว่า - ในทฤษฎีความน่าจะเป็นทฤษฎีขีด จำกัด กลาง (CLT) กำหนดว่าในสถานการณ์ส่วนใหญ่เมื่อมีการเพิ่มตัวแปรสุ่มแบบอิสระผลรวมปกติที่ถูกต้องของพวกมันมีแนวโน้มไปสู่การแจกแจงแบบปกติ (อย่างไม่เป็นทางการว่า กระจายตามปกติ ... เมื่อมีข้อความว่า "ในสถานการณ์ส่วนใหญ่" ทฤษฎีบทขีด จำกัด กลางในสถานการณ์ใดไม่ทำงาน

1
ผลที่ตามมาของความไม่เท่าเทียมกันแบบเกาส์ความสัมพันธ์สำหรับการคำนวณช่วงความเชื่อมั่นร่วมกัน
อ้างอิงจากบทความที่น่าสนใจมากในนิตยสาร Quanta: "หลักฐานอันยาวนาน, พบและหลงทาง" - ได้รับการพิสูจน์แล้วว่าได้รับเวกเตอร์มีหลายตัวแปร เสียนกระจายและช่วงเวลาที่กำหนดแน่นิ่งวิธีการของส่วนประกอบที่สอดคล้องกันของแล้วx=(x1,…,xn)x=(x1,…,xn)\mathbf{x}=(x_1,\dots,x_n)I1,…,InI1,…,InI_1,\dots,I_n xx\mathbf{x} p(x1∈I1,…,xn∈In)≥∏i=1np(xi∈Ii)p(x1∈I1,…,xn∈In)≥∏i=1np(xi∈Ii)p(x_1\in I_1, \dots, x_n\in I_n)\geq \prod_{i=1}^n p(x_i\in I_i) (ความไม่เท่าเทียมกันแบบเกาส์สหสัมพันธ์หรือ GCI ดูhttps://arxiv.org/pdf/1512.08776.pdfสำหรับการกำหนดทั่วไปมากขึ้น) ดูเหมือนว่าจะเป็นเรื่องที่ดีและเรียบง่ายจริงๆและบทความบอกว่ามันมีผลที่ตามมาสำหรับช่วงความมั่นใจร่วม อย่างไรก็ตามดูเหมือนว่าไม่มีประโยชน์เลยสำหรับฉัน สมมติว่าเรากำลังประมาณค่าพารามิเตอร์ และเราพบตัวประมาณซึ่งเป็น (อาจจะไม่เชิง) ร่วมกัน (ตัวอย่างเช่น MLE ประมาณ) . จากนั้นถ้าฉันคำนวณช่วงเวลา 95% - ความมั่นใจสำหรับแต่ละพารามิเตอร์ GCI รับประกันว่า hypercubeเป็นพื้นที่ความเชื่อมั่นร่วมที่มีความครอบคลุมไม่น้อยกว่า ... ซึ่งค่อนข้างครอบคลุมต่ำ สำหรับในระดับปานกลางnθ1,…,θnθ1,…,θn\theta_1,\dots,\theta_nθ1^,…,θn^θ1^,…,θn^\hat{\theta_1},\dots,\hat{\theta_n}I1×…InI1×…InI_1\times\dots I_n(0.95)n(0.95)n(0.95)^n nnn ดังนั้นจึงไม่ใช่วิธีที่ชาญฉลาดในการค้นหาภูมิภาคที่มีความเชื่อมั่นร่วมกัน: ภูมิภาคที่มีความเชื่อมั่นตามปกติสำหรับ Gaussian หลายตัวแปรเช่นไฮเปอร์เซลล์ลิปลอยด์นั้นไม่ยากที่จะค้นหาว่าเมทริกซ์ความแปรปรวนร่วมเป็นที่รู้จักหรือไม่ อาจเป็นประโยชน์ในการค้นหาภูมิภาคที่มีความมั่นใจเมื่อไม่ทราบเมทริกซ์ความแปรปรวนร่วม? คุณสามารถแสดงตัวอย่างของความเกี่ยวข้องของ GCI ให้กับการคำนวณขอบเขตความเชื่อมั่นร่วมกันได้หรือไม่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.