คำถามติดแท็ก normal-distribution

การแจกแจงแบบปกติหรือแบบเกาส์เซียนนั้นมีฟังก์ชั่นความหนาแน่นซึ่งเป็นเส้นโค้งรูประฆังแบบสมมาตร มันเป็นหนึ่งในการแจกแจงที่สำคัญที่สุดในสถิติ ใช้แท็ก [normality] เพื่อสอบถามเกี่ยวกับการทดสอบหา normality

3
การประมาณปรกติของการแจกแจงปัวซอง
ที่นี่ใน Wikipedia บอกว่า: สำหรับค่าที่มากพอของλλλ , (พูดλ>1000λ>1000λ>1000 ) การแจกแจงแบบปกติที่มีค่าเฉลี่ยλλλและความแปรปรวนλλλ (ค่าเบี่ยงเบนมาตรฐานλ−−√λ\sqrt{\lambda} ) เป็นค่าประมาณยอดเยี่ยมสำหรับการแจกแจงปัวซอง ถ้าλλλมากกว่า 10 แล้วการแจกแจงแบบปกติคือการประมาณที่ดีถ้าทำการแก้ไขความต่อเนื่องที่เหมาะสมคือP(X≤x),P(X≤x),P(X ≤ x),ที่ (ตัวพิมพ์เล็ก) xxxเป็นจำนวนเต็มไม่เป็นลบจะถูกแทนที่ด้วยP(X≤x+0.5).P(X≤x+0.5).P(X ≤ x + 0.5). FPoisson(x;λ)≈Fnormal(x;μ=λ,σ2=λ)FPoisson(x;λ)≈Fnormal(x;μ=λ,σ2=λ)F_\mathrm{Poisson}(x;\lambda) \approx F_\mathrm{normal}(x;\mu=\lambda,\sigma^2=\lambda) น่าเสียดายที่นี่ไม่ได้อ้างถึง ฉันต้องการที่จะแสดง / พิสูจน์สิ่งนี้ด้วยความแม่นยำ คุณจะบอกได้อย่างไรว่าการกระจายตัวแบบปกตินั้นเป็นค่าประมาณที่ดีเมื่อλ>1000λ>1000\lambda > 1000คุณจะวัดปริมาณการประมาณ 'ยอดเยี่ยม' นี้ได้อย่างไรใช้มาตรการใด สิ่งที่ไกลที่สุดที่ฉันเคยได้รับกับเรื่องนี้คือที่นี่ที่จอห์นพูดถึงเกี่ยวกับการใช้ทฤษฎีบท Berry - Esseen และใกล้เคียงกับข้อผิดพลาดในสอง CDFs จากสิ่งที่ฉันสามารถดูเขาไม่ได้พยายามที่ค่าใด ๆλ≥1000λ≥1000\lambda \geq 10001000

2
Heteroskedasticity และภาวะปกติ
ฉันมีการถดถอยเชิงเส้นที่ค่อนข้างดีฉันเดา (สำหรับโครงการมหาวิทยาลัยดังนั้นฉันจึงไม่จำเป็นต้องแม่นยำอย่างแท้จริง) ประเด็นคือถ้าฉันพล็อตส่วนที่เหลือเทียบกับค่าที่คาดการณ์ไว้มี (ตามครูของฉัน) มีคำใบ้ของ heteroskedasticity แต่ถ้าฉันพล็อต QQ-Plot ของส่วนที่เหลือก็เป็นที่ชัดเจนว่าพวกมันกระจายตามปกติ ยิ่งกว่านั้นการทดสอบชาปิโร่เกี่ยวกับส่วนที่เหลือมีค่าเท่ากับดังนั้นฉันคิดว่าไม่ต้องสงสัยเลยว่าโดยปกติการกระจายตัวของสิ่งที่เหลืออยู่พีพีp0.80.80.8 คำถาม:จะมีค่า heteroskedasticity ในการทำนายค่าได้อย่างไรถ้ามีการแจกแจงเศษตกค้างตามปกติ?

4
การทดสอบทางสถิติมาตรฐานคืออะไรเพื่อดูว่าข้อมูลเป็นไปตามการแจกแจงแบบเอ็กซ์โพเนนเชียลหรือการแจกแจงปกติ?
การทดสอบทางสถิติมาตรฐานคืออะไรเพื่อดูว่าข้อมูลเป็นไปตามการแจกแจงแบบเอ็กซ์โพเนนเชียลหรือการแจกแจงปกติ?

1
อะไรคือดัชนีที่ดีของระดับของการละเมิดกฎเกณฑ์และฉลากที่สื่อความหมายสามารถแนบกับดัชนีนั้นได้?
บริบท: ในคำถามก่อนหน้านี้ @Robbie ถามในการศึกษามีประมาณ 600 กรณีว่าทำไมการทดสอบภาวะปกติอย่างมีนัยสำคัญปัญหาที่ไม่ปกติยังแปลงปัญหาการแจกแจงปกติ หลายคนระบุว่าการทดสอบความสำคัญของภาวะปกตินั้นไม่มีประโยชน์มากนัก ด้วยตัวอย่างขนาดเล็กการทดสอบดังกล่าวไม่มีอำนาจมากพอที่จะตรวจจับการละเมิดกฎเกณฑ์และตัวอย่างที่มีขนาดใหญ่พวกเขาจะตรวจพบการละเมิดกฎเกณฑ์ที่มีขนาดเล็กเพียงพอไม่ต้องกังวล สำหรับฉันแล้วดูเหมือนว่าปัญหานี้จะคล้ายกับการอภิปรายเกี่ยวกับการทดสอบที่สำคัญและขนาดผลกระทบ หากคุณมุ่งเน้นเฉพาะการทดสอบที่สำคัญเมื่อคุณมีกลุ่มตัวอย่างขนาดใหญ่คุณสามารถตรวจจับเอฟเฟ็กต์เล็ก ๆ ที่ไม่เกี่ยวข้องกับการใช้งานจริงและตัวอย่างขนาดเล็กคุณไม่มีพลังเพียงพอ ในบางกรณีที่ฉันเคยเห็นหนังสือแนะนำคนที่คุณสามารถมีตัวอย่าง "ใหญ่เกินไป" เพราะเอฟเฟกต์ขนาดเล็กจะมีความสำคัญทางสถิติ ในบริบทของการทดสอบอย่างมีนัยสำคัญและขนาดของเอฟเฟ็กต์การแก้ปัญหาอย่างง่ายอย่างหนึ่งคือการมุ่งเน้นไปที่การประเมินขนาดของเอฟเฟกต์ที่น่าสนใจแทนที่จะหมกมุ่นอยู่กับกฎการตัดสินใจแบบไบนารีว่ามีหรือไม่มีผล ช่วงความเชื่อมั่นที่มีต่อขนาดเอฟเฟกต์เป็นหนึ่งในวิธีการดังกล่าวหรือคุณสามารถใช้วิธีการแบบเบย์บางรูปแบบ ยิ่งไปกว่านั้นโดเมนงานวิจัยต่าง ๆ สร้างความคิดเกี่ยวกับขนาดของเอฟเฟกต์ที่กำหนดในทางปฏิบัติสำหรับดีขึ้นหรือแย่ลงการใช้ฮิวริสติกฉลากเช่น "เล็ก", "ปานกลาง" และ "เอฟเฟ็กต์ขนาดใหญ่" สิ่งนี้ยังนำไปสู่การแนะนำอย่างชาญฉลาดในการเพิ่มขนาดตัวอย่างเพื่อให้ได้ความแม่นยำสูงสุดในการประมาณค่าพารามิเตอร์ที่กำหนด นี่ทำให้ฉันสงสัยว่าทำไมวิธีการที่คล้ายกันโดยยึดตามช่วงความเชื่อมั่นของขนาดเอฟเฟกต์นั้นไม่ได้ดำเนินการอย่างกว้างขวางมากขึ้นในการทดสอบสมมติฐาน คำถาม: อะไรคือดัชนีเดี่ยวที่ดีที่สุดของระดับที่ข้อมูลละเมิดกฎเกณฑ์? หรือเป็นเรื่องที่ดีกว่าถ้าพูดถึงดัชนีการฝ่าฝืนกฎเกณฑ์หลาย ๆ อย่าง (เช่นความเบ้, เคิร์ตซีส, ความแพร่หลายในค่าผิดปกติ) จะคำนวณช่วงความมั่นใจได้อย่างไร (หรืออาจใช้วิธีการแบบเบย์) สำหรับดัชนี? คุณสามารถกำหนดป้ายกำกับด้วยวาจาแบบใดให้กับดัชนีนั้นเพื่อระบุระดับของการละเมิดกฎเกณฑ์ (เช่นอ่อนปานกลางปานกลางแข็งแรงมาก ฯลฯ ) จุดประสงค์ของฉลากดังกล่าวอาจช่วยนักวิเคราะห์ที่มีประสบการณ์น้อยลงในการฝึกอบรมสัญชาตญาณว่าการละเมิดกฎเกณฑ์เป็นปัญหาหรือไม่

5
ทำไมการทดสอบเพื่อความเป็นปกติจะปฏิเสธสมมติฐานว่าง?
การทดสอบ Kolgomorov-Smirnov การทดสอบ Shapiro ฯลฯ ทั้งหมดล้วน แต่ปฏิเสธสมมติฐานที่ว่าการแจกแจงเป็นเรื่องปกติ แต่เมื่อฉันพล็อตควอนไทล์ปกติและฮิสโตแกรมข้อมูลก็เป็นปกติอย่างชัดเจน อาจเป็นเพราะพลังของการทดสอบสูงหรือไม่ ขนาดตัวอย่างประมาณ 650 ดังนั้นอย่างน้อยหนึ่งในการทดสอบเหล่านี้จึงไม่สามารถปฏิเสธสมมติฐานว่างได้? ผล: Kolmogorov-Smirnov D 0.05031 Pr > D <0.010 Cramer-von Mises W-Sq 0.30003 Pr > W-Sq <0.005 Anderson-Darling A-Sq 1.66965 Pr > A-Sq <0.005 Chi-Square Chi-Sq 3250.43596 18 Pr > Chi-Sq <0.001

3
การประมาณค่าพารามิเตอร์สำหรับกระบวนการเชิงพื้นที่
ฉันได้รับตารางของค่าจำนวนเต็มบวก ตัวเลขเหล่านี้แสดงถึงความเข้มที่ควรสอดคล้องกับความแข็งแกร่งของความเชื่อของบุคคลที่ครอบครองตำแหน่งกริดนั้น (ค่าที่สูงกว่าหมายถึงความเชื่อที่สูงกว่า) โดยทั่วไปแล้วคน ๆ หนึ่งจะมีอิทธิพลเหนือเซลล์กริดหลายเซลล์n×nn×nn\times n ฉันเชื่อว่ารูปแบบของความเข้มควร "ดูเกาส์เซียน" ในที่นั้นจะมีที่ตั้งกลางของความเข้มสูงและจากนั้นความเข้มจะลดลงอย่างรุนแรงในทุกทิศทาง โดยเฉพาะฉันต้องการสร้างแบบจำลองค่าที่มาจาก "Gaussian แบบปรับขนาด" พร้อมพารามิเตอร์สำหรับความแปรปรวนและอีกแบบสำหรับตัวประกอบสเกล มีสองปัจจัยที่ซับซ้อน: การไม่มีบุคคลจะไม่สอดคล้องกับค่าศูนย์เนื่องจากเสียงพื้นหลังและเอฟเฟกต์อื่น ๆ แต่ค่าควรน้อยกว่า พวกมันอาจเอาแน่เอานอนไม่ได้และในการประมาณครั้งแรกอาจเป็นการยากที่จะจำลองแบบเสียงเกาส์แบบง่าย ช่วงความเข้มอาจแตกต่างกันไป สำหรับอินสแตนซ์หนึ่งค่าอาจอยู่ในช่วงระหว่าง 1 ถึง 10 และในอีกกรณีระหว่าง 1 ถึง 100 ฉันกำลังมองหากลยุทธ์การประมาณค่าพารามิเตอร์ที่เหมาะสมหรือตัวชี้ไปยังเอกสารที่เกี่ยวข้อง ชี้ให้เห็นว่าทำไมฉันถึงเข้าถึงปัญหานี้ในทางที่ผิดทั้งหมดก็จะได้รับการชื่นชม :) ฉันได้อ่านเกี่ยวกับกระบวนการ kriging และ Gaussian แล้ว แต่ดูเหมือนว่าเป็นเครื่องจักรที่หนักมากสำหรับปัญหาของฉัน

2
มีตัวอย่างของตัวแปรที่กระจายตามปกติที่ * ไม่ * เนื่องจากทฤษฎีบทกลาง จำกัด หรือไม่
การแจกแจงแบบปกติดูเหมือนจะไม่ง่ายจนกว่าคุณจะเรียนรู้ CLT ซึ่งจะอธิบายว่าทำไมมันจึงแพร่หลายในชีวิตจริง แต่มันไม่เคยเกิดขึ้นในฐานะการกระจาย "ธรรมชาติ" สำหรับปริมาณบางอย่าง?

2
ถ้า
ฉันพยายามพิสูจน์ข้อความนี้: ถ้าและเป็นตัวแปรสุ่มอิสระX∼N(0,σ21)X∼N(0,σ12)X\sim\mathcal{N}(0,\sigma_1^2)Y∼N(0,σ22)Y∼N(0,σ22)Y\sim\mathcal{N}(0,\sigma_2^2) ดังนั้นก็เป็นตัวแปรสุ่มแบบปกติเช่นกันXYX2+Y2√XYX2+Y2\frac{XY}{\sqrt{X^2+Y^2}} สำหรับกรณีพิเศษ (พูด) เรามีผลลัพธ์ที่รู้จักกันดีว่าเมื่อใดก็ตามที่และเป็นอิสระตัวแปร ในความเป็นจริงเป็นที่รู้กันโดยทั่วไปว่าเป็นอิสระตัวแปรσ1=σ2=σσ1=σ2=σ\sigma_1=\sigma_2=\sigmaXYX2+Y2√∼N(0,σ24)XYX2+Y2∼N(0,σ24)\frac{XY}{\sqrt{X^2+Y^2}}\sim\mathcal{N}\left(0,\frac{\sigma^2}{4}\right)XXXYYYN(0,σ2)N(0,σ2)\mathcal{N}(0,\sigma^2)XYX2+Y2√,X2−Y22X2+Y2√XYX2+Y2,X2−Y22X2+Y2\frac{XY}{\sqrt{X^2+Y^2}},\frac{X^2-Y^2}{2\sqrt{X^2+Y^2}}N(0,σ24)N(0,σ24)\mathcal{N}\left(0,\frac{\sigma^2}{4}\right) หลักฐานของผลลัพธ์สุดท้ายตามด้วยการใช้การแปลงโดยที่และtheta) แน่นอน, ที่นี่และ . ฉันพยายามเลียนแบบหลักฐานนี้สำหรับปัญหาที่เกิดขึ้น แต่ดูเหมือนว่าจะยุ่ง(X,Y)→(R,Θ)→(U,V)(X,Y)→(R,Θ)→(U,V)(X,Y)\to(R,\Theta)\to(U,V)x=rcosθ,y=rsinθx=rcos⁡θ,y=rsin⁡θx=r\cos\theta,y=r\sin\thetau=r2sin(2θ),v=r2cos(2θ)u=r2sin⁡(2θ),v=r2cos⁡(2θ)u=\frac{r}{2}\sin(2\theta),v=\frac{r}{2}\cos(2\theta)U=XYX2+Y2√U=XYX2+Y2U=\frac{XY}{\sqrt{X^2+Y^2}}V=X2−Y22X2+Y2√V=X2−Y22X2+Y2V=\frac{X^2-Y^2}{2\sqrt{X^2+Y^2}} หากฉันไม่ได้ทำผิดพลาดสำหรับฉันจบลงด้วยความหนาแน่นร่วมของเช่น(u,v)∈R2(u,v)∈R2(u,v)\in\mathbb{R}^2(U,V)(U,V)(U,V) fU,V(u,v)=2σ1σ2πexp[−u2+v2−−−−−−√(u2+v2−−−−−−√+vσ21+u2+v2−−−−−−√−vσ22)]fU,V(u,v)=2σ1σ2πexp⁡[−u2+v2(u2+v2+vσ12+u2+v2−vσ22)]f_{U,V}(u,v)=\frac{2}{\sigma_1\sigma_2\pi}\exp\left[-\sqrt{u^2+v^2}\left(\frac{\sqrt{u^2+v^2}+v}{\sigma_1^2}+\frac{\sqrt{u^2+v^2}-v}{\sigma_2^2}\right)\right] ฉันมีตัวคูณด้านบนเนื่องจากการแปลงไม่ใช่แบบหนึ่งต่อหนึ่ง222 ดังนั้นความหนาแน่นของจะได้รับโดยซึ่งไม่ได้รับการประเมินอย่างง่ายดายUUU∫RfU,V(u,v)dv∫RfU,V(u,v)dv\displaystyle \int_{\mathbb{R}}f_{U,V}(u,v)\,\mathrm{d}v ตอนนี้ฉันสนใจที่จะรู้ว่ามีหลักฐานที่ฉันสามารถทำงานกับเท่านั้นและไม่ต้องพิจารณาเพื่อแสดงว่าเป็นเรื่องปกติ การค้นหา CDF ของไม่ได้ดูน่าเชื่อถือสำหรับฉันในขณะนี้ ผมยังต้องการที่จะทำเช่นเดียวกันสำหรับกรณีที่\UUUVVVUUUUUUσ1=σ2=σσ1=σ2=σ\sigma_1=\sigma_2=\sigma นั่นคือถ้าและเป็นอิสระตัวแปรแล้วฉันต้องการแสดงให้เห็นว่าโดยไม่ต้องใช้การเปลี่ยนแปลงของตัวแปร ถ้าอย่างใดฉันสามารถยืนยันว่าแล้วฉันทำ ดังนั้นคำถามสองข้อที่นี่กรณีทั่วไปและกรณีเฉพาะXXXYYYN(0,σ2)N(0,σ2)\mathcal{N}(0,\sigma^2)Z=2XYX2+Y2√∼N(0,σ2)Z=2XYX2+Y2∼N(0,σ2)Z=\frac{2XY}{\sqrt{X^2+Y^2}}\sim\mathcal{N}(0,\sigma^2)Z=dXZ=dXZ\stackrel{d}{=}X โพสต์ที่เกี่ยวข้องกับ Math.SE: X2−Y2/X2+Y2−−−−−−−√∼N(0,1)X2−Y2/X2+Y2∼N(0,1)X^2-Y^2/ \sqrt{X^2+Y^2}\sim N(0,1)เมื่อX,Y∼N(0,1)X,Y∼N(0,1)X,Y\sim N(0,1)เป็นอิสระ ระบุว่าเป็น iidแสดงให้เห็นว่าจะ IIDX,YX,YX,YN(0,1)N(0,1)N(0,1)XYX2+Y2√,X2−Y22X2+Y2√XYX2+Y2,X2−Y22X2+Y2\frac{XY}{\sqrt{X^2+Y^2}},\frac{X^2-Y^2}{2\sqrt{X^2+Y^2}}N(0,14)N(0,14)N(0,\frac{1}{4}){4}) แก้ไข ปัญหานี้เกิดขึ้นจริงเนื่องจาก L. Shepp ตามที่ฉันค้นพบในแบบฝึกหัดของทฤษฎีความน่าจะเป็นเบื้องต้นและการประยุกต์ใช้ (ฉบับที่ II) โดย Feller พร้อมด้วยคำแนะนำที่เป็นไปได้: แน่นอนและฉันมีความหนาแน่นของในมือU=XYX2+Y2√=11X2+1Y2√U=XYX2+Y2=11X2+1Y2U=\frac{XY}{\sqrt{X^2+Y^2}}=\frac{1}{\sqrt{\frac{1}{X^2}+\frac{1}{Y^2}}}1X21X2\frac{1}{X^2} เรามาดูกันว่าฉันสามารถทำอะไรได้บ้าง นอกเหนือจากนี้เรายินดีต้อนรับความช่วยเหลือเล็กน้อยเกี่ยวกับอินทิกรัลด้านบนด้วย

2
ทำไมสถิติแบบ T ต้องการข้อมูลเพื่อติดตามการแจกแจงแบบปกติ
ฉันกำลังดูสมุดบันทึกนี้และฉันรู้สึกสับสนกับคำสั่งนี้: เมื่อเราพูดถึงเรื่องปกติวิสัยสิ่งที่เราหมายถึงคือข้อมูลควรดูเหมือนการแจกแจงแบบปกติ สิ่งนี้มีความสำคัญเนื่องจากการทดสอบสถิติหลายอย่างขึ้นอยู่กับเรื่องนี้ (เช่นสถิติ t) ฉันไม่เข้าใจว่าทำไมสถิติแบบ T ต้องการข้อมูลเพื่อติดตามการแจกแจงแบบปกติ แท้จริงแล้ว Wikipedia พูดในสิ่งเดียวกัน: การแจกแจงแบบ t (หรือการแจกแจงแบบที) เป็นสมาชิกของตระกูลการแจกแจงความน่าจะเป็นแบบต่อเนื่องที่เกิดขึ้นเมื่อประมาณค่าเฉลี่ยของประชากรที่กระจายตัวแบบปกติ อย่างไรก็ตามฉันไม่เข้าใจว่าทำไมจึงจำเป็นต้องใช้สมมติฐานนี้ ไม่มีสิ่งใดในสูตรที่บ่งบอกว่าข้อมูลต้องเป็นไปตามการแจกแจงแบบปกติ: ฉันดูคำจำกัดความของมันเล็กน้อยแต่ฉันไม่เข้าใจว่าทำไมถึงมีความจำเป็น

3
ช่วงของค่าความเบ้และความโด่งสำหรับการแจกแจงแบบปกติ
ฉันต้องการที่จะรู้ว่าอะไรคือช่วงของค่าความเบ้และความโด่งซึ่งข้อมูลถูกพิจารณาว่ามีการแจกจ่ายตามปกติ ฉันได้อ่านข้อโต้แย้งมากมายและส่วนใหญ่ฉันได้คำตอบที่หลากหลาย บางคนบอกว่าสำหรับความเบ้และสำหรับ kurtosis เป็นช่วงที่ยอมรับได้สำหรับการกระจายตามปกติ บางคนบอกว่า(-1.96,1.96)สำหรับความเบ้เป็นช่วงที่ยอมรับได้ ฉันพบการสนทนาอย่างละเอียดที่นี่: อะไรคือช่วงของความเบ้และ kurtosis ที่ยอมรับได้สำหรับการกระจายข้อมูลปกติเกี่ยวกับปัญหานี้ แต่ฉันไม่พบคำสั่งเด็ดขาดใด ๆ( - 2 , 2 )(−1,1)(−1,1)(-1,1)(−2,2)(−2,2)(-2,2)(−1.96,1.96)(−1.96,1.96)(-1.96,1.96) พื้นฐานสำหรับการตัดสินใจช่วงเวลาดังกล่าวคืออะไร? นี่เป็นตัวเลือกส่วนตัวหรือไม่? หรือมีคำอธิบายทางคณิตศาสตร์เบื้องหลังช่วงเวลาเหล่านี้หรือไม่?

1
วิธีการเลือกแบบที่ดีที่สุดโดยไม่มีข้อมูลที่เหมาะสมมากเกินไป? การสร้างแบบจำลองการกระจาย bimodal ด้วยฟังก์ชั่นปกติ N ฯลฯ
ฉันมีการกระจายของค่านิยมแบบ bimodal อย่างชัดเจนซึ่งฉันพยายามที่จะปรับให้เหมาะสม ข้อมูลสามารถเข้ากันได้ดีกับทั้ง 2 ฟังก์ชั่นปกติ (bimodal) หรือฟังก์ชั่นปกติ 3 อย่าง นอกจากนี้ยังมีเหตุผลทางกายภาพที่เป็นไปได้สำหรับการปรับข้อมูลด้วย 3 ยิ่งมีการแนะนำพารามิเตอร์มากเท่าใดความพอดีที่สมบูรณ์แบบก็จะยิ่งมากขึ้นเช่นเดียวกับค่าคงที่ที่เพียงพอหนึ่งสามารถ " พอดีช้าง " นี่คือการกระจายตัวพอดีกับผลรวมของ 3 เส้นโค้ง (Gaussian): เหล่านี้คือข้อมูลสำหรับการฟิต ฉันไม่แน่ใจว่าควรใช้แบบทดสอบแบบใดเพื่อตรวจสอบความเหมาะสม ข้อมูลประกอบด้วย 91 คะแนน 1 ฟังก์ชั่นปกติ: RSS: 1.06231 X ^ 2: 3.1674 F.Test: 0.3092 2 ฟังก์ชั่นปกติ: RSS: 0.010939 X ^ 2: 0.053896 F.Test: 0.97101 3 ฟังก์ชั่นปกติ: RSS: 0.00536 X …

1
เกณฑ์การคำนวณสำหรับตัวแยกประเภทความเสี่ยงขั้นต่ำ
สมมติว่าสองชั้นและมีแอตทริบิวต์และมีการกระจายและ0.5) หากเรามีค่าเท่ากับก่อนหน้าสำหรับเมทริกซ์ต้นทุนต่อไปนี้:C 2 x N ( 0 , 0.5 ) N ( 1 , 0.5 ) P ( C 1 ) = P ( C 2 ) = 0.5ค1C1C_1ค2C2C_2xxxยังไม่มีข้อความ( 0 , 0 . 5 )N(0,0.5) \cal{N} (0, 0.5)ยังไม่มีข้อความ( 1 , 0 . 5 )N(1,0.5) \cal{N} (1, 0.5)P( C1) = P( …

2
พล็อต QQ ใน Python
ฉันสร้างพล็อต qq โดยใช้รหัสต่อไปนี้ ฉันรู้ว่าพล็อต qq ใช้เพื่อตรวจสอบว่ามีการเผยแพร่ข้อมูลตามปกติหรือไม่ คำถามของฉันคือสิ่งที่ป้ายแกน x และ y ระบุในพล็อต qq และค่า r กำลังสองที่ระบุคืออะไร? N = 1200 p = 0.53 q = 1000 obs = np.random.binomial(N, p, size = q)/N import scipy.stats as stats z = (obs-np.mean(obs))/np.std(obs) stats.probplot(z, dist="norm", plot=plt) plt.title("Normal Q-Q plot") plt.show() ฉันรู้แล้วว่ามีการอภิปรายเกี่ยวกับเรื่องqqแต่ฉันไม่เข้าใจแนวคิดของการสนทนา

1
ซึ่งมาบรรจบกันเร็วกว่าค่าเฉลี่ยหรือค่ามัธยฐาน?
ถ้าฉันวาดตัวแปร iid จาก N (0,1) ค่าเฉลี่ยหรือค่ามัธยฐานจะมาบรรจบกันเร็วขึ้นหรือไม่ เร็วเท่าไหร่ หากต้องการเจาะจงมากขึ้นปล่อยให้เป็นลำดับของตัวแปร iid ที่ดึงมาจาก N (0,1) กำหนดและเป็นค่ามัธยฐานของ . ซึ่งมารวมกันเป็น 0 เร็วกว่าหรือ ?x1,x2,…x1,x2,…x_1, x_2, \ldots x¯n=1n∑ni=1xix¯n=1n∑i=1nxi\bar{x}_n = \frac{1}{n}\sum_{i=1}^n x_ix~nx~n\tilde{x}_n{x1,x2,…xn}{x1,x2,…xn}\{x_1, x_2, \ldots x_n\}{x¯n}{x¯n}\{\bar{x}_n\}{x~n}{x~n}\{\tilde{x}_n\} สำหรับการเห็นพ้องกันว่าการรวมกันเร็วขึ้นหมายถึงอะไร:อยู่หรือไม่ ถ้าเป็นเช่นนั้นมันคืออะไร?limn→∞Var(X¯n)/Var(X~n)limn→∞Var(X¯n)/Var(X~n)\lim_{n \to \infty} Var(\bar{X}_n)/Var(\tilde{X}_n)

2
ประมาณอัตราที่เครื่องชั่งเบี่ยงเบนมาตรฐานที่มีตัวแปรอิสระ
ฉันมีการทดลองในที่ที่ฉันกำลังการวัดของการกระจายตามปกติตัวแปรYYY , Y∼ N( μ , σ)Y∼N(μ,σ)Y \sim N(\mu,\sigma) อย่างไรก็ตามการทดลองก่อนหน้านี้ได้มีหลักฐานบางอย่างที่เบี่ยงเบนมาตรฐานσσ\sigmaเป็นฟังก์ชั่นเลียนแบบของตัวแปรอิสระคือXXX σ= a | X| +bσ=a|X|+b\sigma = a|X| + b Y∼ N( μ , a | X| +b)Y∼N(μ,a|X|+b)Y \sim N(\mu,a|X| + b) ฉันต้องการที่จะประเมินค่าพารามิเตอร์และBโดยการสุ่มตัวอย่างYที่หลายค่าของX นอกจากนี้เนื่องจากข้อ จำกัด ในการทดสอบฉันสามารถใช้ตัวอย่างYจำนวน จำกัด (ประมาณ 30-40) เท่านั้นและต้องการสุ่มตัวอย่างที่ค่าXหลาย ๆ ค่าด้วยเหตุผลการทดลองที่ไม่เกี่ยวข้อง ได้รับข้อ จำกัด เหล่านี้สิ่งที่วิธีการที่มีอยู่ในการประมาณการและข ?aaaขbbYYYXXXYYYXXXaaaขbb คำอธิบายการทดลอง นี่เป็นข้อมูลเพิ่มเติมถ้าคุณสนใจว่าทำไมฉันถึงถามคำถามข้างต้น การทดลองของฉันวัดการรับรู้ทางสายตาและภาพ ฉันมีตั้งค่าการทดสอบที่ฉันสามารถนำเสนอทั้งการได้ยินหรือการมองเห็นเป้าหมายจากสถานที่ที่แตกต่างกัน, , …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.