คำถามติดแท็ก normal-distribution

การแจกแจงแบบปกติหรือแบบเกาส์เซียนนั้นมีฟังก์ชั่นความหนาแน่นซึ่งเป็นเส้นโค้งรูประฆังแบบสมมาตร มันเป็นหนึ่งในการแจกแจงที่สำคัญที่สุดในสถิติ ใช้แท็ก [normality] เพื่อสอบถามเกี่ยวกับการทดสอบหา normality

4
วิธีการคำนวณค่าเบี่ยงเบนมาตรฐานแบบ 2 มิติด้วยค่าเฉลี่ย 0 ล้อมรอบด้วยขีด จำกัด
ปัญหาของฉันเป็นดังนี้: ฉันวาง 40 ลูกในคราวเดียวจากจุดหนึ่งไม่กี่เมตรเหนือพื้น ลูกบอลกลิ้งและมาพัก เมื่อใช้สายตาคอมพิวเตอร์ฉันคำนวณจุดศูนย์กลางมวลในระนาบ XY ฉันสนใจเฉพาะระยะทางจากจุดศูนย์กลางของมวลไปยังลูกบอลแต่ละลูกซึ่งคำนวณโดยใช้รูปทรงเรขาคณิตที่เรียบง่าย ตอนนี้ฉันอยากรู้ค่าเบี่ยงเบนมาตรฐานด้านเดียวจากศูนย์กลาง ดังนั้นฉันจะสามารถรู้ได้ว่ามีลูกบอลจำนวนหนึ่งอยู่ในรัศมี std หนึ่งลูกมากกว่าภายในรัศมี 2 * std เป็นต้น ฉันจะคำนวณค่าเบี่ยงเบนมาตรฐานด้านเดียวได้อย่างไร วิธีการปกติจะระบุว่าครึ่งหนึ่งของลูกบอลอยู่ใน "ด้านลบ" ของค่าเฉลี่ย 0 แน่นอนว่าไม่มีเหตุผลในการทดลองนี้ ฉันต้องตรวจสอบให้แน่ใจว่าลูกบอลเป็นไปตามการกระจายมาตรฐานหรือไม่ ขอบคุณสำหรับความช่วยเหลือ

4
รูปแบบประวัติเหตุการณ์แบบไม่ต่อเนื่อง (การอยู่รอด) ใน R
ฉันกำลังพยายามปรับโมเดลที่ไม่ต่อเนื่องใน R แต่ฉันไม่แน่ใจว่าจะทำอย่างไร ฉันได้อ่านแล้วว่าคุณสามารถจัดระเบียบตัวแปรตามในแถวต่างกันหนึ่งตัวสำหรับแต่ละการสังเกตเวลาและการใช้glmฟังก์ชั่นที่มีลิงค์ logit หรือ cloglog ในแง่นี้ฉันมีสามคอลัมน์: ID, Event(1 หรือ 0 ในแต่ละช่วงเวลา) และTime Elapsed(ตั้งแต่จุดเริ่มต้นของการสังเกต) รวมทั้ง covariates อื่น ๆ ฉันจะเขียนรหัสเพื่อให้พอดีกับรุ่นได้อย่างไร ตัวแปรตามคืออะไร ฉันเดาว่าฉันสามารถใช้Eventเป็นตัวแปรตามและรวมTime Elapsedอยู่ใน covariates แต่สิ่งที่เกิดขึ้นกับID? ฉันต้องการมันไหม ขอบคุณ
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

1
R ตัวแปรเชิงเส้นถดถอยหมวดหมู่ "ซ่อน" ค่า
นี่เป็นเพียงตัวอย่างที่ฉันเจอหลายครั้งดังนั้นฉันจึงไม่มีข้อมูลตัวอย่าง ใช้แบบจำลองการถดถอยเชิงเส้นใน R: a.lm = lm(Y ~ x1 + x2) x1เป็นตัวแปรต่อเนื่อง x2เป็นหมวดหมู่และมีสามค่าเช่น "ต่ำ", "ปานกลาง" และ "สูง" อย่างไรก็ตามเอาต์พุตที่กำหนดโดย R จะเป็นดังนี้: summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 ฉันเข้าใจว่า R แนะนำการเข้ารหัสแบบหลอกบางอย่างเกี่ยวกับปัจจัยดังกล่าว ( …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

1
ประสิทธิภาพแบบเกาส์หมายความว่าอย่างไร
ในกรณีที่เครื่องประมาณที่มีประสิทธิภาพประสิทธิภาพของเกาส์หมายถึงอะไร ตัวอย่างเช่นQnQnQ_{_n} มีประสิทธิภาพแบบเกาส์ 82% และจุดแบ่ง 50% การอ้างอิงคือ: Rousseeuw PJ และ Croux, C. (1993) “ ทางเลือกในการเบี่ยงเบนสัมบูรณ์แบบมัธยฐาน” เจอเมริกันสถิติรอง, 88, 1273-1283

1
อะไรคือความหมายและความแปรปรวนของตัวแปรหลายตัวแปรที่ถูกตัด 0
ให้จะอยู่ใน d เมทริกซ์ความแปรปรวนร่วมและความแปรปรวนร่วมของ (ด้วย elementwise ที่คำนวณได้สูงสุด) คืออะไรZ∼N(μ,Σ)Z∼N(μ,Σ)Z \sim \mathcal N(\mu, \Sigma)RdRd\mathbb R^dZ+=max(0,Z)Z+=max(0,Z)Z_+ = \max(0, Z) สิ่งนี้เกิดขึ้นเช่นเพราะถ้าเราใช้ฟังก์ชั่นการเปิดใช้งาน ReLU ภายในเครือข่ายที่ลึกและสมมติว่าผ่าน CLT ที่อินพุตไปยังเลเยอร์ที่กำหนดนั้นเป็นปกติประมาณนี่คือการแจกแจงของเอาท์พุต (ฉันแน่ใจว่ามีคนจำนวนมากคำนวณไว้ก่อนหน้านี้ แต่ฉันไม่พบผลลัพธ์ที่ปรากฏในที่ใด ๆ ในวิธีที่อ่านได้อย่างสมเหตุสมผล)

1
สูตรการแจกแจงแบบปกติของ CDF ผกผันคืออะไร
ไม่มีใครรู้ว่าฟังก์ชันการกระจายแบบผกผันของการแจกแจงแบบปกติคืออะไร? มันมีการแสดงออกในรูปแบบปิดหรือไม่? ฉันไม่พบคำตอบที่ดีเมื่อใช้ Google


1
เมื่อใดที่ควรเขียน“ เราถือว่าการแจกแจงแบบปกติ” ของการวัดเชิงประจักษ์?
มันฝังแน่นอยู่ในการสอนวิชาประยุกต์เช่นยาการวัดปริมาณไบโอ - แพทย์ในประชากรตามปกติ "ระฆังโค้ง" การค้นหาสตริง" Google เราถือว่าการแจกแจงแบบปกติ"ของ Google ส่งคืน23 , 90023,900\small 23,900ผล! พวกเขาดูเหมือนว่า"จากจุดข้อมูลจำนวนมากเราคาดว่าจะมีการแจกแจงแบบปกติสำหรับความผิดปกติของอุณหภูมิ"ในการศึกษาเกี่ยวกับการเปลี่ยนแปลงสภาพภูมิอากาศ หรือ"เราสันนิษฐานว่าการแจกจ่ายวันที่ฟักลูกไก่ปกติ"บนเอกสารที่อาจเป็นที่ถกเถียงกันน้อยเกี่ยวกับเพนกวิน หรือ "เราสันนิษฐานว่าการกระจายปกติของ GDP แรงกระแทกการเจริญเติบโต"หมายถึงการเปลี่ยนเศรษฐกิจมหภาคในตลาด (นำขึ้นกับหน่วยความจำหนังสือเล่มนี้ ... และสิ่งอื่น ๆ ) เมื่อเร็ว ๆ นี้ฉันพบว่าตัวเองตั้งคำถามกับการรักษาข้อมูลการนับที่กระจายตามปกติเนื่องจากลักษณะเชิงบวกของพวกเขาอย่างเคร่งครัด แน่นอนว่าการนับข้อมูลนั้นไม่ต่อเนื่องทำให้เป็นเรื่องปกติมากขึ้น แต่ถึงแม้จะทิ้งประเด็นหลังนี้ไว้ทำไมการวัดเชิงประจักษ์อย่างต่อเนื่องเช่นน้ำหนักส่วนสูงหรือความเข้มข้นของกลูโคสซึ่งถือว่าเป็นต้นแบบ "ต่อเนื่อง" ถือว่าเป็นเรื่องปกติ พวกเขาไม่สามารถสังเกตการรับรู้เชิงลบได้มากกว่าการนับ! ฉันเข้าใจว่าเมื่อค่าเบี่ยงเบนมาตรฐานต่ำกว่าค่าเฉลี่ยแสดงค่าลบเล็กน้อย ("การตรวจสอบช่วง 95%") อาจเป็นข้อสมมติที่ใช้งานได้จริงและฮิสโทแกรมความถี่อาจรองรับหากไม่เบ้จนเกินไป แต่คำถามดูเหมือนจะไม่สำคัญและการค้นหาอย่างรวดเร็วให้สิ่งที่น่าสนใจ ในธรรมชาติเราสามารถค้นหาข้อความต่อไปนี้บนจดหมายจาก DF Heath : "ฉันต้องการชี้ให้เห็นว่าสำหรับการวิเคราะห์ทางสถิติของข้อมูลบางประเภทการสันนิษฐานว่าข้อมูลนั้นมาจากประชากรปกติมักจะผิดและทางเลือกอื่น ข้อสันนิษฐานของการกระจายล็อกปกติดีกว่าทางเลือกนี้ใช้กันอย่างแพร่หลายโดยนักสถิตินักเศรษฐศาสตร์และนักฟิสิกส์ แต่ด้วยเหตุผลบางอย่างมักจะถูกละเว้นโดยนักวิทยาศาสตร์ของสาขาอื่น ๆ " Limpert ตั้งข้อสังเกตว่า"แบบจำลองการบันทึกปกติอาจทำหน้าที่เป็นค่าประมาณในแง่ที่ว่านักวิทยาศาสตร์หลายคนรับรู้ปกติว่าเป็นการประมาณที่ถูกต้องในขณะนี้"ในขณะที่สังเกตการใช้พลังงานต่ำของการทดสอบแบบปกติที่ดี การกระจายที่ถูกต้องชัดเจนเมื่อต้องจัดการกับตัวอย่างเล็ก ๆ ดังนั้นคำถามคือ"เมื่อไหร่ที่จะยอมรับการกระจายตัวปกติของการวัดเชิงประจักษ์ในวิทยาศาสตร์ประยุกต์ที่ไม่มีหลักฐานสนับสนุนเพิ่มเติม?" …

2
การวาดตัวอย่างจากการแจกแจงปกติหลายตัวแปรภายใต้ข้อ จำกัด กำลังสอง
ผมอยากจะได้อย่างมีประสิทธิภาพวาดตัวอย่างจากภายใต้ข้อ จำกัด ที่|| x || _2 = 1x∈Rdx∈Rdx \in \mathbb{R}^dN(μ,Σ)N(μ,Σ)\mathcal{N}(\mu, \Sigma)||x||2=1||x||2=1||x||_2 = 1

1
กระบวนการใดในธรรมชาติที่มีการแจกจ่ายปกติหรือไม่
มีคนพูดถึงความสำคัญของการแจกแจงแบบปกติในธรรมชาติ การวัดจำนวนมากเช่นส่วนสูงหรือน้ำหนักนั้นมีการกระจายโดยทั่วไปประมาณ แต่พวกเขาก็ไม่ปกติเท่าที่ฉันเข้าใจ เมื่อพิจารณาการแจกแจงแบบปกติเป็นหนึ่งในการแจกแจงแบบเอนโทรปีสูงสุดดูเหมือนว่าเป็นไปได้ที่ธรรมชาติควร "ชอบ" แต่หลังจากความคิดบางอย่างฉันไม่สามารถหาตัวอย่างของตัวแปรสุ่มแบบ "จริง ๆ " ได้ คำถามของฉันคือตัวอย่างที่ดีของตัวแปรสุ่มแบบกระจายที่แน่นอน

1
X, Y คือ iid จาก N (0,1) ความน่าจะเป็นที่ X> 2Y เป็นเท่าไหร่
ฉันคิดตั้งแต่มาจากและพวกเขามีความเป็นอิสระแล้วX, วายX,YX, Yยังไม่มีข้อความ( 0 , 1 )N(0,1)N(0,1) X- 2 YX−2YX - 2Yมีการกระจายของ5) แล้วมีความน่าจะเป็นของ1/2ยังไม่มีข้อความ( 0 , 5 )N(0,5)N(0, 5)X- 2 Y> 0X−2Y>0X-2Y > 01 / 21/21/2 ดังกล่าวข้างต้นดูเหมือนว่าถูกต้องให้ฉันแม้ว่ามันจะดูเหมือนว่าแล้ว จะมีความน่าจะเป็นของ1/2ดูเหมือนว่าผิดเล็กน้อย ฉันทำอะไรผิดหรือเปล่า?X> n YX>nYX>nY1 / 21/21/2

1
ความคาดหวังของสินค้าที่มีการสั่งซื้อสูงกว่าของการแจกแจงแบบปกติ
ฉันมีสองกระจายตามปกติตัวแปรและกับศูนย์ค่าเฉลี่ยและความแปรปรวนเมทริกซ์\ฉันสนใจในการพยายามที่จะคำนวณค่าของในแง่ของรายการของ\X1X1X_1X2X2X_2ΣΣ\SigmaE[X21X22]E[X12X22]E[X_1^2 X_2^2]ΣΣ\Sigma ฉันใช้กฎความน่าจะเป็นทั้งหมดเพื่อให้ได้ แต่ฉันไม่แน่ใจว่าสิ่งที่คาดหวังภายในจะลดลง มีวิธีอื่นที่นี่หรือไม่E[X21X22] = E[X21E[X22|X1] ]E[X12X22]=E[X12E[X22|X1]]E[X_1^2 X_2^2] = E[X_1^2 E[X_2^2 | X_1]] ขอบคุณ แก้ไข:ตัวแปรยังกระจายหลายตัวแปรตามปกติ

1
การประมาณความน่าจะเป็นสูงสุดมีการกระจายตัวแบบประมาณโดยประมาณอย่างไร
ฉันได้อ่านเกี่ยวกับ MLE เป็นวิธีการสร้างการกระจายที่เหมาะสม ฉันเจอข้อความที่บอกว่าการประมาณการความเป็นไปได้สูงสุด "มีการแจกแจงแบบปกติโดยประมาณ" นี่หมายความว่าถ้าฉันใช้ MLE ซ้ำหลายครั้งกับข้อมูลของฉันและตระกูลการแจกแจงที่ฉันพยายามจะพอดีโมเดลที่ฉันได้รับจะกระจายตามปกติหรือไม่ ลำดับการแจกแจงมีการกระจายอย่างไร

1
ค่าที่คาดหวังของสถิติการสั่งซื้อขั้นต่ำจากตัวอย่างปกติ
อัพเดท 25 มกราคม 2014: ความผิดพลาดได้รับการแก้ไขแล้ว โปรดเพิกเฉยค่าที่คำนวณได้ของค่าที่คาดหวังในภาพที่อัปโหลด - มันผิด - ฉันไม่ลบภาพเพราะมันได้สร้างคำตอบให้กับคำถามนี้ อัพเดท 10 มกราคม 2014: พบข้อผิดพลาด - พิมพ์ผิดทางคณิตศาสตร์ในหนึ่งในแหล่งที่ใช้ กำลังเตรียมการแก้ไข ... ความหนาแน่นของสถิติการสั่งซื้อขั้นต่ำจากการรวบรวมตัวแปรสุ่มแบบต่อเนื่อง iid ด้วย cdfและ pdfคือ nnnFX(x)FX(x)F_X(x)fX(x)fX(x)f_X(x)fX(1)(x(1))=nfX(x(1))[1−FX(x(1))]n−1[1]fX(1)(x(1))=nfX(x(1))[1−FX(x(1))]n−1[1]f_{X_{(1)}}(x_{(1)}) = nf_X(x_{(1)})\left[1-F_X(x_{(1)})\right]^{n-1} \qquad [1] หากตัวแปรสุ่มเหล่านี้เป็นมาตรฐานปกติแล้ว fX(1)(x(1))=nϕ(x(1))[1−Φ(x(1))]n−1=nϕ(x(1))[Φ(−x(1))]n−1[2]fX(1)(x(1))=nϕ(x(1))[1−Φ(x(1))]n−1=nϕ(x(1))[Φ(−x(1))]n−1[2]f_{X_{(1)}}(x_{(1)}) = n\phi(x_{(1)})\left[1-\Phi(x_{(1)})\right]^{n-1} = n\phi(x_{(1)})\left[\Phi(-x_{(1)})\right]^{n-1}\qquad [2] ดังนั้นค่าที่คาดหวังคือ E(X(1))=n∫∞−∞x(1)ϕ(x(1))[Φ(−x(1))]n−1dx(1)[3]E(X(1))=n∫−∞∞x(1)ϕ(x(1))[Φ(−x(1))]n−1dx(1)[3]E\left(X_{(1)}\right) = n\int_{-\infty}^{\infty}x_{(1)}\phi(x_{(1)})\left[\Phi(-x_{(1)})\right]^{n-1}dx_{(1)}\qquad [3] ที่เราได้ใช้คุณสมบัติสมมาตรของมาตรฐานปกติ ในโอเวน 1980 , p.402, eq. [ n, 011 …

1
ฟังก์ชันการสร้างช่วงเวลาของผลิตภัณฑ์ภายในของเวกเตอร์สุ่มเกาส์สองตัว
ใครช่วยได้โปรดแนะนำว่าฉันจะคำนวณฟังก์ชันสร้างโมเมนต์ของผลิตภัณฑ์ภายในของเวกเตอร์สุ่มแบบเกาส์สองตัวได้อย่างไรแต่ละแบบกระจายเป็นเป็นอิสระจากกัน? มีผลลัพธ์มาตรฐานสำหรับสิ่งนี้ไหม ตัวชี้ใด ๆ ที่ชื่นชมอย่างมากยังไม่มีข้อความ( 0 ,σ2)N(0,σ2)\mathcal N(0,\sigma^2)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.