คำถามติดแท็ก distributions

การแจกแจงเป็นการอธิบายทางคณิตศาสตร์ของความน่าจะเป็นหรือความถี่

6
ฉันจะวิเคราะห์ด้วยวิธีพิสูจน์ได้อย่างไรว่าการแบ่งจำนวนเงินแบบสุ่มส่งผลให้เกิดการแจกแจงแบบเลขชี้กำลัง (เช่นรายได้และความมั่งคั่ง)
ในบทความปัจจุบันในวิทยาศาสตร์นี้มีการเสนอต่อไปนี้: สมมติว่าคุณแบ่งรายได้ 500 ล้านคนจาก 10,000 คน มีทางเดียวเท่านั้นที่จะให้ทุกคนมีส่วนร่วมได้ 50,000 หุ้น ดังนั้นหากคุณกำลังหารายได้แบบสุ่มความเท่าเทียมนั้นเป็นไปได้ยากมาก แต่มีวิธีนับไม่ถ้วนที่จะมอบเงินจำนวนมากให้กับคนจำนวนน้อยและคนจำนวนมากมีน้อยหรือไม่มีเลย ตามจริงแล้วทุกวิธีที่คุณสามารถแบ่งรายได้ส่วนใหญ่ผลิตรายได้แบบเอ็กซ์โปเนนเชียล ฉันทำสิ่งนี้ด้วยรหัส R ต่อไปนี้ซึ่งดูเหมือนว่าจะยืนยันผล: library(MASS) w <- 500000000 #wealth p <- 10000 #people d <- diff(c(0,sort(runif(p-1,max=w)),w)) #wealth-distribution h <- hist(d, col="red", main="Exponential decline", freq = FALSE, breaks = 45, xlim = c(0, quantile(d, 0.99))) fit <- fitdistr(d,"exponential") curve(dexp(x, rate …

5
การแจกแจงความน่าจะเป็นสำหรับความน่าจะเป็นที่ต่างกัน
ถ้าฉันต้องการได้ความน่าจะเป็น 9 ครั้งในการทดลอง 16 ครั้งต่อการทดลองแต่ละครั้งมีความน่าจะเป็น 0.6 ฉันสามารถใช้การแจกแจงทวินาม ฉันจะใช้อะไรได้ถ้าการทดลอง 16 ครั้งแต่ละครั้งมีความน่าจะเป็นที่แตกต่างกัน

4
การแจกแจงจะมีค่าเฉลี่ยและความแปรปรวนไม่สิ้นสุดได้อย่างไร
มันจะได้รับการชื่นชมถ้าตัวอย่างต่อไปนี้จะได้รับ: การแจกแจงที่มีค่าเฉลี่ยไม่สิ้นสุดและความแปรปรวนแบบไม่สิ้นสุด การแจกแจงที่มีค่าเฉลี่ยไม่สิ้นสุดและความแปรปรวนแน่นอน การกระจายที่มีค่าเฉลี่ย จำกัด และความแปรปรวนอนันต์ การแจกแจงที่มีค่าเฉลี่ยและความแปรปรวนแน่นอน มันมาจากฉันเห็นคำศัพท์ที่ไม่คุ้นเคยเหล่านี้ (ค่าเฉลี่ยอนันต์, ความแปรปรวนอนันต์) ที่ใช้ในบทความที่ฉันอ่านอ่านและอ่านหัวข้อบนฟอรัม / เว็บไซต์ Wilmottและไม่พบคำอธิบายที่ชัดเจนเพียงพอ ฉันยังไม่พบคำอธิบายใด ๆ ในหนังสือเรียนของฉันเอง

4
ผลรวมทั่วไปของตัวแปรสุ่มแกมมา
ฉันได้อ่านแล้วว่าผลรวมของตัวแปรสุ่มแกมมาที่มีพารามิเตอร์ระดับเดียวกันเป็นตัวแปรสุ่มแกมมาอีกตัว ฉันยังได้เห็นกระดาษโดยMoschopoulosอธิบายวิธีการรวมของชุดสุ่มของตัวแปรสุ่มแกมมา ฉันได้ลองใช้วิธีการของ Moschopoulosแต่ยังไม่ประสบความสำเร็จ การสรุปชุดตัวแปรสุ่มแบบทั่วไปของแกมมามีลักษณะอย่างไร ในการทำให้คำถามนี้เป็นรูปธรรมสิ่งที่ดูเหมือนจะเป็น: Gamma(3,1)+Gamma(4,2)+Gamma(5,1)Gamma(3,1)+Gamma(4,2)+Gamma(5,1)\text{Gamma}(3,1) + \text{Gamma}(4,2) + \text{Gamma}(5,1) หากพารามิเตอร์ด้านบนไม่แสดงเป็นพิเศษโปรดแนะนำผู้อื่น

11
ค่าเบี่ยงเบนสัมบูรณ์เฉลี่ยกับส่วนเบี่ยงเบนมาตรฐาน
ในหนังสือข้อความ"คณิตศาสตร์ที่ครอบคลุมแบบใหม่สำหรับระดับ O"โดยเกรียร์ (1983) ฉันเห็นการเบี่ยงเบนเฉลี่ยที่คำนวณดังนี้: สรุปความแตกต่างที่แน่นอนระหว่างค่าเดียวกับค่าเฉลี่ย จากนั้นรับค่าเฉลี่ย ตลอดบทที่ระยะเบี่ยงเบนเฉลี่ยจะใช้ แต่ฉันเพิ่งเห็นการอ้างอิงหลายอย่างที่ใช้ค่าเบี่ยงเบนมาตรฐานของคำศัพท์และนี่คือสิ่งที่พวกเขาทำ: คำนวณกำลังสองของความแตกต่างระหว่างค่าเดียวกับค่าเฉลี่ย จากนั้นรับค่าเฉลี่ยและในที่สุดก็เป็นรากของคำตอบ ฉันลองทั้งสองวิธีในชุดข้อมูลทั่วไปและคำตอบต่างกัน ฉันไม่ใช่นักสถิติ ฉันสับสนในขณะที่พยายามสอนการเบี่ยงเบนให้กับลูก ๆ ของฉัน ดังนั้นในระยะสั้นค่าเบี่ยงเบนมาตรฐานของคำศัพท์และค่าเบี่ยงเบนเฉลี่ยเท่ากันหรือเป็นตำราตำราเก่าของฉันหรือไม่

2
เหตุใดการทดสอบอัตราส่วนความน่าจะเป็นกระจายแบบไคสแควร์
ทำไมสถิติการทดสอบของการทดสอบอัตราส่วนความน่าจะเป็นแบบกระจายไคสแควร์ 2(ln Lalt model−ln Lnull model)∼χ2dfalt−dfnull2(ln⁡ Lalt model−ln⁡ Lnull model)∼χdfalt−dfnull22(\ln \text{ L}_{\rm alt\ model} - \ln \text{ L}_{\rm null\ model} ) \sim \chi^{2}_{df_{\rm alt}-df_{\rm null}}

3
เหตุใดจึงมีความแตกต่างระหว่างการคำนวณช่วงความเชื่อมั่นแบบโลจิสติก 95% ด้วยตนเองและการใช้ฟังก์ชัน confint () ใน R
เรียนคุณทุกคน - ฉันสังเกตเห็นบางสิ่งแปลก ๆ ที่ไม่สามารถอธิบายได้ไหม โดยสรุป: แนวทางแบบแมนนวลเพื่อคำนวณช่วงความมั่นใจในโมเดลการถดถอยโลจิสติกและฟังก์ชัน R confint()ให้ผลลัพธ์ที่แตกต่างกัน ฉันเคยผ่านการถดถอยโลจิสติกประยุกต์ของ Hosmer & Lemeshow แล้ว (ฉบับที่ 2) ในบทที่ 3 มีตัวอย่างของการคำนวณอัตราส่วนอัตราต่อรองและช่วงความมั่นใจ 95% ด้วย R ฉันสามารถสร้างโมเดลได้อย่างง่ายดาย: Call: glm(formula = dataset$CHD ~ as.factor(dataset$dich.age), family = "binomial") Deviance Residuals: Min 1Q Median 3Q Max -1.734 -0.847 -0.847 0.709 1.549 Coefficients: Estimate Std. Error z value …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 


2
การแจกแจงอื่นนอกเหนือจากปกติที่ค่าเฉลี่ยและความแปรปรวนเป็นอิสระ
ฉันสงสัยว่ามีการแจกแจงนอกเหนือจากปกติที่ค่าเฉลี่ยและความแปรปรวนเป็นอิสระจากกัน (หรือกล่าวอีกนัยหนึ่งซึ่งความแปรปรวนไม่ใช่หน้าที่ของค่าเฉลี่ย)

1
การกระจายของพารามิเตอร์ใน BUGS และ R แตกต่างกันอย่างไร?
ฉันได้พบการแจกแจงบางอย่างซึ่ง BUGS และ R มีพารามิเตอร์ต่างกัน: Normal, log-Normal และ Weibull สำหรับแต่ละสิ่งเหล่านี้ฉันรวบรวมว่าพารามิเตอร์ตัวที่สองที่ใช้โดย R จำเป็นต้องแปลงผกผัน (1 / พารามิเตอร์) ก่อนที่จะใช้ใน BUGS (หรือ JAGS ในกรณีของฉัน) ไม่มีใครทราบรายการที่ครอบคลุมของการเปลี่ยนแปลงเหล่านี้ที่มีอยู่ในปัจจุบัน? ที่ใกล้เคียงที่สุดที่ฉันสามารถหาได้คือการเปรียบเทียบการแจกแจงในตารางที่ 7 ของคู่มือผู้ใช้ JAGS 2.2.0กับผลลัพธ์?rnormอื่น ๆ และอาจเป็นข้อความความน่าจะเป็นบางอย่าง วิธีนี้ดูเหมือนจะต้องการการแปลงที่จะต้องมีการอนุมานจากไฟล์ PDF แยกต่างหาก ฉันต้องการหลีกเลี่ยงงานนี้ (และข้อผิดพลาดที่เป็นไปได้) หากทำไปแล้วหรือเริ่มรายการที่นี่ ปรับปรุง ตามคำแนะนำของเบ็นฉันได้เขียนฟังก์ชั่นต่อไปนี้เพื่อแปลงดาต้าเฟรมของพารามิเตอร์จาก R เป็น BUGS parameterization ##' convert R parameterizations to BUGS paramaterizations ##' ##' R …

6
ใครบางคนสามารถเสนอตัวอย่างของการแจกแจงแบบ unimodal ที่มีความเบ้ของศูนย์ แต่ที่ไม่สมมาตร?
ในเดือนพฤษภาคม 2553 ผู้ใช้วิกิพีเดีย Mcorazao เพิ่มประโยคหนึ่งในบทความความเบ้ว่า "ค่าศูนย์ระบุว่าค่านั้นมีการกระจายอย่างเท่าเทียมกันทั้งสองด้านของค่าเฉลี่ยซึ่งโดยทั่วไปแล้ว อย่างไรก็ตามหน้าวิกิไม่มีตัวอย่างจริงของการแจกแจงที่ทำลายกฎนี้ Googling "ตัวอย่างการแจกแจงแบบอสมมาตรที่มีความเบ้เป็นศูนย์" ยังไม่มีตัวอย่างจริงอย่างน้อยในผลลัพธ์ 20 รายการแรก การใช้คำจำกัดความที่คำนวณความเอียงโดยE[(X−μσ)3]E⁡[(X−μσ)3] \operatorname{E}\Big[\big(\tfrac{X-\mu}{\sigma}\big)^{\!3}\, \Big]และสูตร R sum((x-mean(x))^3)/(length(x) * sd(x)^3) ฉันสามารถสร้างการกระจายตัวเล็ก ๆ ตามอำเภอใจเพื่อทำให้ความเบ้ต่ำ ตัวอย่างเช่นการกระจาย x = c(1, 3.122, 5, 4, 1.1) อัตราผลตอบแทนเอียงของ5} แต่นี่คือตัวอย่างเล็ก ๆ และยิ่งกว่านั้นความเบี่ยงเบนจากสมมาตรก็ไม่ใหญ่ ดังนั้นเป็นไปได้หรือไม่ที่จะสร้างการกระจายตัวที่ใหญ่ขึ้นด้วยจุดสูงสุดที่มีความไม่สมดุลสูง แต่ก็ยังมีความเบ้ของศูนย์เกือบอยู่หรือ−5.64947⋅10−5−5.64947⋅10−5-5.64947\cdot10^{-5}

3
ข้อมูลของฉันมีการกระจายแบบใด
ให้เราบอกว่าฉันมีส่วนประกอบ 1,000 รายการและฉันได้รวบรวมข้อมูลเกี่ยวกับความล้มเหลวของบันทึกเหล่านี้กี่ครั้งและทุกครั้งที่พวกเขาบันทึกความล้มเหลวฉันยังติดตามว่าทีมของฉันใช้เวลานานแค่ไหนในการแก้ไขปัญหา ในระยะสั้นฉันได้รับการบันทึกเวลาในการซ่อมแซม (ในไม่กี่วินาที) สำหรับแต่ละองค์ประกอบ 1,000 เหล่านี้ ข้อมูลจะได้รับเมื่อสิ้นสุดคำถามนี้ ฉันเอาค่าเหล่านี้ทั้งหมดแล้วดึงกราฟ Cullen และ Frey เป็น R โดยใช้descdistจากfitdistrplusแพ็คเกจ ความหวังของฉันคือการเข้าใจว่าเวลาในการซ่อมแซมเป็นไปตามการแจกจ่ายเฉพาะ นี่คือพล็อตที่มีboot=500เพื่อรับค่า bootstrapped: ฉันเห็นว่าพล็อตนี้กำลังบอกฉันว่าการสังเกตตกอยู่ในการแจกแจงเบต้า (หรืออาจจะไม่ในกรณีนี้มันคืออะไรเปิดเผย) ตอนนี้เมื่อพิจารณาว่าฉันเป็นสถาปนิกระบบและไม่ใช่สถิติสถิติพล็อตนี้เปิดเผยอะไร ? (ฉันกำลังมองหาสัญชาตญาณในโลกแห่งความเป็นจริงที่อยู่เบื้องหลังผลการค้นหาเหล่านี้) แก้ไข: QQplot โดยใช้ฟังก์ชั่นในแพคเกจqqPlot carฉันก่อนประมาณพารามิเตอร์รูปร่างและขนาดโดยใช้fitdistrฟังก์ชั่น > fitdistr(Data$Duration, "weibull") shape scale 3.783365e-01 5.273310e+03 (6.657644e-03) (3.396456e+02) จากนั้นฉันทำสิ่งนี้: qqPlot(LB$Duration, distribution="weibull", shape=3.783365e-01, scale=5.273310e+03) แก้ไข 2: การอัพเดตด้วย QQplot lognormal นี่คือข้อมูลของฉัน: c(1528L, 285L, …

4
หมายความว่าโหมด = แปลว่าการกระจายแบบสมมาตรหรือไม่?
ฉันรู้ว่าคำถามนี้ถูกถามด้วย case Mean = มัธยฐาน แต่ฉันไม่พบสิ่งใดที่เกี่ยวข้องกับโหมด Mean = หากโหมดเท่ากับค่าเฉลี่ยฉันสามารถสรุปได้ว่านี่คือการแจกแจงแบบสมมาตรหรือไม่? ฉันจะถูกบังคับให้รู้ค่ามัธยฐานด้วยวิธีนี้หรือไม่?

2
ทำไมเราควรใช้ข้อผิดพลาด t แทนข้อผิดพลาดปกติ?
ในบล็อกโพสต์นี้โดย Andrew Gelman มีข้อความต่อไปนี้: แบบจำลองของ Bayesian เมื่อ 50 ปีที่แล้วดูเรียบง่ายอย่างสิ้นหวัง (ยกเว้นแน่นอนสำหรับปัญหาง่าย ๆ ) และฉันคาดหวังว่าแบบจำลองของ Bayesian ในวันนี้จะดูเรียบง่ายอย่างสิ้นหวัง 50 ปี (สำหรับตัวอย่างง่ายๆ: เราควรใช้ t แทนข้อผิดพลาดทั่วไปทุกที่ทุกเวลา แต่เรายังไม่ทำเช่นนี้เพราะความคุ้นเคยนิสัยและความสะดวกสบายทางคณิตศาสตร์สิ่งเหล่านี้อาจเป็นเหตุผลที่ดี ในการเมืองอนุรักษ์นิยมมีข้อโต้แย้งที่ดีหลายประการ - แต่ฉันคิดว่าท้ายที่สุดเมื่อเราคุ้นเคยกับแบบจำลองที่ซับซ้อนกว่านี้เราจะไปในทิศทางนั้น) ทำไมเราควร "ใช้ t เป็นประจำแทนที่จะเป็นข้อผิดพลาดทั่วไปทุกที่"

8
มีการกระจายรูปที่ราบสูงหรือไม่?
ฉันกำลังมองหาการกระจายที่ความหนาแน่นของความน่าจะเป็นลดลงอย่างรวดเร็วหลังจากบางจุดห่างจากค่าเฉลี่ยหรือในคำพูดของฉันเป็น "การกระจายตัวของรูปที่ราบสูง" บางสิ่งบางอย่างในระหว่าง Gaussian และเครื่องแบบ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.