คำถามติดแท็ก pdf

ฟังก์ชันความหนาแน่นน่าจะเป็น (PDF) ของตัวแปรสุ่มแบบต่อเนื่องให้ความน่าจะเป็นสัมพัทธ์สำหรับแต่ละค่าที่เป็นไปได้ ใช้แท็กนี้สำหรับฟังก์ชันมวลความน่าจะเป็นแบบแยก (PMF) เช่นกัน

6
มูลค่าการแจกแจงความน่าจะเป็นที่เกิน 1 สามารถเป็นได้หรือไม่?
ในหน้า Wikipedia เกี่ยวกับตัวแยกประเภทซื่อๆ Bayesมีบรรทัดนี้: p(height|male)=1.5789p(height|male)=1.5789p(\mathrm{height}|\mathrm{male}) = 1.5789 (การกระจายความน่าจะเป็นที่มากกว่า 1 คือ OK มันคือพื้นที่ใต้เส้นโค้งระฆังที่เท่ากับ 1) ค่าจะตกลงได้อย่างไร? ผมคิดว่าน่าจะเป็นค่าทั้งหมดถูกแสดงในช่วง1 นอกจากนี้หากเป็นไปได้ที่จะมีค่าเช่นนั้นค่าที่ได้จากตัวอย่างที่แสดงในหน้าเป็นอย่างไร>1>1>10≤p≤10≤p≤10 \leq p \leq 1

10
ทำไมการแจกแจงโคชีจึงไม่มีความหมาย?
จากฟังก์ชันความหนาแน่นของการกระจายเราสามารถระบุค่าเฉลี่ย (= 0) สำหรับการแจกแจงโคชีเช่นเดียวกับกราฟด้านล่างที่แสดง แต่ทำไมเราถึงบอกว่าการกระจาย Cauchy นั้นไม่มีความหมายเลย?


3
การแปลความหมายของตัวทำนายการแปลงสภาพบันทึกและ / หรือการตอบสนอง
ฉันสงสัยว่ามันจะสร้างความแตกต่างในการตีความไม่ว่าจะเป็นเพียงขึ้นอยู่กับทั้งขึ้นอยู่กับและเป็นอิสระหรือตัวแปรอิสระเท่านั้นที่ถูกเปลี่ยนเข้าสู่ระบบ พิจารณากรณีของ log(DV) = Intercept + B1*IV + Error ฉันสามารถตีความ IV เป็นเปอร์เซ็นต์เพิ่มขึ้น แต่จะเปลี่ยนแปลงได้อย่างไรเมื่อฉันมี log(DV) = Intercept + B1*log(IV) + Error หรือเมื่อฉันมี DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

4
คุณจะคำนวณฟังก์ชันความหนาแน่นของความน่าจะเป็นของค่าสูงสุดของตัวอย่างของตัวแปรสุ่มชุด IID ได้อย่างไร
รับตัวแปรสุ่ม Y=max(X1,X2,…,Xn)Y=max(X1,X2,…,Xn)Y = \max(X_1, X_2, \ldots, X_n) โดยที่XiXiX_iเป็นตัวแปรชุด IID ฉันจะคำนวณ PDF ของYYYอย่างไร
45 pdf  maximum 

3
CDFs เป็นพื้นฐานมากกว่า PDF หรือไม่?
สถิติของฉันโดยทั่วไปกล่าวว่าหากได้รับหนึ่งในสามต่อไปนี้คุณสามารถค้นหาอีกสอง: ฟังก์ชันการแจกแจงสะสม ฟังก์ชั่นการสร้างช่วงเวลา ฟังก์ชั่นความหนาแน่นของความน่าจะเป็น แต่อาจารย์เศรษฐศาสตร์ของฉันกล่าวว่า CDFs เป็นพื้นฐานมากกว่า PDF เพราะมีตัวอย่างที่คุณสามารถมี CDF แต่ PDF ไม่ได้ถูกกำหนดไว้ CDFs เป็นพื้นฐานมากกว่า PDF หรือไม่? ฉันจะรู้ได้อย่างไรว่า PDF หรือ MGF สามารถมาจาก CDF ได้หรือไม่
43 probability  pdf  cdf  mgf 

3
คำอธิบายที่เข้าใจง่ายสำหรับความหนาแน่นของตัวแปรที่ถูกแปลง?
สมมติว่าXXXเป็นตัวแปรสุ่มที่มีรูปแบบไฟล์ PDF ฉX( x )fX(x)f_X(x) ) จากนั้นตัวแปรสุ่มY= X2Y=X2Y=X^2มี pdf ฉY( y) = { 12 ปี√( ฉX( y√) + fX( - y√) )0Y≥ 0Y<0fY(y)={12y(fX(y)+fX(−y))y≥00y<0f_Y(y)=\begin{cases}\frac{1}{2\sqrt{y}}\left(f_X(\sqrt{y})+f_X(-\sqrt{y})\right) & y \ge 0 \\ 0 & y \lt 0\end{cases} ฉันเข้าใจแคลคูลัสที่อยู่เบื้องหลังนี้ แต่ฉันพยายามคิดหาวิธีอธิบายให้คนที่ไม่รู้แคลคูลัส โดยเฉพาะฉันพยายามอธิบายว่าทำไมปัจจัย1y√1y\frac{1}{\sqrt{y}}ปรากฏขึ้นด้านหน้า ฉันจะแทงมัน: สมมติว่าXXXมีการแจกแจงแบบเกาส์ เกือบทั้งหมดน้ำหนักของไฟล์ PDF ที่อยู่ระหว่างค่าการพูด−3−3-3และ3.3.3.แต่แผนที่ที่ 0-9 สำหรับYYYYดังนั้นน้ำหนักหนักใน pdf สำหรับXXXได้รับการขยายในช่วงที่กว้างขึ้นของค่าในการเปลี่ยนแปลงที่จะYYYYดังนั้นสำหรับfY(y)fY(y)f_Y(y)ที่จะเป็นไฟล์ PDF ที่แท้จริงน้ำหนักที่หนักเป็นพิเศษจะต้องลดน้ำหนักโดยปัจจัยคูณ1y√1y\frac{1}{\sqrt{y}} ฟังดูเป็นยังไง? หากใครสามารถให้คำอธิบายที่ดีกว่าของพวกเขาเองหรือเชื่อมโยงไปยังหนึ่งในเอกสารหรือตำราเรียนฉันจะขอบคุณมันมาก ฉันพบตัวอย่างการเปลี่ยนแปลงตัวแปรนี้ในหนังสือคณิตศาสตร์สถิติ …

4
วิธีการที่ดีสำหรับแปลงความหนาแน่นของตัวแปรที่ไม่เป็นลบใน R?
plot(density(rexp(100)) เห็นได้ชัดว่าความหนาแน่นทั้งหมดทางด้านซ้ายของศูนย์แสดงถึงอคติ ฉันต้องการสรุปข้อมูลบางอย่างสำหรับผู้ที่ไม่ใช่นักสถิติและฉันต้องการหลีกเลี่ยงคำถามเกี่ยวกับสาเหตุที่ข้อมูลที่ไม่ใช่เชิงลบมีความหนาแน่นทางด้านซ้ายของศูนย์ แปลงสำหรับการตรวจสอบแบบสุ่ม ฉันต้องการแสดงการกระจายของตัวแปรโดยกลุ่มการรักษาและกลุ่มควบคุม การแจกแจงแบบ exponential-ish ฮิสโทแกรมมีความซับซ้อนด้วยเหตุผลหลายประการ ค้นหา Google อย่างรวดเร็วทำให้ผมทำงานโดยสถิติในเมล็ดที่ไม่ใช่เชิงลบเช่น: นี้ แต่มีการนำมาใช้ใน R หรือไม่? ของวิธีการดำเนินการใด ๆ ของพวกเขา "ดีที่สุด" อย่างใดสำหรับสถิติเชิงพรรณนา? แก้ไข: แม้ว่าfromคำสั่งสามารถแก้ไขปัญหาปัจจุบันของฉันได้ก็คงจะดีที่จะรู้ว่ามีใครใช้เมล็ดในวรรณคดีโดยใช้การประมาณความหนาแน่นแบบไม่ลบ

10
ทำไมการรวมตัวกันของตัวแปรสุ่มสองตัวจึงทำให้เกิดการโน้มน้าว?
เป็นเวลานานฉันไม่เข้าใจว่าทำไม "ผลรวม" ของตัวแปรสุ่มสองตัวคือการบิดของพวกเขาในขณะที่ผลรวมความหนาแน่นของฟังก์ชั่นการผสมของและคือf(x)f(x)f(x)g(x)g(x)g(x)pf(x)+(1−p)g(x)pf(x)+(1−p)g(x)p\,f(x)+(1-p)g(x); ผลรวมเลขคณิตและไม่ใช่การแปลง วลีที่ถูกต้อง "ผลรวมของตัวแปรสุ่มสองตัว" ปรากฏใน google 146,000 ครั้งและเป็นรูปไข่ดังนี้ ถ้าใครคิดว่า RV ให้ผลเป็นค่าเดียวก็สามารถเพิ่มค่าเดียวให้กับค่า RV เดี่ยวอีกค่าหนึ่งซึ่งไม่มีส่วนเกี่ยวข้องกับการโน้มน้าวใจอย่างน้อยก็ไม่ใช่โดยตรงสิ่งที่เป็นผลรวมของตัวเลขสองจำนวน ผลลัพธ์ของสถิติใน RV นั้นเป็นชุดของค่าและดังนั้นวลีที่แน่นอนยิ่งกว่าจะเป็นอะไรบางอย่างเช่น "ชุดของผลรวมของคู่ของค่าของแต่ละบุคคลที่เชื่อมโยงกันจากสอง RV's คือความไม่ต่อเนื่องของพวกเขา" ... และสามารถประมาณโดย ความหนาแน่นของฟังก์ชั่นความหนาแน่นสอดคล้องกับ RV เหล่านั้น ภาษาที่เรียบง่ายยิ่งขึ้น: 2 RV's ofnnnตัวอย่างอยู่ในผลเวกเตอร์สองมิติ n ที่เพิ่มเป็นผลรวมเวกเตอร์ โปรดแสดงรายละเอียดว่าผลรวมของตัวแปรสุ่มสองตัวนั้นเป็นรูปแบบ convolution และผลรวมอย่างไร

2
แกมมากับการแจกแจงล็อกปกติ
ฉันมีการแจกแจงที่สังเกตได้จากการทดลองซึ่งดูคล้ายกับการแจกแจงแกมม่าหรือ lognormal ฉันได้อ่านแล้วว่าการแจกแจงแบบล็อกนอเรนเป็นการแจกแจงความน่าจะเป็นเอนโทรปีสูงสุดสำหรับตัวแปรแบบสุ่มซึ่งค่าเฉลี่ยและความแปรปรวนของได้รับการแก้ไข การกระจายของแกมม่ามีคุณสมบัติคล้ายกันหรือไม่?XXXln(X)ln⁡(X)\ln(X)

4
วิธีการหาปริมาณ (แยก) ของการแจกแจงปกติหลายตัวแปร
ฉันสนใจว่าจะคำนวณการกระจายของหลายตัวแปรแบบควอไทล์ได้อย่างไร ในรูปฉันได้วาดควอนไทล์ 5% และ 95% ของการแจกแจงแบบปกติแบบไม่มีตัวแปร (ซ้าย) สำหรับการกระจายตัวแบบหลายตัวแปรที่ถูกต้องฉันจินตนาการว่าอะนาล็อกจะเป็นสายเดี่ยวที่ล้อมรอบฐานของฟังก์ชันความหนาแน่น ด้านล่างเป็นตัวอย่างของความพยายามของฉันในการคำนวณโดยใช้แพคเกจmvtnorm- แต่ไม่ประสบความสำเร็จ ฉันคิดว่าสิ่งนี้สามารถทำได้โดยการคำนวณรูปร่างของผลลัพธ์ของฟังก์ชันความหนาแน่นหลายตัวแปร แต่ฉันสงสัยว่ามีทางเลือกอื่น ( เช่นแบบอะนาล็อกqnorm) ขอบคุณสำหรับความช่วยเหลือของคุณ. ตัวอย่าง: mu <- 5 sigma <- 2 vals <- seq(-2,12,,100) ds <- dnorm(vals, mean=mu, sd=sigma) plot(vals, ds, t="l") qs <- qnorm(c(0.05, 0.95), mean=mu, sd=sigma) abline(v=qs, col=2, lty=2) #install.packages("mvtnorm") require(mvtnorm) n <- 2 mmu <- rep(mu, …

2
คุณสามารถอธิบายการประมาณความหนาแน่นของ Parzen window (kernel) ในแง่ของคนธรรมดาได้หรือไม่?
การประเมินความหนาแน่นของหน้าต่าง Parzen อธิบายไว้ดังนี้ p ( x ) = 1nΣi = 1n1ชั่วโมง2ϕ ( xผม- xชั่วโมง)p(x)=1n∑i=1n1h2ϕ(xi−xh) p(x)=\frac{1}{n}\sum_{i=1}^{n} \frac{1}{h^2} \phi \left(\frac{x_i - x}{h} \right) โดยที่คือจำนวนองค์ประกอบในเวกเตอร์,คือเวกเตอร์,คือความหนาแน่นของความน่าจะเป็นของ ,คือขนาดของหน้าต่าง Parzen และเป็นฟังก์ชันของหน้าต่างx p ( x ) x h ϕnnnxxxp ( x )p(x)p(x)xxxชั่วโมงhhφϕ\phi คำถามของฉันคือ: อะไรคือความแตกต่างพื้นฐานระหว่างฟังก์ชั่น Parzen Window และฟังก์ชั่นความหนาแน่นอื่น ๆ เช่นฟังก์ชั่นเกาส์เซียนเป็นต้น ฟังก์ชั่น Window Function ( ) ในการค้นหาความหนาแน่นของคืออะไร?xφϕ\phixxx ทำไมเราสามารถเสียบฟังก์ชั่นความหนาแน่นอื่น ๆ …


1
ฉันต้องตายหลายครั้งเพื่อประเมินความเป็นธรรมของมันอย่างมั่นใจหรือไม่?
(ขออภัยล่วงหน้าสำหรับการใช้ภาษาฆราวาสมากกว่าภาษาทางสถิติ) ถ้าฉันต้องการวัดอัตราต่อรองของการกลิ้งแต่ละด้านของแม่พิมพ์หกด้านทางกายภาพที่เฉพาะเจาะจงให้อยู่ภายใน +/- 2% ด้วยความมั่นใจอย่างสมเหตุสมผลมั่นใจว่าจะต้องมีตัวอย่างม้วนจำนวนเท่าใด นั่นคือฉันจะต้องหมุนกี่ครั้งนับผลแต่ละครั้งเพื่อให้แน่ใจ 98% ว่าโอกาสที่จะหมุนแต่ละด้านอยู่ในช่วง 14.6% - 18.7% (หรือบางเกณฑ์ที่คล้ายกันซึ่งจะมีประมาณ 98% แน่ใจว่าผู้ตายมีความยุติธรรมภายใน 2%) (นี่เป็นเรื่องจริงในโลกแห่งเกมการจำลองโดยใช้ลูกเต๋าและต้องการให้แน่ใจว่าการออกแบบของลูกเต๋านั้นยอมรับได้ใกล้กับโอกาสที่จะหมุนแต่ละหมายเลขได้ 1/6 ซึ่งมีการอ้างว่าการออกแบบของลูกเต๋าทั่วไปหลายตัวนั้น กลิ้งลูกเต๋าดังกล่าวหลายครั้งละ 1,000 ครั้ง)

3
มีวิธีการแบบเบย์ในการประมาณความหนาแน่นหรือไม่
ผมสนใจที่จะประเมินความหนาแน่นต่อเนื่องสุ่มตัวแปรXวิธีหนึ่งในการทำสิ่งนี้ที่ฉันได้เรียนรู้คือการใช้การประมาณความหนาแน่นของเคอร์เนลXXX แต่ตอนนี้ฉันสนใจวิธีการแบบเบย์ที่อยู่ในบรรทัดต่อไปนี้ ผมเริ่มเชื่อว่าต่อไปนี้การกระจายFฉันใช้เวลาอ่านXมีวิธีการอัพเดตตามการอ่านใหม่ของฉันหรือไม่?F n X FXXXFFFnnnXXXFFF ฉันรู้ว่าฉันดูเหมือนว่าฉันจะขัดแย้งกับตัวเอง: ถ้าฉันเชื่อว่าในเป็นการกระจายก่อนหน้านี้ของฉันเท่านั้นไม่มีข้อมูลควรโน้มน้าวฉันเป็นอย่างอื่น แต่สมมติว่ามีและจุดข้อมูลของฉันเป็นเหมือน1.7) เมื่อดูที่เห็นได้ชัดว่าฉันไม่สามารถยึดติดกับรุ่นก่อนหน้าได้ แต่ฉันควรอัปเดตอย่างไรF u n i f [ 0 , 1 ] ( 0.3 , 0.5 , 0.9 , 1.7 ) 1.7FFFFFFUnif[0,1]Unif[0,1]Unif[0,1](0.3,0.5,0.9,1.7)(0.3,0.5,0.9,1.7)(0.3, 0.5, 0.9, 1.7)1.71.71.7 อัปเดต:ตามคำแนะนำในความคิดเห็นที่ฉันได้เริ่มดูกระบวนการ Dirichlet ให้ฉันใช้สัญลักษณ์ต่อไปนี้: G∼DP(α,H)θi|G∼Gxi|θi∼N(θi,σ2)G∼DP(α,H)θi|G∼Gxi|θi∼N(θi,σ2) G \sim DP(\alpha,H)\\ \theta_i | G \sim G\\ x_i | \theta_i \sim N(\theta_i,\sigma^2) …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.