คำถามติดแท็ก probability

ความน่าจะเป็นให้คำอธิบายเชิงปริมาณของเหตุการณ์ที่เกิดขึ้นโดยเฉพาะ

3
คุณจะบอกได้อย่างไรว่าการแสดงที่ดีเข้ามามีส่วนร่วม?
ฉันไขลูกบาศก์รูบิคเป็นงานอดิเรก ฉันบันทึกเวลาที่ใช้ในการแก้ไขคิวบ์โดยใช้ซอฟต์แวร์บางตัวและตอนนี้ฉันมีข้อมูลจากตัวแก้นับพัน ข้อมูลนั้นเป็นรายการหมายเลขยาวที่แสดงถึงเวลาที่แต่ละการแก้ปัญหาตามลำดับใช้ (เช่น 22.11, 20.66, 21.00, 18.74, ... ) เวลาที่ฉันต้องใช้เพื่อแก้ปัญหาลูกบาศก์ตามธรรมชาติแตกต่างกันบ้างเล็กน้อยจากการแก้เพื่อแก้ดังนั้นจึงมีการแก้ปัญหาที่ดีและการแก้ปัญหาที่ไม่ดี ฉันต้องการรู้ว่าฉัน "ร้อน" หรือไม่ - การแก้ปัญหาที่ดีมาในแนว ตัวอย่างเช่นหากฉันเพิ่งมีวิธีแก้ปัญหาที่ดีติดต่อกันสองสามครั้งมีแนวโน้มว่าวิธีแก้ปัญหาต่อไปของฉันจะดีหรือไม่ การวิเคราะห์แบบใดที่จะเหมาะสม ฉันสามารถนึกถึงบางสิ่งที่ต้องทำเช่นรักษาตัวเป็นกระบวนการมาร์คอฟและเห็นว่าวิธีใดวิธีหนึ่งที่ดีที่สุดในการทำนายการทำนายถัดไปและเปรียบเทียบกับข้อมูลแบบสุ่ม 100 เป็นและเปรียบเทียบกับสิ่งที่คาดหวังในข้อมูลแบบสุ่ม ฯลฯ ฉันไม่แน่ใจว่าการทดสอบเหล่านี้จะลึกซึ้งแค่ไหนและสงสัยว่ามีวิธีการที่ได้รับการพัฒนามาอย่างดีสำหรับปัญหาประเภทนี้หรือไม่

4
ฉันจะประมาณความหนาแน่นของพารามิเตอร์ที่ไม่ได้ศูนย์ใน R ได้อย่างไร?
ฉันมีชุดข้อมูลที่มีศูนย์จำนวนมากที่มีลักษณะดังนี้: set.seed(1) x <- c(rlnorm(100),rep(0,50)) hist(x,probability=TRUE,breaks = 25) ฉันต้องการวาดเส้นสำหรับความหนาแน่นของมัน แต่density()ฟังก์ชั่นใช้หน้าต่างย้ายที่คำนวณค่าลบของ x lines(density(x), col = 'grey') มีdensity(... from, to)ข้อโต้แย้ง แต่สิ่งเหล่านี้ดูเหมือนจะตัดทอนการคำนวณเท่านั้นไม่เปลี่ยนหน้าต่างเพื่อให้ความหนาแน่นที่ 0 สอดคล้องกับข้อมูลที่สามารถเห็นได้โดยพล็อตต่อไปนี้: lines(density(x, from = 0), col = 'black') (หากการแก้ไขมีการเปลี่ยนแปลงฉันคาดว่าเส้นสีดำจะมีความหนาแน่นสูงกว่าที่ 0 กว่าเส้นสีเทา) มีทางเลือกอื่นสำหรับฟังก์ชั่นนี้ที่จะช่วยให้การคำนวณความหนาแน่นดีขึ้นที่ศูนย์หรือไม่?
10 r  probability  kde 

1
กระบวนการ Stochastic เช่นกระบวนการ Gaussian / กระบวนการ Dirichlet มีความหนาแน่นหรือไม่ หากไม่สามารถใช้กฎของเบย์กับพวกเขาได้อย่างไร
กระบวนการ Dirichlet Pocess และ Gaussian นั้นมักเรียกกันว่า ในกรณีนั้นฉันสามารถพูดถึงความหนาแน่นของฟังก์ชั่นภายใต้ GP ได้หรือไม่? นั่นคือกระบวนการ Gaussian หรือกระบวนการ Dirichlet มีแนวคิดเกี่ยวกับความหนาแน่นของความน่าจะเป็นหรือไม่? หากไม่เป็นเช่นนั้นเราจะใช้กฎของเบย์ในการเปลี่ยนจากก่อนหน้าไปยังด้านหลังได้อย่างไรหากความคิดของความน่าจะเป็นก่อนหน้านี้ของฟังก์ชั่นยังไม่ชัดเจน มีสิ่งต่าง ๆ เช่นการประมาณค่า MAP หรือ EAP ในโลกที่ไม่ใช่แบบเบย์ของ Bayesian หรือไม่? ขอบคุณมาก.

3
การถดถอยของกระบวนการแบบเกาส์สำหรับชุดข้อมูลขนาดใหญ่
ฉันได้รับการเรียนรู้เกี่ยวกับกระบวนการ Gaussian ถดถอยจากวิดีโอออนไลน์และเอกสารประกอบการบรรยายความเข้าใจของฉันก็คือว่าถ้าเรามีชุดข้อมูลที่มีจุดแล้วเราถือว่าข้อมูลที่มีการเก็บตัวอย่างจากมิติหลายตัวแปรแบบเกาส์ ดังนั้นคำถามของฉันคือในกรณีที่คือ 10 ในล้านคนการถดถอยของกระบวนการแบบเกาส์ยังคงใช้ได้ เคอร์เนลเมทริกซ์จะไม่แสดงผลขนาดใหญ่กระบวนการอย่างสมบูรณ์หรือไม่ ถ้าเป็นเช่นนั้นมีเทคนิคในการจัดการกับสิ่งนี้เช่นการสุ่มตัวอย่างจากชุดข้อมูลซ้ำ ๆ หลาย ๆ ครั้งหรือไม่ วิธีการที่ดีในการจัดการกับกรณีดังกล่าวมีอะไรบ้าง nnnnnnnnn

3
ถ้า
สำหรับตัวแปรสุ่มแบบต่อเนื่องXXXหากE(|X|)E(|X|)E(|X|)มีค่า จำกัด คือlimn→∞nP(|X|&gt;n)=0limn→∞nP(|X|&gt;n)=0\lim_{n\to\infty}n P(|X|>n)=0 ? นี่เป็นปัญหาที่ฉันพบบนอินเทอร์เน็ต แต่ฉันไม่แน่ใจว่าจะมีหรือไม่ ฉันรู้ว่าnP(|X|&gt;n)&lt;E(|X|)nP(|X|&gt;n)&lt;E(|X|)n P(|X|>n)<E(|X|)ถือโดยอสมมาตรมาร์คอฟ แต่ฉันไม่สามารถแสดงได้ว่ามันจะเป็น 0 เมื่อnnnไปที่อนันต์

2
นิยามของความน่าจะเป็นแบบบ่อย มีคำจำกัดความที่เป็นทางการหรือไม่?
มีคำจำกัดความที่เป็นทางการ (ทางคณิตศาสตร์) ของสิ่งที่ผู้ใช้บ่อยเข้าใจภายใต้ '' ความน่าจะเป็น 'หรือไม่ ฉันอ่านว่ามันเป็นความถี่สัมพัทธ์ของการเกิด '' ในระยะยาว '' แต่มีบางวิธีที่เป็นทางการในการกำหนดหรือไม่? มีการอ้างอิงที่รู้จักที่ฉันสามารถค้นหาคำจำกัดความนั้นได้หรือไม่? แก้ไข: ด้วยผู้ใช้บ่อย (ดูความคิดเห็นโดย @whuber และความคิดเห็นของฉันต่อคำตอบ @Kodiologist และ @Graeme Walsh ด้านล่างคำตอบนั้น) ฉันหมายถึงผู้ที่เชื่อในความถี่ระยะยาวที่มีอยู่นี้ บางทีนี่ (ส่วนหนึ่ง) ตอบคำถามของ @Tim ด้วย

3
ปกติหารด้วยให้การแจกแจงแบบที - พิสูจน์ได้
ให้และ(s)Z∼N(0,1)Z∼N(0,1)Z \sim N(0,1)W∼χ2(s)W∼χ2(s)W \sim \chi^2(s) หากและมีการกระจายอย่างอิสระแล้วตัวแปรดังต่อไปนี้การกระจายกับองศาอิสระsZZZWWWY=ZW/s√Y=ZW/sY = \frac{Z}{\sqrt{W/s}}tttsss ฉันกำลังมองหาหลักฐานของความจริงนี้การอ้างอิงที่ดีพอถ้าคุณไม่ต้องการที่จะเขียนอาร์กิวเมนต์ที่สมบูรณ์

1
เกือบจะแน่ใจว่าการบรรจบกันไม่ได้หมายถึงการบรรจบกันที่สมบูรณ์
เราบอกว่ามาบรรจบกันอย่างสมบูรณ์กับหากสำหรับinftyX1,X2,…X1,X2,…X_1, X_2, \ldotsXXXϵ&gt;0ϵ&gt;0\epsilon>0 ∑∞n=1P(|Xn−X|&gt;ϵ)&lt;∞∑n=1∞P(|Xn−X|&gt;ϵ)&lt;∞\sum_{n=1}^\infty \text{P}\left(|X_n-X|>\epsilon\right) <\infty ด้วยบทแทรกของ Borel Cantelli ตรงไปตรงมาเพื่อพิสูจน์ว่าการลู่เข้าแบบสมบูรณ์หมายถึงการบรรจบกันเกือบจะแน่นอน ฉันกำลังมองหาตัวอย่างเกือบแน่ใจว่าคอนเวอร์เจนซ์ไม่สามารถพิสูจน์ได้ด้วย Borel Cantelli นี่คือลำดับของตัวแปรสุ่มที่รวมกันเกือบจะแน่นอน แต่ไม่สมบูรณ์

1
ตัวประมาณที่ไม่เอนเอียงพร้อมความแปรปรวนขั้นต่ำสำหรับ
ให้เป็นตัวอย่าง feom สุ่มกระจายสำหรับ&lt;1 กล่าวคือX1,...,XnX1,...,Xn X_1, ...,X_nGeometric(θ)Geometric(θ)Geometric(\theta)0&lt;θ&lt;10&lt;θ&lt;10<\theta<1 pθ(x)=θ(1−θ)x−1I{1,2,...}(x)pθ(x)=θ(1−θ)x−1I{1,2,...}(x)p_{\theta}(x)=\theta(1-\theta)^{x-1} I_{\{1,2,...\}}(x) ค้นหาตัวประมาณค่าที่เป็นกลางพร้อมค่าความแปรปรวนขั้นต่ำสำหรับg(θ)=1θg(θ)=1θg(\theta)=\frac{1}{\theta} ความพยายามของฉัน: ตั้งแต่การกระจายทางเรขาคณิตจากครอบครัวชี้แจงสถิติเสร็จสมบูรณ์และเพียงพอสำหรับ\นอกจากนี้หากเป็นตัวประมาณสำหรับมันจะไม่เอนเอียง ดังนั้นโดยทฤษฎีบท Rao-Blackwell และทฤษฎีบท Lehmann-Schefféทฤษฎีบท เป็นตัวประมาณที่เรากำลังมองหา∑Xi∑Xi\sum X_i θθ \thetaT(X)=X1T(X)=X1T(X)=X_1g(θ)g(θ)g(\theta)W(X)=E[X1|∑Xi]W(X)=E[X1|∑Xi]W(X) = E[X_1|\sum X_i] เรามีดังต่อไปนี้: W(X)=∑ti=1iP(X1=i|∑Xi=t)=∑ti=1iP(∑i≥2Xi=t−i)P(X1=i)P(∑i≥1Xi=t)W(X)=∑i=1tiP(X1=i|∑Xi=t)=∑i=1tiP(∑i≥2Xi=t−i)P(X1=i)P(∑i≥1Xi=t)W(X) = \sum_{i=1}^t i\, P(X_1=i|\sum X_i =t) = \sum_{i=1}^t i\, \frac{P(\sum_{i \geq 2} X_i =t-i)P(X_1=i)}{P(\sum_{i \geq 1}X_i =t)} เนื่องจากตัวแปรเป็น iid เรขาคณิตการกระจายผลรวมนั้นมีทั้งแบบทวินามลบ แต่ฉันกำลังมีปัญหาในการประมาณค่าสัมประสิทธิ์ทวินามและให้คำตอบสุดท้ายด้วยแบบฟอร์มที่ดีกว่าถ้าเป็นไปได้ฉันจะดีใจถ้าฉันได้รับความช่วยเหลือ ขอบคุณ! แก้ไข:ฉันไม่คิดว่าพวกคุณเข้าใจความสงสัยของฉัน:ฉันคิดว่าฉันทำทุกขั้นตอนที่ถูกต้องอาจจะลืมฟังก์ชั่นตัวบ่งชี้บางอย่างเท่านั้น นี่คือสิ่งที่ฉันทำ: ...=∑i=1ti(t−i−1n−2)θn−i(1−θ)t−i−n+1θ(1−θ)i−1(t−1n−1)θn(1−θ)t−n=∑i=1ti(t−i−1n−2)(t−1n−1)...=∑i=1ti(t−i−1n−2)θn−i(1−θ)t−i−n+1θ(1−θ)i−1(t−1n−1)θn(1−θ)t−n=∑i=1ti(t−i−1n−2)(t−1n−1)...=\sum_{i=1}^ti\frac{\binom{t-i-1}{n-2}\theta^{n-i}(1-\theta)^{t-i-n+1} \theta(1-\theta)^{i-1}}{\binom{t-1}{n-1}\theta^n(1-\theta)^{t-n}}=\sum_{i=1}^t …

1
การแจกแจงความน่าจะเป็นของฟังก์ชันของตัวแปรสุ่ม
ฉันมีข้อสงสัย: พิจารณาตัวแปรสุ่มที่มีค่าจริง XXX และ ZZZ ทั้งสองถูกกำหนดบนพื้นที่ความน่าจะเป็น (Ω,F,P)(Ω,F,P)(\Omega, \mathcal{F},\mathbb{P}). ปล่อย Y:=g(X,Z)Y=ก.(X,Z)Y:= g(X,Z)ที่ไหน g(⋅)ก.(⋅)g(\cdot)เป็นฟังก์ชั่นมูลค่าที่แท้จริง ตั้งแต่YYY เป็นฟังก์ชั่นของตัวแปรสุ่มมันเป็นตัวแปรสุ่ม ปล่อย x:=X(ω)x=X(ω)x:=X(\omega) เช่นการก่อให้เกิด XXX. คือ P(Y|X=x)=P(g(X,Z)|X=x)P(Y|X=x)=P(ก.(X,Z)|X=x)\mathbb{P}(Y|X=x)=\mathbb{P}(g(X,Z)|X=x) เท่ากับ P(g(x,Z))P(ก.(x,Z))\mathbb{P}(g(x,Z))?

3
ความน่าจะเป็นของการแยกจากการสุ่มตัวอย่างหลายครั้งของประชากรเดียวกัน
นี่คือกรณีตัวอย่าง: ฉันมีประชากร 10,000 รายการ แต่ละรายการมีรหัสเฉพาะ ฉันสุ่มเลือก 100 รายการและบันทึกรหัส ฉันเอาไอเท็ม 100 ชิ้นกลับไปเป็นประชากร ฉันสุ่มเลือก 100 รายการอีกครั้งบันทึกรหัสและแทนที่ โดยรวมฉันทำซ้ำการสุ่มตัวอย่างแบบนี้ 5 ครั้ง ความน่าจะเป็นนั้นคืออะไร XXX จำนวนรายการปรากฏในตัวอย่างสุ่มทั้ง 5 รายการหรือไม่ ฉันไม่เชี่ยวชาญในสถิติ สิ่งนี้จะถูกต้องสำหรับหรือไม่?X= 10X=10X = 10 สำหรับการสุ่มตัวอย่างแต่ละครั้งจำนวนชุดค่าผสมที่เป็นไปได้ 100 รายการจาก 10,000 คือb i n o m (10,000,100)binom(10000,100){\rm binom}(10000, 100) จากการรวมกันทั้งหมด 100 รายการชุดค่าผสมมี 10 รายการเฉพาะb i n o m (9990,90)∗ b …

1
จำนวนที่คาดหวังของการทำซ้ำ (triplicates ฯลฯ ) เมื่อวาดด้วยการแทนที่
ฉันมีปัญหาดังต่อไปนี้: ฉันมี 100 รายการที่ไม่ซ้ำกัน (n) และฉันเลือก 43 (m) ของพวกเขาทีละรายการ (มีการแทนที่) ฉันจำเป็นต้องแก้ปัญหาสำหรับจำนวนที่ไม่ซ้ำกันที่คาดหวัง (เลือกเพียงครั้งเดียว, k = 1), คู่ผสม (เลือกอย่างแน่นอนสองครั้ง k = 2), tripples (ตรง k = 3), ล่าม ฯลฯ ... ฉันสามารถค้นหาผลลัพธ์มากมายเกี่ยวกับความน่าจะเป็นที่มีอย่างน้อยหนึ่งคู่ (วันเกิดความขัดแย้ง) แต่ไม่ได้อยู่ในจำนวนคู่ที่คาดหวังในประชากร

4
รูปแบบประวัติเหตุการณ์แบบไม่ต่อเนื่อง (การอยู่รอด) ใน R
ฉันกำลังพยายามปรับโมเดลที่ไม่ต่อเนื่องใน R แต่ฉันไม่แน่ใจว่าจะทำอย่างไร ฉันได้อ่านแล้วว่าคุณสามารถจัดระเบียบตัวแปรตามในแถวต่างกันหนึ่งตัวสำหรับแต่ละการสังเกตเวลาและการใช้glmฟังก์ชั่นที่มีลิงค์ logit หรือ cloglog ในแง่นี้ฉันมีสามคอลัมน์: ID, Event(1 หรือ 0 ในแต่ละช่วงเวลา) และTime Elapsed(ตั้งแต่จุดเริ่มต้นของการสังเกต) รวมทั้ง covariates อื่น ๆ ฉันจะเขียนรหัสเพื่อให้พอดีกับรุ่นได้อย่างไร ตัวแปรตามคืออะไร ฉันเดาว่าฉันสามารถใช้Eventเป็นตัวแปรตามและรวมTime Elapsedอยู่ใน covariates แต่สิ่งที่เกิดขึ้นกับID? ฉันต้องการมันไหม ขอบคุณ
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

1
คำถามเกี่ยวกับฟังก์ชั่นการเปลี่ยนแปลงตัวอย่างอัตโนมัติ
ฉันกำลังอ่านหนังสือการวิเคราะห์อนุกรมเวลาและสูตรสำหรับการคำนวณค่าตัวอย่างอัตโนมัติถูกกำหนดในหนังสือเป็น: γˆ(h)=n−1∑t=1n−h(xt+h−x¯)(xt−x¯)γ^(ชั่วโมง)=n-1Σเสื้อ=1n-ชั่วโมง(xเสื้อ+ชั่วโมง-x¯)(xเสื้อ-x¯)\widehat{\gamma}(h) = n^{-1}\displaystyle\sum_{t=1}^{n-h}(x_{t+h}-\bar{x})(x_t-\bar{x}) กับ γˆ(−h)=γˆ(h)γ^(-ชั่วโมง)=γ^(ชั่วโมง)\widehat{\gamma}(-h) = \widehat{\gamma}(h)\; สำหรับ h=0,1,...,n−1ชั่วโมง=0,1,...,n-1\;h = 0,1, ..., n-1. x¯x¯\bar{x} คือค่าเฉลี่ย ใครสามารถอธิบายได้โดยสัญชาตญาณว่าทำไมเราหารผลรวมด้วย nnn และไม่ได้โดย n−hn-ชั่วโมงn-h? หนังสือเล่มนี้อธิบายว่าเป็นเพราะสูตรข้างต้นเป็นฟังก์ชันที่ไม่เป็นลบแน่นอนและหารด้วยnnnเป็นที่ต้องการ แต่ไม่ชัดเจนสำหรับฉัน บางคนสามารถพิสูจน์สิ่งนี้หรือแสดงตัวอย่างหรือบางสิ่งได้ สำหรับฉันสิ่งที่ใช้งานง่ายในตอนแรกจะแบ่งโดย n−hn-ชั่วโมงn-h. นี่เป็นตัวประมาณค่าแบบเอนเอียงหรือเอนเอียงของ autocovariance หรือไม่?

4
ความแปรปรวนของตัวต้านทานแบบขนาน
สมมติว่าคุณมีชุดตัวต้านทาน R ซึ่งทั้งหมดจะถูกกระจายด้วยค่าเฉลี่ยμและความแปรปรวนσ พิจารณาส่วนของวงจรที่มีเลย์เอาต์ต่อไปนี้: (r) || (r + r) || (R + R + R) ความต้านทานเท่ากันของแต่ละส่วนคือ r, 2r และ 3r ความแปรปรวนของแต่ละส่วนก็จะσ2σ2σ^2 , 2σ22σ22σ^2 , 3σ23σ23σ^2 2 ความแตกต่างในความต้านทานของวงจรทั้งหมดคืออะไร? หลังจากการสุ่มตัวอย่างหลายล้านจุดที่เราพบว่าความแปรปรวนอยู่ที่ประมาณ.10286σ2.10286σ2.10286\sigma^2 2 เราจะมาถึงข้อสรุปนี้ได้อย่างไร แก้ไข: ค่าความต้านทานจะถือว่าได้รับการกระจายตามปกติกับบางต้านทาน R ค่าเฉลี่ยและความแปรปรวนσ2σ2σ^2 2

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.