คำถามติดแท็ก probability

ความน่าจะเป็นให้คำอธิบายเชิงปริมาณของเหตุการณ์ที่เกิดขึ้นโดยเฉพาะ

7
ปัญหาซองจดหมายสองฉบับกลับมาอีกครั้ง
ฉันกำลังคิดถึงปัญหานี้อยู่ http://en.wikipedia.org/wiki/Two_envelopes_problem ฉันเชื่อวิธีแก้ปัญหาและฉันคิดว่าฉันเข้าใจ แต่ถ้าฉันใช้แนวทางต่อไปนี้ฉันสับสนอย่างสมบูรณ์ ปัญหาที่ 1: ฉันจะเสนอเกมต่อไปนี้ให้คุณ คุณจ่ายให้ฉัน$ 10 และฉันจะพลิกเหรียญที่ยุติธรรม หัวฉันให้คุณ$ 5 และก้อยฉันให้คุณ$ 20 ความคาดหวังคือ$ 12.5 ดังนั้นคุณจะเล่นเกมเสมอ ปัญหาที่ 2: ฉันจะให้ซองจดหมายกับคุณ$ 10 ซองจดหมายนั้นเปิดอยู่และคุณสามารถตรวจสอบได้ จากนั้นผมก็แสดงให้คุณเห็นซองจดหมายอีกปิดเวลานี้และบอกคุณ: ซองจดหมายนี้อย่างใดอย่างหนึ่งมี$ 5 หรือ $ 20 ในนั้นมีโอกาสที่เท่าเทียมกัน คุณต้องการสลับหรือไม่ ฉันรู้สึกว่านี่เป็นปัญหาเดียวกับปัญหา 1 คุณเสียเงิน $ 10 สำหรับ$ 5 หรือ$ 20 ดังนั้นคุณจะเปลี่ยนอีกครั้ง ปัญหาที่ 3: ฉันทำเช่นเดียวกับข้างบน แต่ปิดซองจดหมาย ดังนั้นคุณไม่ทราบว่ามี $ 10 แต่มีจำนวน X ฉันบอกคุณอีกซองหนึ่งมีสองหรือครึ่ง …

1
การได้มาของการเปลี่ยนแปลงตัวแปรของฟังก์ชันความหนาแน่นของความน่าจะเป็น
ในการจดจำรูปแบบหนังสือและการเรียนรู้ของเครื่อง (สูตร 1.27) มันให้ พีY( y) = px( x ) ∣||dxdY|||= px( กรัม( y) ) | ก.'( y) |พีY(Y)=พีx(x)|dxdY|=พีx(ก.(Y))|ก.'(Y)|p_y(y)=p_x(x) \left | \frac{d x}{d y} \right |=p_x(g(y)) | g'(y) | โดยที่ ,เป็น PDF ที่สอดคล้องกับตามการเปลี่ยนแปลงของตัวแปรp x ( x ) p y ( y )x = g( y)x=ก.(Y)x=g(y)พีx( x )พีx(x)p_x(x)พีY( y)พีY(Y)p_y(y) หนังสือบอกว่ามันเป็นเพราะสังเกตว่าตกอยู่ในช่วงจะค่าเล็ก ๆ …

4
ทำไม P (A, B | C) / P (B | C) = P (A | B, C)
ผมเข้าใจP(A∩B)/P(B)=P(A|B)P(A∩B)/P(B)=P(A|B)P(A\cap B)/P(B) = P(A|B) ) เงื่อนไขคือจุดตัดของ A และ B หารด้วยพื้นที่ทั้งหมดของ B แต่ทำไมP(A∩B|C)/P(B|C)=P(A|B∩C)P(A∩B|C)/P(B|C)=P(A|B∩C)P(A\cap B|C)/P(B|C) = P(A|B \cap C) ? คุณให้ปรีชาได้ไหม ไม่ควรจะเป็น: P(A∩B∩C)/P(B,C)=P(A|B∩C)P(A∩B∩C)/P(B,C)=P(A|B∩C)P(A\cap B \cap C)/P(B,C) = P(A|B \cap C) ?

2
การตีความช่วงความมั่นใจ
หมายเหตุ: ขออภัยล่วงหน้าหากซ้ำกันฉันไม่พบคิวที่คล้ายกันในการค้นหาของฉัน สมมติว่าเรามีพารามิเตอร์จริง p ช่วงความเชื่อมั่น C (X) เป็น RV ที่มี p พูด 95% ของเวลา ทีนี้สมมติว่าเราสังเกต X และคำนวณ C (X) คำตอบทั่วไปน่าจะเป็นว่ามันไม่ถูกต้องที่จะตีความว่ามี "95% โอกาสที่จะบรรจุ p" เพราะมัน "ไม่หรือไม่มี p" อย่างไรก็ตามสมมติว่าฉันเลือกการ์ดจากด้านบนของสำรับสับและทิ้งมันลง ฉันคิดอย่างถี่ถ้วนว่าความน่าจะเป็นของการ์ดใบนี้จากการเป็นเอซโพดำในฐานะ 1/52 แม้ว่าในความเป็นจริง "มันอาจเป็นหรือไม่ใช่เอซโพดำ" เหตุใดฉันจึงไม่สามารถใช้เหตุผลนี้กับตัวอย่างของช่วงความมั่นใจได้ หรือถ้ามันไม่มีความหมายเลยที่จะพูดถึง "ความน่าจะเป็น" ของการ์ดที่เป็นเอซโพดำเพราะมัน "เป็นหรือไม่ใช่" ฉันจะยังคงวางอัตราต่อรอง 51: 1 ว่ามันไม่ใช่เอซโพดำ มีคำอื่นที่อธิบายข้อมูลนี้หรือไม่? แนวคิดนี้แตกต่างจาก "ความน่าจะเป็น" อย่างไร แก้ไข: อาจจะมีความชัดเจนมากขึ้นจากการตีความความน่าจะเป็นแบบเบย์ถ้าฉันบอกว่าตัวแปรสุ่มมี p 95% ของเวลาเนื่องจากการรับรู้ของตัวแปรสุ่มนั้น (และไม่มีข้อมูลอื่นที่จะมีเงื่อนไข) …

2
เครื่องหมายใดและทำไม:
อนุสัญญาโวหารเหล่านี้เป็นเพียง (ไม่ว่าจะเป็นตัวเอียงหรือไม่ใช่ตัวเอียง) หรือมีความแตกต่างที่สำคัญในความหมายของสัญลักษณ์เหล่านี้หรือไม่ มีข้อความอื่น ๆ ที่มีความหมายว่า " ความน่าจะเป็น " ที่ควรพิจารณาในคำถามนี้หรือไม่

2
เหตุใดการกระจายส่วนต่าง / ความน่าจะเป็นที่ได้รับเล็กน้อยนั้นอธิบายว่าเป็น
Marginal โดยทั่วไปหมายถึงสิ่งที่มีผลขนาดเล็กบางสิ่งที่อยู่นอกระบบที่ใหญ่กว่า มันมีแนวโน้มที่จะลดความสำคัญของสิ่งที่ถูกอธิบายว่าเป็น "ส่วนเพิ่ม" ดังนั้นวิธีที่ใช้กับความน่าจะเป็นของชุดย่อยของตัวแปรสุ่มได้อย่างไร สมมติว่าคำต่าง ๆ ถูกนำมาใช้เพราะความหมายของพวกเขาอาจเป็นข้อเสนอที่มีความเสี่ยงในวิชาคณิตศาสตร์ดังนั้นฉันรู้ว่าไม่จำเป็นต้องมีคำตอบที่นี่ แต่บางครั้งคำตอบของคำถามประเภทนี้สามารถช่วยให้คุณเข้าใจได้อย่างแท้จริง ฉันถาม

5
ทำไม
ฉันคิดว่า P(A|B)=P(A|B,C)∗P(C)+P(A|B,¬C)∗P(¬C)P(A|B)=P(A|B,C)∗P(C)+P(A|B,¬C)∗P(¬C)P(A|B) = P(A | B,C) * P(C) + P(A|B,\neg C) * P(\neg C) ถูกต้องในขณะที่ P(A|B)=P(A|B,C)+P(A|B,¬C)P(A|B)=P(A|B,C)+P(A|B,¬C)P(A|B) = P(A | B,C) + P(A|B,\neg C) ไม่ถูกต้อง อย่างไรก็ตามฉันได้รับ "ปรีชาญาณ" เกี่ยวกับหนึ่งในภายหลังนั่นคือคุณพิจารณาความน่าจะเป็น P (A | B) โดยแยกสองกรณี (C หรือ Not C) ทำไมสัญชาตญาณนี้ผิด

2
การพูดว่าเหตุการณ์“ เกิดขึ้นในที่สุด” หมายความว่าอะไร?
พิจารณาการเดินสุ่ม 1 มิติบนจำนวนเต็มZZ\mathbb{Z}ด้วยสถานะเริ่มต้นx∈Zx∈Zx\in\mathbb{Z} : Sn=x+∑i=1nξiSn=x+∑i=1nξi\begin{equation} S_n=x+\sum^n_{i=1}\xi_i \end{equation} ที่เพิ่มขึ้นทีละมี IID ดังกล่าวว่า{2}ξiξi\xi_iP{ξi=1}=P{ξi=−1}=12P{ξi=1}=P{ξi=−1}=12P\{\xi_i=1\}=P\{\xi_i=-1\}=\frac{1}{2} หนึ่งสามารถพิสูจน์ได้ว่า (1) Px{Sn reaches +1 eventually}=1Px{Sn reaches +1 eventually}=1\begin{equation} P^x{\{S_n \text{ reaches +1 eventually}\}} = 1 \end{equation} โดยตัวห้อยหมายถึงตำแหน่งเริ่มต้น Letเป็นครั้งแรกที่ทางรัฐ+1ในคำอื่น ๆ\} หนึ่งสามารถพิสูจน์ได้ว่า (2)ττ\tau+1+1+1τ:=τ(1):=min{n≥0:Sn=1}τ:=τ(1):=min{n≥0:Sn=1}\tau:=\tau(1):=\min\{n\geq0:S_n=1\} Eτ=+∞Eτ=+∞\begin{equation} E\tau = +\infty \end{equation} พิสูจน์ทั้งสองสามารถพบได้ในhttp://galton.uchicago.edu/~lalley/Courses/312/RW.pdf ผ่านการอ่านบทความฉันจะเข้าใจทั้งสองพิสูจน์ อย่างไรก็ตามคำถามของฉันคือสิ่งที่ความหมายของ "ในที่สุด" ในคำสั่งแรกเช่นเดียวกับโดยทั่วไป หากสิ่งที่เกิดขึ้น "ในที่สุด" มันไม่จำเป็นต้องเกิดขึ้นในเวลา จำกัด มันได้หรือไม่ ถ้าเป็นเช่นนั้นอะไรคือความแตกต่างระหว่างสิ่งที่ไม่เกิดขึ้นกับสิ่งที่ไม่เกิดขึ้น "ในที่สุด"? ข้อความบางข้อ …

4
การเพิ่มความแม่นยำของเครื่องไล่ระดับสีจะลดลงเมื่อจำนวนการทำซ้ำเพิ่มขึ้น
ฉันกำลังทดลองกับอัลกอริทึมของเครื่องเร่งการไล่ระดับสีผ่านcaretแพ็คเกจใน R ใช้ชุดข้อมูลการรับสมัครวิทยาลัยขนาดเล็กฉันใช้รหัสต่อไปนี้: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

2
จำนวนครั้งที่คาดว่าจะหมุนตายจนกว่าแต่ละด้านจะปรากฏขึ้น 3 ครั้ง
จำนวนครั้งที่คาดว่าคุณจะต้องกลิ้งตายจนกว่าแต่ละด้านจะปรากฏ 3 ครั้งคืออะไร? คำถามนี้ถูกถามในโรงเรียนประถมในนิวซีแลนด์และแก้ไขด้วยการจำลองสถานการณ์ โซลูชันการวิเคราะห์สำหรับปัญหานี้คืออะไร

1
คำถามสัมภาษณ์ที่ดีสำหรับผู้สมัครขั้นตอนวิธีเชิงสถิติคืออะไร?
ฉันกำลังสัมภาษณ์ผู้คนถึงตำแหน่งนักพัฒนาอัลกอริทึม / นักวิจัยในด้านสถิติ / การเรียนรู้ของเครื่องจักร / บริบทการขุดข้อมูล ฉันกำลังมองหาคำถามที่จะถามเพื่อพิจารณาเป็นพิเศษความคุ้นเคยความเข้าใจและความลื่นไหลของผู้สมัครกับทฤษฎีพื้นฐานเช่นคุณสมบัติพื้นฐานของความคาดหวังและความแปรปรวนการแจกแจงทั่วไปบางอย่าง ฯลฯ คำถามไปที่ปัจจุบันของฉันคือ: "มีปริมาณที่ไม่รู้จักซึ่งเราอยากจะประเมินด้วยเหตุนี้เรามีตัวประมาณY 1 , Y 2 , … , Y nซึ่งได้รับXนั้นไม่เอนเอียงและเป็นอิสระและ แต่ละคนมีความแปรปรวนที่รู้จักกันσ 2 ฉันแตกต่างกันไปสำหรับแต่ละคนค้นหาตัวประมาณที่เหมาะสมที่สุดY = f ( Y 1 , … , Y n )ซึ่งไม่เอนเอียงและมีความแปรปรวนน้อยที่สุด "XXXY1, วาย2, … , YnY1,Y2,...,YnY_1, Y_2, \ldots, Y_nXXXσ2ผมσผม2\sigma_i^2Y= f( Y1, … , Yn)Y=ฉ(Y1,...,Yn)Y=f(Y_1,\ldots, Y_n) ฉันคาดหวังว่าผู้สมัครที่จริงจังในการจัดการกับมันได้อย่างง่ายดาย (ให้เวลาในการคำนวณการคำนวณ) …

2
ทฤษฎีการเรียนรู้ PAC หมายถึงอะไร?
ฉันใหม่ในการเรียนรู้ของเครื่อง ฉันกำลังเรียนหลักสูตรการเรียนรู้ของเครื่องจักร (มหาวิทยาลัยสแตนฟอร์ด) และฉันไม่เข้าใจความหมายของทฤษฎีนี้และประโยชน์ของมัน ฉันสงสัยว่าถ้าใครสามารถอธิบายทฤษฎีนี้ให้ฉันได้ ทฤษฎีนี้มีพื้นฐานอยู่บนสมการนี้

1
จำนวนสีที่คาดหวังที่แตกต่างกันเมื่อวาดโดยไม่ต้องเปลี่ยน
พิจารณาโกศที่มีลูกสีต่างกันโดยที่ เป็นสัดส่วนของลูกบอลสีในบรรดาลูกบอล ( ) ฉันวาดลูกบอลจากโกศโดยไม่ต้องเปลี่ยนและดูที่หมายเลขของสีที่ต่างกันระหว่างลูกบอลที่ถูกวาด ความคาดหวังของในฐานะฟังก์ชันของขึ้นอยู่กับคุณสมบัติที่เหมาะสมของการแจกแจงคืออะไร?NNNPPPpipip_iiiiNNN∑ipi=1∑ipi=1\sum_i p_i = 1n≤Nn≤Nn \leq Nγγ\gammaγγ\gamman/Nn/Nn/Npp\mathbf{p} เพื่อให้เข้าใจมากขึ้นถ้าและสำหรับแล้วฉันมักจะเห็นว่าสี, ที่อยู่,N) มิฉะนั้นก็สามารถแสดงให้เห็นว่าความคาดหวังของมีN) สำหรับและคงที่มันจะดูเหมือนว่าปัจจัยที่จะคูณจะสูงสุดเมื่อเหมือนกัน; จำนวนที่คาดหวังของสีที่ต่างกันที่เห็นถูก จำกัด ขอบเขตด้วยฟังก์ชันของและเช่น, เอนโทรปีของ ?N=PN=PN = Ppi=1/Ppi=1/Pp_i = 1/Piiinnnγ=P(n/N)γ=P(n/N)\gamma = P (n/N)γγ\gamma>P(n/N)>P(n/N)>P(n/N)PPPNNNn/Nn/Nn/Npp\mathbf{p}n/Nn/Nn/Npp\mathbf{p} ดูเหมือนว่าจะเกี่ยวข้องกับปัญหาของตัวสะสมคูปองยกเว้นการสุ่มตัวอย่างจะดำเนินการโดยไม่มีการแทนที่และการแจกคูปองไม่สม่ำเสมอ

4
จะพัฒนาสัญชาตญาณความน่าจะเป็นแบบมีเงื่อนไขได้อย่างไร
ในวิดีโอบรรยายจากสถิติของ Harvard 110: ความน่าจะเป็นที่พบได้ใน iTunes และ YouTube ฉันพบปัญหานี้ ฉันพยายามสรุปที่นี่: สมมติว่าเราได้ไพ่สองใบสุ่มจากเด็คมาตรฐาน ความน่าจะเป็นที่ไพ่ทั้งคู่เป็นเอซเนื่องจากเรามีอย่างน้อยหนึ่งเอซคืออะไร P(both aces|have ace)=P(both aces,have ace)P(have ace)P(both aces|have ace)=P(both aces,have ace)P(have ace) P(both\ aces | have\ ace) = \frac{P(both\ aces, have\ ace)}{P(have\ ace)} เนื่องจากมีอย่างน้อยหนึ่งเอซจะถูกบอกเป็นนัย ๆ ถ้าคุณมีเอซทั้งคู่การตัดกันสามารถลดลงเหลือเพียงแค่P(both aces)P(both aces)P(both\ aces) P(both aces|have ace)=P(both aces)P(have ace)P(both aces|have ace)=P(both aces)P(have ace) P(both\ aces …

4
อุบัติเหตุเครื่องบินชนกันเป็นจำนวนเท่าใด?
คำถามเดิม (7/25/14): การเสนอราคานี้จากสื่อข่าวทำให้รู้สึกหรือมีวิธีการทางสถิติที่ดีขึ้นในการดูน้ำท่วมของอุบัติเหตุเครื่องบินเมื่อเร็ว ๆ นี้? อย่างไรก็ตามบาร์เน็ตต์ยังให้ความสนใจกับทฤษฎีของการแจกแจงปัวซงซึ่งก็หมายความว่าช่วงเวลาสั้น ๆ ระหว่างการเกิดปัญหานั้นมีแนวโน้มที่จะเป็นไปได้มากกว่าระยะยาว "สมมติว่ามีอุบัติเหตุร้ายแรงถึงหนึ่งครั้งต่อปีโดยเฉลี่ยหมายความว่าโอกาสที่จะเกิดอุบัติเหตุในวันใดวันหนึ่งเป็นหนึ่งใน 365" บาร์เน็ตต์กล่าว "หากเกิดความผิดพลาดในวันที่ 1 สิงหาคมโอกาสที่ความผิดพลาดครั้งต่อไปจะเกิดขึ้นหนึ่งวันต่อมาในวันที่ 2 สิงหาคมคือ 1/365 แต่โอกาสที่ความผิดพลาดครั้งต่อไปจะเกิดขึ้นในวันที่ 3 สิงหาคมคือ (364/365) x (1/365) เนื่องจากข้อผิดพลาดครั้งถัดไปเกิดขึ้นในวันที่ 3 สิงหาคมเฉพาะในกรณีที่ไม่มีข้อผิดพลาดในวันที่ 2 สิงหาคมเท่านั้น " “ ดูเหมือนว่าจะใช้งานง่าย แต่ข้อสรุปดังต่อไปนี้อย่างไม่ลดละจากกฎความน่าจะเป็น” บาร์เน็ตต์กล่าว ที่มา: http://www.bbc.com/news/magazine-28481060 ความชัดเจน (7/27/14): สิ่งที่เคาน์เตอร์หยั่งรู้ (สำหรับฉัน) กำลังบอกว่าเหตุการณ์ที่หายากมักจะเกิดขึ้นในเวลาใกล้เคียง ฉันคิดว่าเหตุการณ์ที่เกิดขึ้นได้ยากจะไม่เกิดขึ้นในเวลาอันใกล้ ทุกคนสามารถชี้ให้ฉันเห็นการแจกแจงเชิงทฤษฎีหรือเชิงประจักษ์ของเวลาระหว่างเหตุการณ์ภายใต้สมมติฐานของการแจกแจงปัวซอง? (นั่นคือฮิสโตแกรมที่แกน y เป็นความถี่หรือความน่าจะเป็นและแกน x เป็นเวลาระหว่างเหตุการณ์ที่เกิดขึ้น 2 ครั้งติดต่อกันซึ่งแบ่งออกเป็นวันสัปดาห์เดือนหรือปีหรือสิ่งที่คล้ายกัน) ขอบคุณ …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.