คำถามติดแท็ก conditional-probability

ความน่าจะเป็นที่เหตุการณ์จะเกิดขึ้นเมื่อทราบว่ามีเหตุการณ์ B อื่นเกิดขึ้นหรือเกิดขึ้น มันเป็นเรื่องปกติโดย P (A | B)

2
เกี่ยวกับความเป็นอิสระตามเงื่อนไขและการแสดงกราฟิก
เมื่อศึกษาการเลือกความแปรปรวนร่วมฉันเคยอ่านตัวอย่างต่อไปนี้ ด้วยความเคารพต่อรูปแบบดังต่อไปนี้: เมทริกซ์ความแปรปรวนร่วมและเมทริกซ์ความแปรปรวนร่วมผกผันมีดังต่อไปนี้ ฉันไม่เข้าใจว่าทำไมความอิสระของและจึงถูกตัดสินโดยความแปรปรวนร่วมที่นี่?yxxxyyy ตรรกะทางคณิตศาสตร์ที่เป็นรากฐานของความสัมพันธ์นี้คืออะไร? นอกจากนี้กราฟด้านซ้ายในรูปต่อไปนี้อ้างว่าสามารถจับความสัมพันธ์ที่เป็นอิสระระหว่างและ ; ทำไม?yxxxyyy

1
สัจพจน์ของ Luce ทางเลือกคำถามเกี่ยวกับความน่าจะเป็นแบบมีเงื่อนไข [ปิด]
ปิด คำถามนี้ต้องการรายละเอียดหรือความคมชัด ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ เพิ่มรายละเอียดและชี้แจงปัญหาโดยแก้ไขโพสต์นี้ ปิดให้บริการใน2 ปีที่ผ่านมา ฉันอ่านLuce (1959) จากนั้นฉันก็พบคำสั่งนี้: เมื่อคนเลือกระหว่างทางเลือกบ่อยครั้งที่การตอบสนองของพวกเขาดูเหมือนจะถูกควบคุมโดยความน่าจะเป็นซึ่งถูกกำหนดไว้ในชุดตัวเลือก แต่ทฤษฎีความน่าจะเป็นทั่วไปที่มีนิยามมาตรฐานของความน่าจะเป็นแบบมีเงื่อนไขนั้นดูเหมือนจะไม่เป็นสิ่งที่ต้องการ ตัวอย่างแสดงให้เห็นถึงความยากลำบาก เมื่อตัดสินใจว่าจะเดินทางจากบ้านไปยังเมืองอื่นตัวเลือกของคุณอาจเป็นเครื่องบิน (a) รถบัส (b) หรือรถยนต์ (c) ให้ A, B, C แสดงถึงสภาวะที่ไม่แน่นอนของธรรมชาติที่เกี่ยวข้องกับรูปแบบของการเดินทาง โปรดทราบว่าหากมีคนเลือกความไม่แน่นอนทั้งหมดของ A และ B อยู่เนื่องจากเครื่องบินบินและรถเมล์วิ่งไม่ว่าคุณจะอยู่บนเครื่องบินหรือไม่ก็ตาม อย่างไรก็ตามหากคุณเลือก a หรือ b ดังนั้นรถของคุณจะยังคงอยู่ในโรงรถและชุด C จะถูกเปลี่ยนอย่างรุนแรงเมื่อรถขับเคลื่อน สัจพจน์ตัวเลือกของบทที่ 1 ได้รับการแนะนำเป็นความพยายามครั้งแรกในการสร้างทฤษฎีความน่าจะเป็นแบบเลือกได้โดยผ่านสมมติฐานตัวอย่างพื้นที่คงที่ที่เป็นสากล แหล่งที่มา: http://www.scholarpedia.org/article/Luce's_choice_axiom สำหรับผมน่าจะเป็นตัวชี้วัดที่มีการกำหนดไว้กับแฝดพื้นที่ตัวอย่างเป็นพีชคณิตซิกมาFและในที่สุดก็เป็นมาตรการPΩΩ\OmegaFF\mathcal{F}PPP ด้วยความเคารพต่อตัวอย่างที่กล่าวมาแล้วสิ่งที่ดูเหมือนจะเป็นปัญหาถ้าฉันกำหนด: Ω={bus,car,airplane}Ω={bus,car,airplane}\Omega = \{ \text{bus}, \text{car}, \text{airplane} \} …

3
ปัญหาในเชิงลึกที่ร้ายแรงของความน่าจะเป็นสำหรับการพลิกเหรียญ
ให้บอกว่าฉันทำ 10,000 flips เหรียญ ฉันต้องการทราบความน่าจะเป็นของการพลิกหลายครั้งเพื่อให้ได้ 4 หัวติดต่อกันหรือมากกว่าติดต่อกัน การนับจะทำหน้าที่ดังต่อไปนี้คุณจะนับหนึ่งรอบการพลิกต่อเนื่องที่เป็นแค่หัว (4 หัวหรือมากกว่า) เมื่อก้อยกระทบและแตกแนวของหัวการนับจะเริ่มอีกครั้งจากการโยนครั้งต่อไป นี่จะทำซ้ำ 10,000 ครั้ง ฉันต้องการทราบความน่าจะเป็นไม่ใช่เพียง 4 หัวขึ้นไปในแถว แต่ 6 หรือมากกว่าและ 10 หรือมากกว่า หากต้องการให้ชัดเจนหากมีริ้ว 9 หัวมันจะนับเป็น 1 ริ้ว 4 หรือมากกว่า (และ / หรือ 6 หรือมากกว่า) ไม่ใช่ 2 เส้นแยกกัน ตัวอย่างเช่นหากเหรียญมาถึง THTHTHTHHHHHH /// THAHTHT .... การนับจะเป็น 13 และเริ่มต้นอีกครั้งบนก้อยถัดไป สมมุติว่าข้อมูลออกมาเอียงไปทางขวาอย่างมาก หมายความว่าเฉลี่ย 40 พลิกโดยเฉลี่ยเพื่อให้ได้แนว 4 …

1
การตีความความหนาแน่นแบบมีเงื่อนไข
ฉันต้องการทราบวิธีการตีความแปลงความหนาแน่นตามเงื่อนไขอย่างถูกต้อง ฉันได้ใส่สองด้านล่างที่ผมสร้างขึ้นใน R cdplotกับ ตัวอย่างเช่นความน่าจะเป็นของผลลัพธ์เท่ากับ 1 เมื่อVar 1เท่ากับ 150 ประมาณ 80% หรือไม่ พื้นที่สีเทาเข้มคือความน่าจะเป็นแบบมีเงื่อนไขResultซึ่งเท่ากับ 1 ใช่ไหม? จากcdplotเอกสารประกอบ: cdplot คำนวณความหนาแน่นตามเงื่อนไขของ x ที่กำหนดระดับของ y ที่ถ่วงน้ำหนักด้วยการแจกแจงส่วนขอบของ y ความหนาแน่นจะได้รับมาจากระดับ y การสะสมนี้มีผลต่อการตีความแปลงเหล่านี้อย่างไร

1
แบบจำลองของ P (Y | X) สามารถฝึกผ่านการไล่ระดับสีแบบสุ่มจากตัวอย่างที่ไม่ใช่ iid ของ P (X) และตัวอย่าง iid ของ P (Y | X) ได้หรือไม่?
เมื่อการฝึกอบรมแบบจำลองพารามิเตอร์ (เช่นเพื่อเพิ่มโอกาส) ผ่านการไล่ระดับสีแบบสุ่มในชุดข้อมูลบางอย่างก็มักจะสันนิษฐานว่าตัวอย่างการฝึกอบรมจะถูกดึงออกมาจากการกระจายข้อมูลการฝึกอบรม ดังนั้นหากเป้าหมายคือการสร้างแบบจำลองการแจกแจงร่วมดังนั้นตัวอย่างการฝึกอบรมแต่ละตัวอย่างควรถูกดึงออกมาจากการกระจายนั้น( x i , y i )P( X, วาย)P(X,Y)P(X,Y)( xผม, yผม)(xi,yi)(x_i,y_i) หากเป้าหมายคือการจำลองแบบการแจกแจงแบบมีเงื่อนไขดังนั้นความต้องการของ iid จะเปลี่ยนไปอย่างไรถ้าหากทั้งหมดP( Y| X)P(Y|X)P(Y|X) เราจะต้องดึงตัวอย่างแต่ละตัวอย่าง iid จากการกระจายข้อต่อหรือไม่?( xผม, yผม)(xi,yi)(x_i,y_i) เราควรจะวาด IID จากแล้ววาด IID จาก ? P ( X ) y i P ( Y | X )xผมxix_iP( X)P(X)P(X)Yผมyiy_iP( Y| X)P(Y|X)P(Y|X) เราสามารถวาดไม่ IID จาก (เช่นความสัมพันธ์ในช่วงเวลา) แล้ววาด …

1
ทำไมเราไม่เชื่อสัญชาตญาณความน่าจะเป็น
หากเคยมีกรณีที่ชัดเจนนี้อยู่กับปัญหา Monty Hall แม้แต่ Paul Erdos ผู้ยิ่งใหญ่ก็ยังหลงกลกับปัญหานี้ คำถามของฉันซึ่งอาจยากที่จะตอบคือความน่าจะเป็นที่เรามั่นใจในคำตอบที่เราได้รับจากการโต้เถียงที่เข้าใจง่ายและยังผิด กฎหมายของ Benford เกี่ยวกับตัวเลขแรกและเวลารอคอยที่ขัดแย้งกันเป็นตัวอย่างที่มีชื่อเสียงอื่น ๆ เช่นนี้

5
ความน่าจะเป็นที่มีเงื่อนไข - พวกมันมีลักษณะเฉพาะกับ Bayesianism หรือไม่?
ฉันสงสัยว่าความน่าจะเป็นตามเงื่อนไขนั้นมีลักษณะเฉพาะกับ Bayesianism หรือไม่หรือเป็นแนวคิดทั่วไปที่ใช้ร่วมกันระหว่างโรงเรียนแห่งความคิดหลายแห่งในหมู่ผู้มีสถิติ / ผู้น่าจะเป็น ฉันคิดว่ามันเป็นเพราะฉันคิดว่าไม่มีใครสามารถเป็นตรรกะได้ดังนั้นฉันคิดว่าอย่างน้อยผู้เห็นบ่อย ๆ จะเห็นด้วยในทางทฤษฎีในขณะที่เตือนกับ Bayesian การอนุมานจากเหตุผลเชิงปฏิบัติไม่ใช่เพราะความน่าจะเป็นตามเงื่อนไขp(A,B)=p(A|B)p(B)p(A,B)=p(A|B)p(B)p(A,B) = p(A|B)p(B)

3
โมเดลของมาร์คอฟที่มีความน่าจะเป็นไปตามเงื่อนไข
ก่อนอื่นให้ฉันรับทราบล่วงหน้าว่าฉันไม่เชี่ยวชาญในด้านสถิติและคณิตศาสตร์อย่างที่ฉันต้องการ บางคนอาจบอกว่ามีความรู้เพียงพอที่จะเป็นอันตราย : DI ขออภัยถ้าฉันไม่ได้ใช้คำศัพท์อย่างถูกต้อง ฉันพยายามจำลองความน่าจะเป็นของระบบที่เปลี่ยนจากสถานะหนึ่งไปเป็นอีกสถานะหนึ่ง โมเดลมาร์คอฟแบบง่ายเป็นการเริ่มต้นที่ดี (ชุดของรัฐชุดของความน่าจะเป็นของรัฐเริ่มต้นชุดของความน่าจะเป็นในการเปลี่ยนแปลงระหว่างรัฐ) อย่างไรก็ตามระบบที่ฉันสร้างแบบจำลองนั้นซับซ้อนกว่านั้น ความน่าจะเป็นในการเปลี่ยนผ่านที่นำไปสู่สถานะ ณ เวลา T นั้นแน่นอนที่สุดขึ้นอยู่กับตัวแปรอื่นที่ไม่ใช่สถานะที่ T-1 ตัวอย่างเช่น S1 -> S2 อาจมีความน่าจะเป็นการเปลี่ยนแปลง 40% เมื่อดวงอาทิตย์ส่องแสง แต่ความน่าจะเป็น S1 -> S2 จะอยู่ที่ 80% เมื่อฝนตก ข้อมูลเพิ่มเติมจากคำถามของผู้แสดงความคิดเห็น: รัฐสามารถสังเกตได้ จะมีเพียง 5-10 รัฐเท่านั้น ขณะนี้มีผู้ร่วมทุนประมาณ 30 คนที่เราต้องการตรวจสอบแม้ว่าตัวแบบสุดท้ายจะมีน้อยกว่านี้อย่างแน่นอน โควาเรียตบางตัวต่อเนื่องและอื่น ๆ ไม่ต่อเนื่อง คำถามสามข้อ: ฉันจะรวมความน่าจะเป็นแบบเปลี่ยนแปลงเงื่อนไขเข้ากับโมเดลของฉันได้อย่างไร หรือมีมุมมองอื่นทั้งหมดที่ฉันควรแนวทางปัญหานี้? นอกจากนี้ฉันควรค้นหาคำหลัก / แนวคิดออนไลน์เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับเรื่องนี้อย่างไร ฉันใช้เว็บค้นหาสิ่งต่าง ๆ เช่น "โมเดลมาร์คอฟที่มีความเป็นไปได้ในการเปลี่ยนแปลงตามเงื่อนไข" …

13
หาก 'B มีแนวโน้มว่าจะได้รับ A' มากกว่า 'A ก็จะได้รับ B' มากกว่า
ฉันพยายามที่จะทำให้สัญชาตญาณชัดเจนขึ้น: "ถ้าทำให้มีแนวโน้มมากขึ้นก็ทำให้Aมีแนวโน้มมากขึ้น" เช่นAAABBBBBBAAA ให้n(S)n(S)n(S)แทนขนาดของพื้นที่ที่AAAและBBBเป็นเช่นนั้น อ้างสิทธิ์: P(B|A)>P(B)P(B|A)>P(B)P(B|A)>P(B)ดังนั้นn(AB)/n(A)>n(B)/n(S)n(AB)/n(A)>n(B)/n(S)n(AB)/n(A) > n(B)/n(S) so n(AB)/n(B)>n(A)/n(S)n(AB)/n(B)>n(A)/n(S)n(AB)/n(B) > n(A)/n(S) อันไหนP(A|B)>P(A)P(A|B)>P(A)P(A|B)>P(A) ฉันเข้าใจคณิตศาสตร์ แต่ทำไมสิ่งนี้ถึงสมเหตุสมผล

1
วิธีการแพร่กระจายอย่างเหมาะสมดึงเมื่อคำนวณหลายความคาดหวัง
สมมติว่าเราต้องการคำนวณความคาดหวัง: EYEX|Y[f(X,Y)]EYEX|Y[ฉ(X,Y)]E_YE_{X|Y}[f(X,Y)] สมมติว่าเราต้องการประมาณค่านี้โดยใช้การจำลองมอนติคาร์โล EYEX|Y[f(X,Y)]≈1RS∑r=1R∑s=1Sf(xr,s,yr)EYEX|Y[ฉ(X,Y)]≈1RSΣR=1RΣs=1Sฉ(xR,s,YR)E_YE_{X|Y}[f(X,Y)] \approx \frac1{RS}\sum_{r=1}^R\sum_{s=1}^Sf(x^{r,s},y^r) แต่สมมติว่ามันมีค่าใช้จ่ายสูงในการดึงตัวอย่างจากการแจกแจงทั้งสองค่าเพื่อให้เราสามารถวาดหมายเลขคงที่เท่านั้น KKK เราควรจัดสรรอย่างไร ตัวอย่างรวมถึงดึงไปที่การกระจายแต่ละครั้งหรือในสุดขั้วหนึ่งเสมอในด้านนอกและเสมอในด้านในรองในทางกลับกัน ฯลฯ .....KKKK/2K/2K/2K−1K-1K-1 สัญชาตญาณของฉันบอกฉันว่ามันจะต้องทำอย่างไรกับความแปรปรวน / เอนโทรปีของการแจกแจงที่สัมพันธ์กัน สมมติว่าด้านนอกหนึ่งเป็นจุดมวลแล้วส่วนหนึ่งของที่ช่วยลดข้อผิดพลาด MC จะวาดที่ 1 ของและวาดของxy KKKYYYK−1K-1K-1X|YX|YX|Y หวังว่านี่จะชัดเจน

2
การบรรจบกันในการกระจาย \ CLT
ระบุว่า , distr แบบมีเงื่อนไข ของเป็น\ ไค ^ 2 (2n) Nมีความแตกต่างเล็กน้อย ของปัวซอง ( \ theta ), \ thetaเป็นค่าคงที่เป็นบวกN=nN=nN = nYYYχ2(2n)χ2(2n)\chi ^2(2n)NNNθθ\thetaθθ\theta แสดงว่าในขณะที่θ→∞θ→∞\theta \rightarrow \infty , (Y−E(Y))/Var(Y)−−−−−−√→N(0,1) (Y−E(Y))/Var⁡(Y)→N(0,1)\space \space (Y - E(Y))/ \sqrt{\operatorname{Var}(Y)} \rightarrow N(0,1)ในการกระจาย ใครสามารถแนะนำกลยุทธ์ในการแก้ปัญหานี้ ดูเหมือนว่าเราจำเป็นต้องใช้ CLT (Central Limit Theorem) แต่มันดูยากที่จะรับข้อมูลใด ๆ เกี่ยวกับYYYด้วยตัวเอง มี rv ที่สามารถแนะนำให้ใช้ตัวอย่างเพื่อสร้างYYYหรือไม่? นี่คือการบ้านดังนั้นคำแนะนำชื่นชม

1
parellel ระหว่าง LSA และ pLSA
ในเอกสารต้นฉบับของpLSAผู้เขียนโทมัสฮอฟแมนวาดเส้นขนานระหว่าง pLSA และ LSA โครงสร้างข้อมูลที่ฉันต้องการจะพูดคุยกับคุณ พื้นหลัง: การได้รับแรงบันดาลใจจากการค้นคืนสารสนเทศคาดว่าเรามีการรวบรวม NNN เอกสาร D={d1,d2,....,dN}D={d1,d2,....,dN}D = \lbrace d_1, d_2, ...., d_N \rbrace และคำศัพท์ของ MMM เงื่อนไข Ω={ω1,ω2,...,ωM}Ω={ω1,ω2,...,ωM}\Omega = \lbrace \omega_1, \omega_2, ..., \omega_M \rbrace คลัง XXX สามารถแสดงโดย N×MN×MN \times M เมทริกซ์ของการอยู่ร่วมกัน ในการวิเคราะห์ความหมายแฝงโดยSVDเมทริกซ์XXX เป็นตัวประกอบในสามเมทริกซ์: X=UΣVTX=UΣVTX = U \Sigma V^T ที่ไหน Σ=diag{σ1,...,σs}Σ=diag{σ1,...,σs}\Sigma = diag \lbrace \sigma_1, ..., \sigma_s …

1
จะเปรียบเทียบเหตุการณ์ที่สังเกตได้กับเหตุการณ์ที่คาดหวังได้อย่างไร
สมมติว่าฉันมีตัวอย่างหนึ่งความถี่ของเหตุการณ์ที่เป็นไปได้ 4 เหตุการณ์: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 และฉันมีโอกาสที่จะเกิดเหตุการณ์ที่คาดหวัง: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 ด้วยผลรวมของความถี่ที่สังเกตได้จากเหตุการณ์ทั้งสี่ของฉัน (18) ฉันสามารถคำนวณความถี่ที่คาดหวังของเหตุการณ์ได้ใช่ไหม expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.