คำถามติดแท็ก probability

ความน่าจะเป็นให้คำอธิบายเชิงปริมาณของเหตุการณ์ที่เกิดขึ้นโดยเฉพาะ

7
ต้องจ่ายเท่าไหร่ ปัญหาในทางปฏิบัติ
นี่ไม่ใช่คำถามทำงานที่บ้าน แต่ปัญหาที่แท้จริงของ บริษัท ของเรา เมื่อเร็ว ๆ นี้ (2 วันที่ผ่านมา) เราสั่งให้ผลิตฉลากผลิตภัณฑ์ 10,000 รายการให้กับตัวแทนจำหน่าย ตัวแทนจำหน่ายเป็นบุคคลที่เป็นอิสระ เขาได้รับฉลากที่ผลิตจากภายนอกและ บริษัท ชำระเงินให้กับตัวแทนจำหน่าย ป้ายกำกับแต่ละรายการมีราคาเท่ากับ $ 1 ถึง บริษัท เมื่อวานนี้ดีลเลอร์มาพร้อมกับฉลาก แต่มีการรวมฉลากในแพ็คเก็ตละ 100 ป้าย ด้วยวิธีนี้มี 100 แพ็กเก็ตและแต่ละแพ็คเก็ตมี 100 ป้ายดังนั้นรวม 10,000 ป้าย ก่อนที่จะชำระเงินให้กับตัวแทนจำหน่ายของ $ 10,000 เราตัดสินใจที่จะนับแพ็คเก็ตน้อยเพื่อให้แน่ใจว่าแต่ละแพ็คเก็ตมี 100 ป้าย เมื่อเรานับฉลากเราพบว่าแพ็คเก็ตสั้น 100 ป้าย (เราพบ 97 ป้าย) เพื่อให้แน่ใจว่านี่ไม่ใช่โดยบังเอิญ แต่ได้ทำไปโดยเจตนาเราได้นับ 5 แพ็กเก็ตเพิ่มเติมและพบจำนวนป้ายกำกับต่อไปนี้ในแต่ละแพ็คเก็ต (รวมถึงแพ็กเก็ตแรก): Packet …

7
เหตุใดจึงต้องปรับความน่าจะเป็นบันทึกสูงสุดให้เหมาะสมแทนความน่าจะเป็น
ในงานการเรียนรู้เครื่องมากที่สุดที่คุณสามารถกำหนดบางส่วนน่าจะเป็นซึ่งควรจะขยายเราจริงจะเพิ่มประสิทธิภาพการบันทึกความน่าจะเป็นบันทึกหน้าแทนน่าจะเป็นสำหรับบางพารามิเตอร์θ เช่นในการฝึกความเป็นไปได้สูงสุดมักจะเป็นโอกาสในการบันทึก เมื่อทำเช่นนี้ด้วยวิธีการไล่ระดับสีบางสิ่งนี้เกี่ยวข้องกับปัจจัย:พีppเข้าสู่ระบบพีlog⁡p\log pθθ\theta ∂เข้าสู่ระบบพี∂θ= 1พี⋅ ∂พี∂θ∂log⁡p∂θ=1p⋅∂p∂θ \frac{\partial \log p}{\partial \theta} = \frac{1}{p} \cdot \frac{\partial p}{\partial \theta} ดูที่นี่หรือที่นี่สำหรับตัวอย่างบางส่วน แน่นอนว่าการเพิ่มประสิทธิภาพนั้นเทียบเท่า แต่การไล่ระดับจะแตกต่างกันดังนั้นวิธีการไล่ระดับสีใด ๆ จะทำงานแตกต่างกัน (โดยเฉพาะวิธีการไล่ระดับสีแบบสุ่ม stochastic) มีเหตุผลใดที่เข้าสู่ระบบพีlog⁡p\log pลาดทำงานดีกว่าพีppลาด?

11
เครื่องมือพัฒนาสมอง: จะสร้างจำนวนเต็ม 7 จำนวนด้วยความน่าจะเป็นที่เท่าเทียมกันโดยใช้เหรียญลำเอียงที่มี pr (หัว) = p อย่างไร
นี่เป็นคำถามที่ฉันพบในGlassdoor : เราสร้างจำนวนเต็ม 7 ตัวที่มีความน่าจะเป็นเท่ากันในการใช้เหรียญที่มีอย่างไรP r ( หัวหน้า) = p ∈ ( 0 , 1 )Pr(Head)=p∈(0,1)\mathbb{Pr}(\text{Head}) = p\in(0,1) โดยทั่วไปคุณมีเหรียญที่อาจจะใช่หรือไม่ยุติธรรมและนี่เป็นกระบวนการสร้างเลขสุ่มเพียงตัวเดียวที่คุณมีดังนั้นเกิดขึ้นกับตัวสร้างตัวเลขสุ่มที่แสดงจำนวนเต็มตั้งแต่ 1 ถึง 7 โดยที่ความน่าจะเป็นที่จะได้จำนวนเต็มแต่ละตัว คือ 1/7 ประสิทธิภาพของกระบวนการสร้างข้อมูล

13
10 หัวในแถวจะเพิ่มโอกาสในการโยนต่อไปหรือไม่?
ฉันถือว่าสิ่งต่อไปนี้เป็นจริง: สมมติว่าเป็นเหรียญที่ยุติธรรมการได้รับ 10 หัวติดต่อกันในขณะที่การโยนเหรียญไม่เพิ่มโอกาสในการโยนเหรียญถัดไปเป็นหางไม่ว่าจะมีความน่าจะเป็นและ / หรือศัพท์แสงทางสถิติจำนวนเท่าใด (แก้ตัวการเล่น) สมมติว่าเป็นอย่างนั้นคำถามของฉันคือ: ฉันจะโน้มน้าวให้คนที่เป็นอย่างนั้นได้อย่างไร พวกเขาฉลาดและมีการศึกษา แต่ดูเหมือนตั้งใจว่าจะไม่พิจารณาว่าฉันอาจจะถูก (โต้แย้ง)

3
อะไรเป็นสิ่งที่เจ๋งมากเกี่ยวกับทฤษฎีบทการเป็นตัวแทนของเดอ Finetti
จากทฤษฎีสถิติโดย Mark J. Schervish (หน้า 12): แม้ว่าทฤษฎีบทการเป็นตัวแทนของ DeFinetti 1.49 เป็นหัวใจสำคัญของการสร้างแบบจำลองพารามิเตอร์ แต่มันไม่ได้ถูกนำมาใช้จริง ทฤษฎีบทเป็นศูนย์กลางของแบบจำลองพารามิเตอร์อย่างไร

4
จะสร้างตัวเลขสุ่มที่มีความสัมพันธ์กันอย่างไร (ให้หมายถึงผลต่างและระดับความสัมพันธ์)
ฉันขอโทษถ้ามันดูธรรมดาไปหน่อย แต่ฉันคิดว่าฉันแค่ต้องการยืนยันความเข้าใจที่นี่ ฉันเข้าใจว่าฉันต้องทำสิ่งนี้ในสองขั้นตอนและฉันก็เริ่มพยายามฝึกความสัมพันธ์ แต่ก็เริ่มดูเหมือนจะเกี่ยวข้องจริงๆ ฉันกำลังมองหาคำอธิบายที่กระชับ (นึกคิดด้วยคำแนะนำต่อการแก้ปัญหา pseudocode) ของวิธีที่ดีและรวดเร็วในการสร้างตัวเลขสุ่มที่สัมพันธ์กัน ด้วยความสูงและน้ำหนักของตัวแปรเทียมสองตัวที่มีความหมายและความแปรปรวนที่รู้จักกันและความสัมพันธ์ที่กำหนดฉันคิดว่าฉันพยายามเข้าใจว่าขั้นตอนที่สองนี้ควรเป็นอย่างไร height = gaussianPdf(height.mean, height.variance) weight = gaussianPdf(correlated_mean(height.mean, correlation_coefficient), correlated_variance(height.variance, correlation_coefficient)) ฉันจะคำนวณค่าเฉลี่ยและความแปรปรวนได้อย่างไร แต่ฉันต้องการยืนยันว่านี่เป็นปัญหาที่เกี่ยวข้องจริงๆที่นี่ ฉันจำเป็นต้องใช้วิธีจัดการกับเมทริกซ์หรือไม่? หรือฉันมีสิ่งอื่นที่ผิดปกติมากในแนวทางพื้นฐานของปัญหานี้

14
อะไรคือลักษณะที่น่าแปลกใจที่สุดของการแจกแจงแบบเกาส์ (ปกติ)?
การแจกแจงแบบเกาส์มาตรฐานบนสามารถกำหนดได้โดยให้ความหนาแน่นอย่างชัดเจน: RR\mathbb{R}12π−−√e−x2/212πe−x2/2 \frac{1}{\sqrt{2\pi}}e^{-x^2/2} หรือฟังก์ชั่นลักษณะของมัน ตามที่นึกไว้ในคำถามนี้มันก็เป็นเพียงการแจกแจงที่ค่าเฉลี่ยและความแปรปรวนตัวอย่างเป็นอิสระ อะไรคือคุณสมบัติทางเลือกที่น่าแปลกใจอื่น ๆ ของ Gaussian ที่คุณรู้ ฉันจะยอมรับคำตอบที่น่าประหลาดใจที่สุด

8
จะบอกความน่าจะเป็นของความล้มเหลวได้อย่างไรถ้าไม่มีความล้มเหลว?
ฉันสงสัยว่ามีวิธีที่จะบอกความน่าจะเป็นของสิ่งที่ล้มเหลว (ผลิตภัณฑ์) ถ้าเรามีผลิตภัณฑ์ 100,000 รายการในเขตข้อมูลเป็นเวลา 1 ปีและไม่มีความล้มเหลวหรือไม่? ความน่าจะเป็นที่ผลิตภัณฑ์หนึ่งใน 10,000 รายการที่ขายไปนั้นล้มเหลวคืออะไร

3
การแปลความหมายของตัวทำนายการแปลงสภาพบันทึกและ / หรือการตอบสนอง
ฉันสงสัยว่ามันจะสร้างความแตกต่างในการตีความไม่ว่าจะเป็นเพียงขึ้นอยู่กับทั้งขึ้นอยู่กับและเป็นอิสระหรือตัวแปรอิสระเท่านั้นที่ถูกเปลี่ยนเข้าสู่ระบบ พิจารณากรณีของ log(DV) = Intercept + B1*IV + Error ฉันสามารถตีความ IV เป็นเปอร์เซ็นต์เพิ่มขึ้น แต่จะเปลี่ยนแปลงได้อย่างไรเมื่อฉันมี log(DV) = Intercept + B1*log(IV) + Error หรือเมื่อฉันมี DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

15
จำนวนที่คาดหวังอัตราส่วนของการเกิดหญิงกับชาย
ฉันเจอคำถามหนึ่งในการสัมภาษณ์งานการทดสอบความถนัดเรื่องการคิดอย่างมีวิจารณญาณ มันเป็นอะไรแบบนี้ สาธารณรัฐ Zorganian มีประเพณีแปลก ๆ คู่รักมีความประสงค์ที่จะมีลูกผู้หญิงเท่านั้นเพราะผู้หญิงเท่านั้นที่สามารถสืบทอดทรัพย์สมบัติของครอบครัวได้ดังนั้นหากพวกเขามีลูกผู้ชายพวกเขาจะมีลูกเพิ่มขึ้นเรื่อย ๆ จนกว่าพวกเขาจะมีผู้หญิง หากพวกเขามีผู้หญิงพวกเขาหยุดมีลูก อัตราส่วนระหว่างเด็กหญิงกับชายใน Zorgania คือเท่าไหร่? ฉันไม่เห็นด้วยกับคำตอบแบบจำลองที่กำหนดโดยผู้เขียนคำถามซึ่งมีประมาณ 1: 1 เหตุผลก็คือการเกิดใด ๆ จะมีโอกาส 50% ในการเป็นชายหรือหญิง คุณช่วยโน้มน้าวฉันด้วยคำตอบที่แข็งแกร่งทางคณิตศาสตร์ของถ้าคือจำนวนของเด็กหญิงและ B คือจำนวนเด็กชายในประเทศ?GE [ G ] : E [ B ]E[G]:E[B]\text{E}[G]:\text{E}[B]GGG

6
แรงจูงใจสำหรับระยะทาง Kolmogorov ระหว่างการแจกแจง
มีหลายวิธีในการวัดความคล้ายคลึงกันของการแจกแจงความน่าจะเป็นสองแบบ ในบรรดาวิธีการที่ได้รับความนิยม (ในแวดวงที่แตกต่างกัน) คือ: ระยะ Kolmogorov: ระยะทางระหว่างฟังก์ชันการกระจาย; ระยะทาง Kantorovich-Rubinstein: ความแตกต่างสูงสุดระหว่างความคาดหวังของ wrt ทั้งสองของการแจกแจงฟังก์ชันกับค่าคงที่ Lipschitz 111ซึ่งกลายเป็นระยะทางL1L1L^1ระหว่างฟังก์ชันการแจกแจง ล้อมรอบ-Lipschitz ระยะทาง: เช่นระยะ KR แต่ฟังก์ชั่นนอกจากนี้ยังจะต้องมีค่าสัมบูรณ์ที่มากที่สุด1111 สิ่งเหล่านี้มีข้อดีและข้อเสียต่างกัน การบรรจบกันในความหมายของ 3. จริง ๆ แล้วสอดคล้องกับการบรรจบกันในการกระจาย; การบรรจบกันในความหมายของ 1 หรือ 2 นั้นโดยทั่วไปแข็งแกร่งขึ้นเล็กน้อย (โดยเฉพาะถ้าXn=1nXn=1nX_n=\frac{1}{n}มีความน่าจะเป็น111จากนั้นXnXnX_nจะแปลงเป็น000ในการแจกแจง แต่ไม่ใช่ในระยะ Kolmogorov อย่างไรก็ตามหากการกระจายขีด จำกัด นั้นต่อเนื่องดังนั้นพยาธิวิทยานี้จะไม่เกิดขึ้น) จากมุมมองของความน่าจะเป็นเบื้องต้นหรือทฤษฎีการวัด 1. มีความเป็นธรรมชาติมากเพราะมันเปรียบเทียบความน่าจะเป็นของการอยู่ในบางชุด ในทางกลับกันมุมมองความน่าจะเป็นที่ซับซ้อนมากขึ้นมีแนวโน้มที่จะมุ่งเน้นไปที่ความคาดหวังมากกว่าความน่าจะเป็น นอกจากนี้จากมุมมองของการวิเคราะห์การทำงานระยะทางเช่น 2 หรือ 3 ขึ้นอยู่กับความเป็นคู่กับพื้นที่ฟังก์ชั่นบางอย่างน่าสนใจมากเพราะมีเครื่องมือทางคณิตศาสตร์จำนวนมากสำหรับการทำงานกับสิ่งต่าง ๆ อย่างไรก็ตามความประทับใจของฉัน (แก้ไขฉันถ้าฉันผิด!) คือในสถิติระยะทาง Kolmogorov …


3
CDFs เป็นพื้นฐานมากกว่า PDF หรือไม่?
สถิติของฉันโดยทั่วไปกล่าวว่าหากได้รับหนึ่งในสามต่อไปนี้คุณสามารถค้นหาอีกสอง: ฟังก์ชันการแจกแจงสะสม ฟังก์ชั่นการสร้างช่วงเวลา ฟังก์ชั่นความหนาแน่นของความน่าจะเป็น แต่อาจารย์เศรษฐศาสตร์ของฉันกล่าวว่า CDFs เป็นพื้นฐานมากกว่า PDF เพราะมีตัวอย่างที่คุณสามารถมี CDF แต่ PDF ไม่ได้ถูกกำหนดไว้ CDFs เป็นพื้นฐานมากกว่า PDF หรือไม่? ฉันจะรู้ได้อย่างไรว่า PDF หรือ MGF สามารถมาจาก CDF ได้หรือไม่
43 probability  pdf  cdf  mgf 

7
คุณต้องกลิ้งตาย 6 ด้านเพื่อรับหมายเลขทุกครั้งอย่างน้อยหนึ่งครั้งบ่อยแค่ไหน?
ฉันเพิ่งเล่นเกมกับลูก ๆ ของฉันซึ่งโดยทั่วไปแล้วจะลดลงไปถึง: ใครก็ตามที่หมุนทุกหมายเลขอย่างน้อยหนึ่งครั้งในการชนะแบบ 6 ด้าน ในที่สุดฉันก็ชนะและคนอื่น ๆ ก็จบทีหลัง 1-2 ตอนนี้ฉันสงสัย: ความคาดหวังของความยาวของเกมคืออะไร? ฉันรู้ว่าความคาดหวังของจำนวนม้วนจนกว่าคุณจะกดหมายเลขเฉพาะคือ 6Σ∞n = 1ไม่มี16( 5)6)n - 1= 6∑n=1∞n16(56)n−1=6\sum_{n=1}^\infty n\frac{1}{6}(\frac{5}{6})^{n-1}=6 อย่างไรก็ตามฉันมีสองคำถาม: มีกี่ครั้งที่คุณต้องกลิ้งตัวตายแบบหกด้านจนกว่าคุณจะได้หมายเลขอย่างน้อยหนึ่งครั้งทุกครั้ง? ในบรรดาการทดสอบอิสระสี่ครั้ง (เช่นผู้เล่นสี่คน) ความคาดหวังของจำนวนม้วนสูงสุดที่จำเป็นคืออะไร [หมายเหตุ: มันสูงสุดไม่ต่ำสุดเนื่องจากอายุของพวกเขามันเกี่ยวกับการจบมากกว่าที่จะไปถึงที่นั่นก่อนสำหรับลูก ๆ ของฉัน] ฉันสามารถจำลองผลลัพธ์ได้ แต่ฉันสงสัยว่าฉันจะทำการคำนวณได้อย่างไร นี่คือการจำลอง Monte Carlo ใน Matlab mx=zeros(1000000,1); for i=1:1000000, %# assume it's never going to take us >100 rolls …

20
มีภาพยนตร์ที่ดีเกี่ยวกับคณิตศาสตร์หรือความน่าจะเป็นหรือไม่?
คุณช่วยแนะนำภาพยนตร์ดีๆที่เกี่ยวข้องกับคณิตศาสตร์ความน่าจะเป็น ฯลฯ ได้ไหม? ตัวอย่างหนึ่งคือ21 ฉันจะสนใจภาพยนตร์ที่เกี่ยวข้องกับอัลกอริธึม (เช่นการถอดรหัสข้อความ) โดยทั่วไปภาพยนตร์ "geeky" ที่มีทฤษฎีทางวิทยาศาสตร์ที่มีชื่อเสียง แต่ไม่มีนิยายวิทยาศาสตร์หรือสารคดี ขอบคุณล่วงหน้า!

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.