คำถามติดแท็ก probability

ความน่าจะเป็นให้คำอธิบายเชิงปริมาณของเหตุการณ์ที่เกิดขึ้นโดยเฉพาะ

1
สัญชาตญาณของตัวอย่างที่แลกเปลี่ยนได้ภายใต้สมมติฐานว่างคืออะไร
การทดสอบการเปลี่ยนรูป (เรียกอีกอย่างว่าการทดสอบแบบสุ่มการทดสอบแบบสุ่มอีกครั้งหรือการทดสอบที่แน่นอน) มีประโยชน์มากและมีประโยชน์เมื่อสมมติฐานของการแจกแจงปกติที่ต้องการโดยตัวอย่างเช่นt-testไม่พบและเมื่อการเปลี่ยนแปลงของค่าโดยการจัดอันดับ การทดสอบแบบไม่มีพารามิเตอร์Mann-Whitney-U-testจะนำไปสู่การสูญเสียข้อมูลมากขึ้น อย่างไรก็ตามไม่ควรมองข้ามสมมุติฐานข้อเดียวและข้อเดียวเพียงข้อเดียวเมื่อใช้การทดสอบชนิดนี้คือข้อสมมติฐานของความสามารถแลกเปลี่ยนได้ของตัวอย่างภายใต้สมมติฐานว่าง เป็นที่น่าสังเกตว่าวิธีการแบบนี้สามารถใช้ได้เมื่อมีตัวอย่างมากกว่าสองตัวอย่างเช่นสิ่งที่นำไปใช้ในcoinแพ็คเกจ R คุณช่วยกรุณาใช้ภาษาที่เป็นรูปเป็นร่างหรือปรีชาเชิงแนวคิดในภาษาอังกฤษธรรมดาเพื่อแสดงสมมติฐานนี้ได้หรือไม่? นี่จะมีประโยชน์มากในการอธิบายปัญหาที่ถูกมองข้ามในหมู่ผู้ที่ไม่ใช่นักสถิติเช่นฉัน หมายเหตุ: จะเป็นประโยชน์อย่างมากหากพูดถึงกรณีที่การใช้การทดสอบการเปลี่ยนแปลงไม่ถือหรือไม่ถูกต้องภายใต้สมมติฐานเดียวกัน ปรับปรุง: สมมติว่าฉันมี 50 วิชาที่รวบรวมจากคลินิกท้องถิ่นในเขตของฉันโดยการสุ่ม พวกเขาถูกสุ่มให้รับยาหรือยาหลอกในอัตราส่วน 1: 1 พวกเขาทั้งหมดถูกวัดสำหรับ Paramerter 1 Par1ที่ V1 (พื้นฐาน), V2 (3 เดือนต่อมา) และ V3 (1 ปีต่อมา) วิชาทั้งหมด 50 กลุ่มสามารถแบ่งเป็น 2 กลุ่มตามคุณสมบัติ A; ค่าบวก = 20 และค่าลบ = 30 นอกจากนี้ยังสามารถจัดกลุ่มย่อยได้อีก 2 กลุ่มตามคุณลักษณะ B; B positive = …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
ผลคูณของตัวแปรสุ่มอิสระสองตัว
ฉันมีตัวอย่างประมาณ 1,000 ค่า ข้อมูลเหล่านี้จะได้รับจากผลิตภัณฑ์ของทั้งสองตัวแปรสุ่มอิสระξ∗ψξ∗ψ\xi \ast \psi ψ ตัวแปรสุ่มครั้งแรกที่มีการกระจายชุดξ∼U(0,1)ξ∼U(0,1)\xi \sim U(0,1) ) ไม่รู้จักการแจกแจงของตัวแปรสุ่มตัวที่สอง ฉันจะประเมินการกระจายตัวของตัวแปรสุ่มตัวที่สอง ( ) ได้อย่างไรψψ \psi

2
รวมลักษณนามโดยการพลิกเหรียญ
ฉันกำลังศึกษาหลักสูตรการเรียนรู้ของเครื่องและสไลด์บรรยายมีข้อมูลที่ฉันพบว่าขัดแย้งกับหนังสือที่แนะนำ ปัญหาดังต่อไปนี้: มีตัวแยกประเภทสามตัว: ลักษณนาม Aให้ประสิทธิภาพที่ดีขึ้นในช่วงล่างของขีด จำกัด ลักษณนามขให้ประสิทธิภาพที่ดีขึ้นในช่วงที่สูงขึ้นของเกณฑ์ ลักษณนาม Cสิ่งที่เราได้รับโดยการโยนเหรียญและเลือกจากตัวแยกประเภทสองตัว ประสิทธิภาพของลักษณนาม C คืออะไรเมื่อดูบนเส้นโค้ง ROC สไลด์บรรยายระบุว่าเพียงแค่พลิกเหรียญนี้เราจะได้รับ " เรือนูน " ที่มีมนต์ขลังของตัวแยกประเภท A และ B ของเส้นโค้ง ROC ฉันไม่เข้าใจประเด็นนี้ เพียงแค่โยนเหรียญเราจะได้รับข้อมูลได้อย่างไร สไลด์บรรยาย หนังสือเล่มนี้พูดอะไร หนังสือที่แนะนำ ( Data Mining ... โดย Ian H. Witten, Eibe Frank และ Mark A. Hall ) ในทางกลับกันระบุว่า: หากต้องการดูสิ่งนี้ให้เลือกความน่าจะเป็นที่เฉพาะเจาะจงสำหรับวิธี A ที่ให้อัตราบวกจริงและเท็จของ tA และ fA …

2
จะเลือกระดับนัยสำคัญสำหรับชุดข้อมูลขนาดใหญ่ได้อย่างไร
ฉันทำงานกับชุดข้อมูลโดยมี N ประมาณ 200,000 ในการถดถอยฉันเห็นค่านัยสำคัญน้อยมาก << 0.001 ที่เกี่ยวข้องกับขนาดเอฟเฟกต์ที่เล็กมากเช่น r = 0.028 สิ่งที่ฉันอยากรู้คือมีวิธีหลักการในการตัดสินใจเลือกขีด จำกัด นัยสำคัญที่เหมาะสมเมื่อเทียบกับขนาดตัวอย่างหรือไม่ มีข้อควรพิจารณาอื่น ๆ ที่สำคัญเกี่ยวกับการตีความขนาดของเอฟเฟกต์กับตัวอย่างขนาดใหญ่เช่นนี้หรือไม่?

3
ฉันจะประเมินความน่าจะเป็นของสมาชิกสุ่มจากประชากรหนึ่งที่จะ“ ดีขึ้น” กว่าสมาชิกสุ่มจากประชากรอื่นได้อย่างไร
สมมติว่าฉันมีกลุ่มตัวอย่างจากประชากรสองกลุ่มที่แตกต่างกัน ถ้าฉันวัดว่าสมาชิกแต่ละคนใช้เวลาทำงานนานแค่ไหนฉันสามารถประมาณค่าเฉลี่ยและความแปรปรวนของประชากรแต่ละคนได้อย่างง่ายดาย หากตอนนี้ฉันตั้งสมมติฐานการจับคู่แบบสุ่มกับบุคคลหนึ่งคนจากแต่ละประชากรฉันสามารถประเมินความน่าจะเป็นที่คนแรกเร็วกว่าคนที่สองหรือไม่ ฉันมีตัวอย่างที่เป็นรูปธรรมในใจ: การวัดเป็นการกำหนดเวลาสำหรับฉันขี่จักรยานจาก A ถึง B และประชากรเป็นตัวแทนของเส้นทางที่แตกต่างที่ฉันสามารถทำได้ ฉันพยายามหาว่าความน่าจะเป็นที่การเลือกเส้นทาง A สำหรับรอบต่อไปของฉันจะเร็วกว่าการเลือกเส้นทาง B เมื่อฉันทำวัฏจักรจริง ๆ ฉันได้รับจุดข้อมูลอีกชุดสำหรับชุดตัวอย่างของฉัน :) ฉันรู้ว่านี่เป็นวิธีที่ง่ายอย่างน่ากลัวในการพยายามทำสิ่งนี้ไม่ใช่อย่างน้อยเพราะในวันหนึ่ง ๆ ลมจะมีผลต่อเวลาของฉันมากกว่าสิ่งอื่นดังนั้นโปรดแจ้งให้เราทราบหากคุณคิดว่าฉันกำลังถาม คำถามที่ผิด ...

5
ความแตกต่างระหว่างคำว่า 'การกระจายแบบร่วม' และ 'การกระจายแบบหลายตัวแปร' หรือไม่?
ฉันกำลังเขียนเกี่ยวกับการใช้ 'การแจกแจงความน่าจะเป็นร่วม' สำหรับผู้ชมที่มีแนวโน้มที่จะเข้าใจ 'การกระจายหลายตัวแปร' ดังนั้นฉันจึงพิจารณาใช้ในภายหลัง อย่างไรก็ตามฉันไม่ต้องการคลายความหมายขณะทำสิ่งนี้ Wikipediaดูเหมือนจะบ่งบอกว่าสิ่งเหล่านี้เป็นคำพ้องความหมาย ที่พวกเขา? ถ้าไม่ทำไมล่ะ

4
ค่าที่คาดหวังกับค่าที่น่าจะเป็นที่สุด (โหมด)
ค่าที่คาดหวังของการแจกแจงคือค่าเฉลี่ยนั่นคือค่าเฉลี่ยถ่วงน้ำหนัก f(x)f(x)f(x)E[x]=∫+∞−∞xf(x)dxE[x]=∫−∞+∞xf(x)dxE[x]=\int_{-\infty}^{+\infty} x \, \, f(x) dx ค่าที่เป็นไปได้มากที่สุดคือโหมดซึ่งเป็นค่าที่น่าจะเป็นที่สุด อย่างไรก็ตามเราคาดหวังว่าจะเห็นหลายครั้ง? ข้อความจากที่นี่ :E[x]E[x]E[x] หากผลลัพธ์ไม่น่าจะเท่ากันดังนั้นค่าเฉลี่ยอย่างง่ายจะต้องถูกแทนที่ด้วยค่าเฉลี่ยถ่วงน้ำหนักซึ่งคำนึงถึงความจริงที่ว่าผลลัพธ์บางอย่างมีแนวโน้มมากกว่าคนอื่น ๆ สัญชาตญาณ แต่ยังคงเหมือนเดิม: มูลค่าที่คาดหวังของคือสิ่งหนึ่งที่คาดว่าจะเกิดขึ้นโดยเฉลี่ยxixix_ixxx ฉันไม่สามารถเข้าใจสิ่งที่ "เกิดขึ้นโดยเฉลี่ย" หมายความว่านี่หมายถึงว่าสำหรับ istance ใช้เวลานานมากในการคาดหวังว่าจะเห็นมากกว่าค่าอื่น ๆ ของหรือไม่? แต่นี่ไม่ใช่นิยามของโหมดใช่ไหมE[x]E[x]E[x]xxx ดังนั้นวิธีการตีความคำสั่งหรือไม่ ความหมายความน่าจะเป็นของคืออะไร?E[x]E[x]E[x] ฉันต้องการแสดงตัวอย่างที่ทำให้สับสน การศึกษาการฉันได้เรียนรู้ว่าโหมด นี้คือχ 2 m o d e = ν - 2ในขณะที่E [ χ 2 ] = νโดยที่νคือองศาของอิสระของข้อมูลχ2χ2\chi^2χ2mode=ν−2χmode2=ν−2\chi^2_{mode}=\nu-2E[χ2]=νE[χ2]=νE[\chi^2]=\nuνν\nu ผมได้ยินที่มหาวิทยาลัยว่าเมื่อทำทดสอบหลังการใช้สแควน้อยวิธีการเพื่อให้พอดีกับชุดของข้อมูลที่ฉันควรคาดหวังว่าจะได้รับχ 2 ≈ เข้าพบเพราะ "ว่าสิ่งที่เกิดขึ้นโดยทั่วไป"χ2χ2\chi^2χ2≈νχ2≈ν\chi^2 \approx …

2
การเชื่อมต่อระหว่างห่วงโซ่มาร์คอฟกับมาร์คอฟโซ่มอนเต้คาร์โลคืออะไร
ฉันพยายามทำความเข้าใจกับ Markov chains โดยใช้ SAS ฉันเข้าใจว่ากระบวนการมาร์คอฟเป็นสิ่งที่รัฐในอนาคตขึ้นอยู่กับสถานะปัจจุบันเท่านั้นและไม่ได้อยู่ในสถานะที่ผ่านมาและมีเมทริกซ์การเปลี่ยนแปลงที่จับความน่าจะเป็นการเปลี่ยนแปลงจากรัฐหนึ่งไปยังอีกรัฐหนึ่ง แต่ฉันเจอคำนี้: มาร์คอฟเชนมอนติคาร์โล สิ่งที่ฉันอยากรู้คือถ้ามาร์คอฟเชนมอนติคาร์โลนั้นเกี่ยวข้องกับกระบวนการมาร์คอฟที่ฉันอธิบายไว้ข้างต้นหรือไม่

2
อะไรคือความหมายตามสัญชาตญาณของตัวแปรสุ่มที่ถูกนิยามว่าเป็น“ ขัดแตะ”?
ในทฤษฎีความน่าจะเป็นค่าลบตัวแปรสุ่มเรียกว่าตาข่ายถ้ามีดังกล่าวว่า1XXXd≥0d≥0d \geq 0∑∞n=0P(X=nd)=1∑n=0∞P(X=nd)=1\sum_{n=0}^{\infty}P(X=nd) = 1 มีการตีความทางเรขาคณิตสำหรับสาเหตุที่คำนิยามนี้เรียกว่าขัดแตะ?

1
Cauchy Distribution และทฤษฎีขีด จำกัด กลาง
เพื่อให้ CLT ที่จะถือเราต้องกระจายเราต้องการที่จะใกล้เคียงกับที่จะมีค่าเฉลี่ยและความแปรปรวน จำกัด 2 มันจะเป็นจริงที่จะบอกว่าสำหรับกรณีของการกระจาย Cauchy ค่าเฉลี่ยและความแปรปรวนที่ไม่ได้กำหนดทฤษฎีบทขีด จำกัด กลางล้มเหลวในการให้การประมาณที่ดีแม้ asymptotically?μμ\muσ2σ2\sigma^2

4
การดำเนินงานของโอกาสในโลกที่กำหนดขึ้น
ในหนังสือของสตีเว่นพิ้งเกอร์Better Angels of Our Natureเขาบันทึกไว้ว่า ความน่าจะเป็นเป็นเรื่องของมุมมอง เมื่อมองในระยะใกล้พอแต่ละเหตุการณ์มีสาเหตุที่แน่ชัด แม้แต่การพลิกเหรียญก็สามารถทำนายได้จากเงื่อนไขเริ่มต้นและกฎของฟิสิกส์และนักมายากลที่มีทักษะสามารถใช้ประโยชน์จากกฎหมายเหล่านั้นเพื่อโยนหัวทุกครั้ง แต่เมื่อเราซูมออกเพื่อดูภาพมุมกว้างของเหตุการณ์เหล่านี้จำนวนมากเราจะเห็นผลรวมของสาเหตุมากมายที่บางครั้งก็ยกเลิกซึ่งกันและกันและบางครั้งก็จัดเรียงในทิศทางเดียวกัน นักฟิสิกส์และนักปรัชญาอองรีโปนแคร์อธิบายว่าเราเห็นการดำเนินการของโอกาสในโลกที่กำหนดขึ้นไม่ว่าจะเป็นสาเหตุของความอ่อนแอจำนวนมากเพิ่มขึ้นเป็นผลที่น่ากลัวหรือเมื่อสาเหตุเล็ก ๆ .ในกรณีที่มีการใช้ความรุนแรงบางคนอาจต้องการเริ่มสงคราม เขารอช่วงเวลาที่เหมาะสมซึ่งอาจจะมีหรือไม่มีก็ได้ ศัตรูของเขาตัดสินใจที่จะมีส่วนร่วมหรือถอย; กระสุนบิน; ระเบิดระเบิด คนตาย ทุกเหตุการณ์อาจถูกกำหนดโดยกฎหมายของระบบประสาทและฟิสิกส์และสรีรวิทยา แต่ในภาพรวมสาเหตุหลายประการที่เข้าสู่เมทริกซ์นี้บางครั้งสามารถสับเป็นชุดค่าผสมที่รุนแรงได้ (หน้า 209) ฉันสนใจประโยคที่เป็นตัวหนา แต่ฉันให้ส่วนที่เหลือตามบริบท คำถามของฉัน: มีวิธีทางสถิติในการอธิบายสองกระบวนการที่ Poincare อธิบายหรือไม่ นี่คือการคาดเดาของฉัน: 1) "สาเหตุการลงโทษจำนวนมากเพิ่มขึ้นถึงเอฟเฟกต์ที่น่ากลัว" "การจำนวนมากสาเหตุ" และ "เพิ่มขึ้น" เสียงกับผมเช่นทฤษฎีบทขีด จำกัด กลาง แต่ใน (ความหมายดั้งเดิมของ) CLT สาเหตุจำเป็นต้องเป็นตัวแปรสุ่มไม่ใช่ผลกระทบที่กำหนดไว้ เป็นวิธีมาตรฐานที่นี่เพื่อประมาณผลกระทบที่กำหนดเหล่านี้เป็นตัวแปรสุ่มบางชนิด? 2) "สาเหตุเล็ก ๆ น้อย ๆ ที่ทำให้การแจ้งเตือนของเราเป็นตัวกำหนดผลกระทบขนาดใหญ่ที่เราไม่ควรพลาด" มันดูเหมือนว่าผมชอบคุณอาจจะคิดว่านี้เป็นจัดเรียงของบางรูปแบบมาร์คอฟซ่อน แต่ความน่าจะเป็นในการเปลี่ยนสถานะ (ไม่สามารถสังเกตเห็นได้) …


2
Normalizing ค่าคงที่ในทฤษฎีบท Bayes
Pr(data)Pr(data)\Pr(\textrm{data}) Pr(parameters∣data)=Pr(data∣parameters)Pr(parameters)Pr(data)Pr(parameters∣data)=Pr(data∣parameters)Pr(parameters)Pr(data)\Pr(\text{parameters} \mid \text{data}) = \frac{\Pr(\textrm{data} \mid \textrm{parameters}) \Pr(\text{parameters})}{\Pr(\text{data})} เรียกว่าคง normalizing มันคืออะไรกันแน่? จุดประสงค์ของมันคืออะไร? ทำไมมันมีลักษณะเหมือน ? ทำไมมันไม่ขึ้นกับพารามิเตอร์Pr(data)Pr(data)\Pr(data)

5
ความน่าจะเป็นมีมากกว่าเบย์เซียนนิยมหรือไม่
ในฐานะนักเรียนในสาขาฟิสิกส์ฉันเคยมีประสบการณ์การบรรยายเรื่อง "ทำไมฉันถึงเป็นชาวเบย์" บางทีครึ่งโหล มันเหมือนกันเสมอ - ผู้นำเสนออธิบายอย่างไม่ถูกต้องว่าการตีความแบบเบย์นั้นดีกว่าการตีความบ่อยครั้งที่ถูกกล่าวหาว่าใช้โดยมวลชนอย่างไร พวกเขาพูดถึงกฎของเบย์, ชายขอบ, นักบวชและผู้โพสต์ เรื่องจริงคืออะไร มีการบังคับใช้โดเมนที่ถูกต้องตามกฎหมายสำหรับสถิติผู้ใช้บ่อยหรือไม่? (แน่นอนในการสุ่มตัวอย่างหรือกลิ้งตายหลายครั้งต้องใช้?) มีปรัชญาความน่าจะเป็นที่มีประโยชน์นอกเหนือจาก "Bayesian" และ "บ่อยครั้ง" หรือไม่

3
เหตุใดการแจกแจงเฉลี่ยและการเบี่ยงเบนมาตรฐาน 1 จึงใช้เสมอ
สถิติของฉันได้รับการสอนด้วยตนเอง แต่เนื้อหามากมายที่ฉันอ่านชี้ไปยังชุดข้อมูลที่มีค่าเฉลี่ย 0 และค่าเบี่ยงเบนมาตรฐานเท่ากับ 1 ถ้าเป็นเช่นนั้น: เหตุใดค่าเฉลี่ย 0 และ SD 1 จึงเป็นคุณสมบัติที่ดีที่จะมี ทำไมตัวแปรสุ่มที่ดึงมาจากตัวอย่างนี้เท่ากับ 0.5? โอกาสในการวาด 0.001 เท่ากับ 0.5 ดังนั้นนี่ควรเป็นการกระจายแบบเรียบ ... เมื่อมีคนพูดเกี่ยวกับคะแนน Z พวกเขาหมายถึงอะไรที่นี่จริง?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.