คำถามติดแท็ก probability

ความน่าจะเป็นให้คำอธิบายเชิงปริมาณของเหตุการณ์ที่เกิดขึ้นโดยเฉพาะ

1
ขอบเขตหางรู้จักที่คมชัดที่สุดสำหรับตัวแปรแบบกระจายคืออะไร
Letจะเป็นตัวแปรสุ่มไคสแควกระจายกับองศาอิสระ ขอบเขตที่ทราบกันดีที่สุดสำหรับความน่าจะเป็นดังต่อไปนี้คืออะไรX∼χ2kX∼χk2X \sim \chi^2_kkkk P[X&gt;t]≤1−δ1(t,k)P[X&gt;t]≤1−δ1(t,k) \mathbb{P}[X > t] \leq 1 - \delta_1(t, k) และ P[X&lt;z]≤1−δ2(z,k)P[X&lt;z]≤1−δ2(z,k) \mathbb{P}[X < z] \leq 1 - \delta_2(z, k) โดยที่และเป็นฟังก์ชั่นบางอย่าง ตัวชี้ไปยังเอกสารที่เกี่ยวข้องจะได้รับการชื่นชมδ1δ1\delta_1δ2δ2\delta_2

2
Wolfram Mathworld ทำผิดที่อธิบายการแจกแจงความน่าจะเป็นแบบแยกโดยใช้ฟังก์ชันความหนาแน่นของความน่าจะเป็นหรือไม่?
โดยปกติการแจกแจงความน่าจะเป็นเหนือตัวแปรที่ไม่ต่อเนื่องนั้นถูกอธิบายโดยใช้ฟังก์ชันความน่าจะเป็นมวล (PMF): เมื่อทำงานกับตัวแปรสุ่มต่อเนื่องเราจะอธิบายการแจกแจงความน่าจะเป็นโดยใช้ฟังก์ชันความหนาแน่นของความน่าจะเป็น (PDF) แทนที่จะเป็นฟังก์ชันมวลความน่าจะเป็น - การเรียนรู้อย่างลึกซึ้งโดย Goodfellow, Bengio และ Courville อย่างไรก็ตามWolfram Mathworldใช้ PDF เพื่ออธิบายการแจกแจงความน่าจะเป็นผ่านตัวแปรที่ไม่ต่อเนื่อง: นี่เป็นความผิดพลาดหรือไม่? หรือมันไม่สำคัญอะไร

2
ฉันสามารถใช้ช่วงเวลาของการแจกแจงเพื่อเก็บตัวอย่างการกระจายได้หรือไม่
ฉันสังเกตเห็นในวิธีการเรียนรู้สถิติ / เครื่องการแจกแจงมักจะเป็นแบบเกาส์จากนั้นก็ใช้แบบเกาส์สำหรับการสุ่มตัวอย่าง พวกเขาเริ่มต้นโดยการคำนวณทั้งสองช่วงเวลาแรกของการจัดจำหน่ายและการใช้งานเหล่านั้นเพื่อประเมินμμ\muและ 2 จากนั้นพวกเขาสามารถสุ่มตัวอย่างจากเกาส์นนั้นได้σ2σ2\sigma^2 ดูเหมือนว่าสำหรับฉันในช่วงเวลาที่ฉันคำนวณมากขึ้นฉันควรจะประมาณตัวอย่างการกระจายตัวที่ดีกว่าที่ฉันต้องการ จะเกิดอะไรขึ้นถ้าฉันคำนวณ 3 ช่วงเวลา ... ฉันจะใช้สิ่งเหล่านั้นเพื่อสุ่มตัวอย่างจากการแจกแจงได้อย่างไร และนี่สามารถขยายไปสู่ช่วงเวลา N ได้หรือไม่?

3
ถ้าเป็น IID ให้คำนวณโดยที่
คำถาม หากมี IID แล้วคำนวณที่x_iX1,⋯,Xn∼N(μ,1)X1,⋯,Xn∼N(μ,1)X_1,\cdots,X_n \sim \mathcal{N}(\mu, 1)E(X1∣T)E(X1∣T)\mathbb{E}\left( X_1 \mid T \right)T=∑iXiT=∑iXiT = \sum_i X_i ความพยายาม : โปรดตรวจสอบว่าด้านล่างถูกต้องหรือไม่ สมมติว่าเราใช้ผลรวมของความคาดหวังตามเงื่อนไขเหล่านั้น หมายความว่าแต่ละตั้งแต่คือ IID∑iE(Xi∣T)=E(∑iXi∣T)=T.∑iE(Xi∣T)=E(∑iXi∣T)=T.\begin{align} \sum_i \mathbb{E}\left( X_i \mid T \right) = \mathbb{E}\left( \sum_i X_i \mid T \right) = T . \end{align}E(Xi∣T)=TnE(Xi∣T)=Tn\mathbb{E}\left( X_i \mid T \right) = \frac{T}{n}X1,…,XnX1,…,XnX_1,\ldots,X_n ดังนั้นE(X1∣T)=TnE(X1∣T)=Tn\mathbb{E}\left( X_1 \mid T \right) = \frac{T}{n}{n} …

4
ความน่าจะเป็นที่สมมติฐานของ Null นั้นเป็นจริง
ดังนั้นนี่อาจเป็นคำถามทั่วไป แต่ฉันไม่เคยพบคำตอบที่น่าพอใจ คุณจะตัดสินความน่าจะเป็นที่สมมติฐานว่างเป็นจริงได้อย่างไร (หรือเท็จ) สมมติว่าคุณให้นักเรียนทดสอบสองรุ่นที่แตกต่างกันและต้องการดูว่ารุ่นนั้นเทียบเท่ากันหรือไม่ คุณทำการทดสอบ t และให้ค่า p เป็น. 02 ช่างเป็นสิ่งที่คุ้มค่า! นั่นต้องหมายความว่าไม่น่าเป็นไปได้ที่การทดสอบจะเทียบเท่ากันใช่มั้ย ไม่น่าเสียดายที่ปรากฏว่า P (ผลลัพธ์ | null) ไม่ได้บอกคุณ P (null | ผลลัพธ์) สิ่งปกติที่ต้องทำคือการปฏิเสธสมมติฐานว่างเมื่อเราพบ p-value ต่ำ แต่เราจะรู้ได้อย่างไรว่าเราไม่ปฏิเสธสมมติฐานว่างที่น่าจะเป็นจริง? เพื่อยกตัวอย่างที่โง่ฉันสามารถออกแบบการทดสอบสำหรับอีโบลาด้วยอัตราบวกที่ผิดพลาดที่. 02: ใส่ 50 ลูกลงในถังและเขียน“ อีโบลา” ในที่เดียว ถ้าฉันทดสอบบางคนด้วยสิ่งนี้และพวกเขาเลือกลูกบอล "อีโบลา" ค่า p (P (เลือกลูก | พวกเขาไม่มีอีโบลา)) คือ. 02 สิ่งที่ฉันได้พิจารณาแล้ว: สมมติว่า P (null | ผลลัพธ์) …

2
กรณีการเลือกปฏิบัติในเอเชียของ Palantir: ความน่าจะเป็นคำนวณได้อย่างไร
ฉันอ่านบทความนี้เกี่ยวกับกรณีของ Palantir ที่ฝ่ายแรงงานกล่าวหาว่าพวกเขาเลือกปฏิบัติต่อชาวเอเชีย ไม่มีใครรู้ว่าพวกเขาได้รับการประเมินความน่าจะเป็นเหล่านี้จากที่ไหน ฉันไม่ได้รับ 1/741 ในรายการ (ก) (a) สำหรับตำแหน่ง QA Engineer จากกลุ่มผู้สมัครที่มีคุณสมบัติมากกว่า 730 คนซึ่งประมาณ 77% เป็นชาวเอเชีย - Palantir จ้างผู้สมัครที่ไม่ใช่ชาวเอเชียหกคนและผู้สมัครเอเชียเพียงคนเดียว ผลกระทบที่คำนวณโดย OFCCP มีค่าเกินกว่าสามส่วนเบี่ยงเบนมาตรฐาน โอกาสที่ผลลัพธ์นี้จะเกิดขึ้นตามโอกาสนั้นอยู่ที่ประมาณหนึ่งใน 741 (b) สำหรับตำแหน่งวิศวกรซอฟต์แวร์จากกลุ่มผู้สมัครที่มีคุณสมบัติมากกว่า 1,160 คนหรือประมาณ 85% เป็นชาวเอเชีย - Palantir จ้างผู้สมัครที่ไม่ใช่ชาวเอเชีย 14 คนและผู้สมัครชาวเอเชียเพียง 11 คน ผลกระทบที่คำนวณโดย OFCCP เกินกว่า 5 ส่วนเบี่ยงเบนมาตรฐาน โอกาสที่ผลลัพธ์นี้เกิดขึ้นตามโอกาสนั้นอยู่ที่ประมาณหนึ่งใน 3.4 ล้าน (c) สำหรับตำแหน่ง QA Engineer …

3
การอ้างอิงที่แสดงให้เห็นถึงการใช้ Gaussian Mixtures
แบบจำลองการผสมแบบเกาส์ (GMMs) มีความน่าสนใจเพราะง่ายต่อการทำงานกับทั้งในเชิงวิเคราะห์และในทางปฏิบัติ มีคุณสมบัติการวิเคราะห์เล็กน้อยที่เราควรคาดว่าจะมีซึ่งไม่ชัดเจนโดยทั่วไป โดยเฉพาะอย่างยิ่ง: SnSnS_nnnnPPPnnnPPPlimn→∞infP^∈SnD(P||P^)=0?limn→∞infP^∈SnD(P||P^)=0?\lim_{n\rightarrow \infty}\inf_{\hat{P}\in S_n} D(P||\hat{P})=0? บอกว่าเรามีการกระจายอย่างต่อเนื่องและเราได้พบ -component ผสมแบบเกาส์ซึ่งอยู่ใกล้กับPในรูปแบบรวม: \ เดลต้า (P \ hat {P}) &lt;\ varepsilon เราสามารถผูกD (P || \ hat {P})ในแง่ของ\ epsilon ได้หรือไม่?N P P δ ( P , P ) &lt; ε D ( P | | P ) εPPPNNNP^P^\hat{P}PPPδ(P,P^)&lt;εδ(P,P^)&lt;ε\delta(P,\hat{P})<\varepsilonD(P||P^)D(P||P^)D(P||\hat{P})ϵϵ\epsilon ถ้าเราต้องการสังเกตุผ่านเสียงเพิ่มเติมอิสระY \ sim P_Y …

3
เหตุใดจำนวนของตัวแปรสม่ำเสมออย่างต่อเนื่องใน (0,1) จำเป็นสำหรับผลรวมของพวกเขาที่มากกว่าหนึ่งมีค่าเฉลี่ย
ขอให้เราสรุปกระแสตัวแปรสุ่ม, Xi∼iidU(0,1)Xi∼iidU(0,1)X_i \overset{iid}\sim \mathcal{U}(0,1) ; ให้YYYเป็นจำนวนเทอมที่เราต้องการสำหรับผลรวมเกินหนึ่งกล่าวคือYYYเป็นจำนวนน้อยที่สุดเช่นนั้น X1+X2+⋯+XY&gt;1.X1+X2+⋯+XY&gt;1.X_1 + X_2 + \dots + X_Y > 1. ทำไมเฉลี่ยของYYYเท่ากับออยเลอร์คงeee ? E(Y)=e=10!+11!+12!+13!+…E(Y)=e=10!+11!+12!+13!+…\mathbb{E}(Y) = e = \frac{1}{0!} + \frac{1}{1!} + \frac{1}{2!} + \frac{1}{3!} + \dots

1
ค่าเฉลี่ยเดียวกัน, ความแปรปรวนต่างกัน
สมมติว่าคุณมีนักวิ่งแปดคนวิ่งแข่ง การกระจายตัวของเวลาทำงานส่วนตัวของพวกเขาคือปกติและแต่ละช่วงเวลามีความยาว111111วินาที ค่าเบี่ยงเบนมาตรฐานของรองชนะเลิศอันดับหนึ่งคือค่าที่เล็กที่สุดสองค่าที่สองที่เล็กที่สุดค่าที่สามน้อยที่สุดและแปดค่าที่ใหญ่ที่สุด คำถามสองข้อทำให้ฉันสับสน: (1) ความน่าจะเป็นที่ผู้ชนะคนสุดท้ายคืออะไรและ (2) ใครที่มีแนวโน้มจะชนะการแข่งขันมากที่สุด? คำตอบของฉันมี1/21/21/2และ888ตามลำดับ เนื่องจากพวกเขาแบ่งปันค่าเฉลี่ยเท่ากันน่าจะเป็นที่x¯1−x¯8&lt;0x¯1−x¯8&lt;0\bar x_1-\bar x_8\lt 0เป็นเพียง1/21/21/2ไม่? ฉันจะแสดงให้เห็นถึงส่วนที่สองอย่างจริงจังและสามารถคำนวณความน่าจะเป็นที่แน่นอนได้อย่างไร ขอบคุณล่วงหน้า.

4
มีอคติในการเลือกคณะลูกขุน?
เพื่อนเป็นตัวแทนของลูกค้าเกี่ยวกับการอุทธรณ์หลังจากการพิจารณาคดีทางอาญาซึ่งปรากฏว่าการคัดเลือกคณะลูกขุนมีความลำเอียงทางเชื้อชาติ คณะลูกขุนประกอบด้วย 30 คนในกลุ่มเชื้อชาติ 4 กลุ่ม การฟ้องร้องใช้ความท้าทายแบบไม่ต้องลงแรงเพื่อกำจัดคนเหล่านี้ 10 คนออกจากกลุ่ม จำนวนคนและจำนวนความท้าทายที่เกิดขึ้นจริงในแต่ละกลุ่มเชื้อชาติตามลำดับ: A: 10, 1 B: 10, 4 C: 6, 4 D: 4, 1 total: 30 in pool, 10 challenges จำเลยก็มาจากเชื้อชาติกลุ่มซีและผู้ที่ตกเป็นเหยื่อจากกลุ่มเชื้อชาติและ D เพื่อความกังวลเบื้องต้นไม่ว่าจะเป็นกลุ่ม C มีมากกว่าที่ท้าทายและกลุ่ม A และ D ภายใต้การท้าทาย ถูกต้องตามกฎหมาย (IIUC; IANAL) การป้องกันไม่จำเป็นต้องพิสูจน์ความลำเอียงทางเชื้อชาติ แต่เพียงเพื่อแสดงให้เห็นว่าข้อมูลดูเหมือนจะบ่งบอกถึงความลำเอียงซึ่งทำให้ภาระในการฟ้องร้องอธิบายความท้าทายที่ไม่ใช่เชื้อชาติ การวิเคราะห์ต่อไปนี้ถูกต้องในแนวทางของมันหรือไม่? (ฉันคิดว่าการคำนวณนั้นใช้ได้): มี nCr (30,10) = 30,045,015 ชุดที่แตกต่างกันของสมาชิกพูล …

3
วิธีการคำนวณการทับซ้อนระหว่างความหนาแน่นของความน่าจะเป็นเชิงประจักษ์
ฉันกำลังมองหาวิธีการคำนวณพื้นที่ทับซ้อนระหว่างการประมาณความหนาแน่นเคอร์เนลสองตัวใน R เป็นการวัดความคล้ายคลึงกันระหว่างสองตัวอย่าง เพื่อชี้แจงในตัวอย่างต่อไปนี้ฉันจะต้องหาปริมาณของพื้นที่ที่ทับซ้อนกันของสีม่วง: library(ggplot2) set.seed(1234) d &lt;- data.frame(variable=c(rep("a", 50), rep("b", 30)), value=c(rnorm(50), runif(30, 0, 3))) ggplot(d, aes(value, fill=variable)) + geom_density(alpha=.4, color=NA) มีการอภิปรายคำถามที่คล้ายกันที่นี่ความแตกต่างที่ฉันต้องทำสำหรับข้อมูลเชิงประจักษ์โดยพลการมากกว่าการแจกแจงปกติที่กำหนดไว้ล่วงหน้า overlapแพคเกจที่อยู่คำถามนี้ แต่เห็นได้ชัดเฉพาะข้อมูลการประทับเวลาซึ่งไม่ทำงานสำหรับฉัน ดัชนี Bray-Curtis (ตามการนำไปใช้ในฟังก์ชั่นveganของบรรจุภัณฑ์vegdist(method="bray")) ก็มีความเกี่ยวข้องเช่นกัน แต่สำหรับข้อมูลที่แตกต่างกันบ้าง ฉันสนใจทั้งวิธีการทางทฤษฎีและฟังก์ชัน R ที่ฉันอาจใช้เพื่อนำไปใช้

2
การกระจายตัวของความแปรปรวนของตัวแปรกำลังสองและไคสแควร์?
ปัญหาต่อไปนี้เกิดขึ้นเมื่อเร็ว ๆ นี้ขณะวิเคราะห์ข้อมูล หากตัวแปรสุ่ม X ตามการแจกแจงปกติและ Y ตามการแจกแจงχ2nχn2\chi^2_n (ด้วย n dof) Z=X2+Y2Z=X2+Y2Z = X^2 + Y^2กระจายอย่างไร ถึงตอนนี้ฉันมากับ pdf ของY2Y2Y^2 : ψ2n(x)====∂F(x−−√)∂x(∫x√0tn/2−1⋅e−t/22n/2Γ(n/2)dt)′x12n/2Γ(n/2)⋅(x−−√)n/2−1⋅e−x√/2⋅(x−−√)′x12n/2−1Γ(n/2)⋅xn/4−1⋅e−x√/2ψn2(x)=∂F(x)∂x=(∫0xtn/2−1⋅e−t/22n/2Γ(n/2)dt)x′=12n/2Γ(n/2)⋅(x)n/2−1⋅e−x/2⋅(x)x′=12n/2−1Γ(n/2)⋅xn/4−1⋅e−x/2\begin{eqnarray} \psi^2_n(x) &=& \frac{\partial F(\sqrt{x})}{\partial x} \\ &=& \left( \int_0^{\sqrt{x}} \frac{t^{n/2-1}\cdot e^{-t/2}}{2^{n/2}\Gamma(n/2)} \mathrm{d}t \right)^\prime_x \\ &=& \frac{1}{2^{n/2}\Gamma(n/2)} \cdot \left( \sqrt{x} \right)^{n/2-1} \cdot e^{-\sqrt{x}/2} \cdot \left( \sqrt{x} \right)^\prime_x \\ &=& \frac{1}{2^{n/2-1}\Gamma(n/2)} …

4
ตัวอย่างการปฏิบัติสำหรับ MCMC
ฉันกำลังจะไปบรรยายที่เกี่ยวข้องกับ MCMC อย่างไรก็ตามฉันไม่พบตัวอย่างที่ดีของวิธีการใช้งาน ใครช่วยยกตัวอย่างที่เป็นรูปธรรมให้ฉันได้บ้าง ทั้งหมดที่ฉันเห็นคือพวกเขาใช้โซ่มาร์คอฟและบอกว่าการกระจายแบบคงที่คือการกระจายที่ต้องการ ฉันต้องการตัวอย่างที่ดีที่การแจกแจงที่ต้องการนั้นยากที่จะสุ่มตัวอย่าง ดังนั้นเราจึงสร้างเชนมาร์คอฟ ฉันต้องการทราบวิธีการเลือกเมทริกซ์การเปลี่ยนแปลงเพื่อให้การกระจายแบบคงที่ของเชนมาร์คอฟคือการกระจายเป้าหมายขอบคุณ

2
ทำไมความน่าจะเป็นศูนย์สำหรับค่าที่กำหนดจากการแจกแจงแบบปกติคืออะไร?
ฉันสังเกตว่าในการแจกแจงแบบปกติความน่าจะเป็นเท่ากับศูนย์ในขณะที่การแจกแจงปัวซองนั้นจะไม่เท่ากับศูนย์เมื่อเป็นจำนวนเต็มที่ไม่เป็นลบcP( x = c )P(x=c)P(x=c)คcc คำถามของฉันคือความน่าจะเป็นของค่าคงที่ใด ๆ ในการแจกแจงแบบปกติเท่ากับศูนย์หรือไม่เพราะมันหมายถึงพื้นที่ภายใต้โค้งใด ๆ หรือเป็นเพียงกฎที่จะจดจำเท่านั้น?

2
ชุดซอฟต์แวร์ที่เหมาะสมที่สุดสำหรับการวิเคราะห์แบบเบย์
ฉันสงสัยว่าพวกคุณแนะนำแพคเกจทางสถิติสำหรับการดำเนินการอนุมานแบบเบย์ ตัวอย่างเช่นฉันรู้ว่าคุณสามารถเรียกใช้ openBUGS หรือ winBUGS เป็น standalones หรือคุณสามารถเรียกพวกเขาจาก R แต่ R ยังมีแพ็คเกจของตัวเองหลายตัว (MCMCPack, BACCO) ซึ่งสามารถทำการวิเคราะห์แบบเบส์ ไม่มีใครมีคำแนะนำใด ๆ ที่เป็นแพคเกจสถิติเบย์ใน R ที่ดีที่สุดหรือเกี่ยวกับทางเลือกอื่น ๆ (Matlab หรือ Mathematica?) คุณสมบัติหลักที่ฉันต้องการเปรียบเทียบคือประสิทธิภาพการใช้งานง่ายความเสถียรและความยืดหยุ่น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.