คำถามติดแท็ก distributions

การแจกแจงเป็นการอธิบายทางคณิตศาสตร์ของความน่าจะเป็นหรือความถี่

5
สิ่งที่ต้องเรียนรู้หลังจาก Casella & Berger
ฉันเป็นนักเรียนที่จบการศึกษาคณิตศาสตร์ที่มีพื้นฐานเล็กน้อยในวิชาคณิตศาสตร์ประยุกต์ ตั้งแต่ฤดูใบไม้ร่วงปีที่แล้วฉันได้เข้าเรียนในหนังสือของ Casella & Berger และฉันได้เสร็จสิ้นปัญหาการออกกำลังกายหลายร้อย (230+) หน้าในหนังสือ ตอนนี้ฉันอยู่ที่บทที่ 10 อย่างไรก็ตามเนื่องจากฉันไม่ได้เรียนวิชาเอกสถิติหรือวางแผนที่จะเป็นนักสถิติฉันไม่คิดว่าฉันจะสามารถใช้เวลาเป็นประจำเพื่อเรียนรู้การวิเคราะห์ข้อมูลต่อไป ประสบการณ์ของฉันจนถึงขณะนี้กำลังบอกฉันว่าการเป็นนักสถิติต้องมีการคำนวณที่น่าเบื่อมากมายที่เกี่ยวข้องกับการแจกแจงต่าง ๆ (Weibull, Cauchy, , F ... ) ฉันพบว่าในขณะที่แนวคิดพื้นฐานง่าย ๆ การใช้งาน (ตัวอย่างเช่น LRT ในการทดสอบสมมติฐาน) ยังคงเป็นเรื่องยากเนื่องจากเทคนิคเสื้อเสื้อtFFF ความเข้าใจของฉันถูกต้องหรือไม่ มีวิธีที่ฉันสามารถเรียนรู้ความน่าจะเป็น & สถิติที่ไม่เพียง แต่ครอบคลุมเนื้อหาขั้นสูง แต่ยังสามารถช่วยในกรณีที่ฉันต้องการวิเคราะห์ข้อมูลในชีวิตจริงได้หรือไม่? ฉันจะต้องใช้จ่าย 20 ชั่วโมงต่อสัปดาห์หรือไม่กับที่เคยทำ≥≥\ge ในขณะที่ฉันเชื่อว่าไม่มีถนนหลวงในการเรียนรู้คณิตศาสตร์ฉันมักไม่สามารถช่วยสงสัยได้ - ส่วนใหญ่เราไม่ทราบว่าการแจกแจงนั้นเป็นข้อมูลในชีวิตจริงดังนั้นอะไรคือจุดประสงค์ของเราที่จะมุ่งเน้นเฉพาะครอบครัวของการแจกแจงแบบต่างๆ ? หากขนาดตัวอย่างมีขนาดเล็กและทฤษฎีบทขีด จำกัด กลางใช้ไม่ได้เราจะวิเคราะห์ข้อมูลอย่างถูกต้องนอกเหนือจากค่าเฉลี่ยตัวอย่างและความแปรปรวนได้อย่างไรหากการแจกแจงไม่เป็นที่รู้จัก ภาคการศึกษาของฉันจะสิ้นสุดในหนึ่งเดือนและฉันไม่ต้องการให้ความรู้ของฉันหายไปหลังจากที่ฉันเริ่มมุ่งเน้นการวิจัยระดับปริญญาเอกของฉัน ฉันเลยตัดสินใจถาม ฉันกำลังเรียนรู้ R และฉันมีพื้นหลังการเขียนโปรแกรมบ้าง แต่ระดับของฉันใกล้เคียงกับรหัสลิง

3
ฉันจะตรวจสอบได้อย่างไรว่าข้อมูลของฉันตรงกับการแจกแจงแบบเลขชี้กำลังหรือไม่
ฉันจะตรวจสอบได้อย่างไรว่าข้อมูลของฉันเช่นเงินเดือนมาจากการแจกแจงเลขชี้กำลังแบบต่อเนื่องใน R หรือไม่? นี่คือฮิสโตแกรมของตัวอย่างของฉัน: . ความช่วยเหลือใด ๆ จะได้รับการชื่นชมอย่างมาก!

1
ความแตกต่างระหว่างหางที่หนักและการกระจายของหางที่อ้วน
ฉันคิดว่าหางหนา = หางอ้วน แต่มีบางบทความที่ฉันอ่านให้ความรู้สึกว่ามันไม่ใช่ หนึ่งในนั้นกล่าวว่า: หางที่หนักหมายถึงการกระจายนั้นมีช่วงเวลาที่ไม่มีที่สิ้นสุดของ j สำหรับจำนวนเต็มบางส่วนในเจ นอกจากนี้ dfs ทั้งหมดใน pot-domain ที่ดึงดูดของ Pareto df นั้นมีเทลด์หนา ถ้าความหนาแน่นมียอดเขาสูงและหางยาวปานกลางความหนานั้นจะใหญ่มาก df ที่มี kurtosis มากกว่า 3 เป็นไขมันเทลด์หรือ leptokurtic ฉันยังไม่มีความแตกต่างที่เป็นรูปธรรมระหว่างสองสิ่งนี้ (หางที่หนักและหางที่มีไขมัน) ความคิดหรือตัวชี้ไปยังบทความที่เกี่ยวข้องจะได้รับการชื่นชม

9
ฉันจะทราบได้อย่างไรว่าการกระจายแบบใดที่แสดงข้อมูลนี้เกี่ยวกับเวลาตอบสนองการ ping
ฉันสุ่มตัวอย่างกระบวนการโลกแห่งความเป็นจริง, เวลา ping เครือข่าย "round-trip-time" วัดเป็นมิลลิวินาที ผลลัพธ์ถูกพล็อตในฮิสโตแกรม: Ping ครั้งมีค่าต่ำสุด แต่หางบนยาว ฉันต้องการทราบว่าการกระจายเชิงสถิติคืออะไรและจะประเมินค่าพารามิเตอร์ได้อย่างไร แม้ว่าการกระจายไม่ใช่การกระจายทั่วไปฉันยังสามารถแสดงสิ่งที่ฉันพยายามที่จะบรรลุ การแจกแจงปกติใช้ฟังก์ชัน: ด้วยพารามิเตอร์ทั้งสอง μ (หมายถึง) σ 2 (ความแปรปรวน) การประมาณค่าพารามิเตอร์ สูตรสำหรับการประมาณค่าพารามิเตอร์ทั้งสองคือ: ใช้สูตรเหล่านี้กับข้อมูลที่ฉันมีใน Excel ฉันจะได้รับ: μ = 10.9558 (หมายถึง) σ 2 = 67.4578 (ความแปรปรวน) ด้วยพารามิเตอร์เหล่านี้ฉันสามารถพล็อตการกระจาย " ปกติ " ด้านบนข้อมูลตัวอย่างของฉัน: เห็นได้ชัดว่าไม่ใช่การแจกแจงแบบปกติ การแจกแจงแบบปกติมีหางบนและล่างไม่ จำกัด และมีความสมมาตร การกระจายนี้ไม่สมมาตร ฉันจะใช้หลักการอะไร ฉันจะใช้ผังงานใดเพื่อกำหนดการกระจายแบบนี้ว่าเป็นอย่างไร ระบุว่าการแจกแจงไม่มีหางลบและหางยาวเป็นบวก: การกระจายแบบใดที่ตรงกับ? มีการอ้างอิงที่ตรงกับการแจกแจงของการสังเกตที่คุณทำหรือไม่? และการตัดการไล่ล่าสูตรสำหรับการแจกแจงนี้คืออะไรและสูตรการประมาณค่าพารามิเตอร์คืออะไร? ฉันต้องการรับการกระจายเพื่อให้ได้ค่า …

1
ทำไมการกระจายตัวตัวอย่างของความแปรปรวนเป็นการแจกแจงแบบไคสแควร์
คำสั่ง การแจกแจงตัวอย่างของความแปรปรวนตัวอย่างคือการแจกแจงแบบไคสแควร์ที่มีระดับความเป็นอิสระเท่ากับโดยที่คือขนาดตัวอย่าง (เนื่องจากตัวแปรสุ่มที่น่าสนใจกระจายอยู่ตามปกติ)n−1n−1n-1nnn แหล่ง สัญชาตญาณของฉัน มันค่อนข้างสมเหตุสมผลกับฉัน 1) เพราะการทดสอบไคสแควร์ดูเหมือนผลรวมของสแควร์และ 2) เพราะการแจกแจงแบบไคสแควร์เป็นเพียงผลรวมของการแจกแจงแบบปกติกำลังสอง แต่ถึงกระนั้นฉันไม่เข้าใจมัน คำถาม คำพูดนั้นเป็นจริงหรือไม่? ทำไม?

3
วิธีที่ไม่เหมาะสมก่อนนำไปสู่การกระจายหลังที่เหมาะสมได้อย่างไร
เรารู้ว่าในกรณีที่มีการกระจายก่อนที่เหมาะสม P( θ ∣ X) = P( X| θ ) P(θ )P( X)P(θ∣X)=P(X∣θ)P(θ)P(X)P(\theta \mid X) = \dfrac{P(X \mid \theta)P(\theta)}{P(X)} )α P(X∣ θ) P( θ )∝P(X∣θ)P(θ) \propto P(X \mid \theta)P(\theta) เหตุผลปกติสำหรับขั้นตอนนี้ก็คือการกระจายตัวของ , P ( X )นั้นคงที่เมื่อเทียบกับθและสามารถถูกละเว้นได้เมื่อได้รับการแจกแจงหลังXXXP(X)P(X)P(X)θθ\theta อย่างไรก็ตามในกรณีที่ไม่เหมาะสมมาก่อนคุณจะรู้ได้อย่างไรว่าการกระจายหลังมีอยู่จริง? ดูเหมือนจะมีบางสิ่งที่ขาดหายไปในข้อโต้แย้งที่เป็นวงกลม กล่าวอีกนัยหนึ่งถ้าฉันคิดว่ามีอยู่หลังฉันเข้าใจกลไกของการได้รับมา แต่ฉันดูเหมือนจะหายไปในทางทฤษฎีเหตุผลว่าทำไมมันถึงมีอยู่ ป.ล. ฉันยังรับรู้ว่ามีบางกรณีที่ก่อนหน้านี้ไม่เหมาะสมนำไปสู่การหลังที่ไม่เหมาะสม

5
ประจักษ์ CDF vs CDF
ฉันกำลังเรียนรู้เกี่ยวกับฟังก์ชั่นการกระจายการสะสม Empirical แต่ฉันก็ยังไม่เข้าใจ เหตุใดจึงเรียกว่า 'Empirical' Empirical CDF และ CDF ต่างกันหรือไม่?

7
บางคนสามารถช่วยอธิบายความแตกต่างระหว่างอิสระกับการสุ่มได้ไหม
ในสถิติอิสระและการสุ่มอธิบายลักษณะที่เหมือนกันหรือไม่ ความแตกต่างระหว่างพวกเขาคืออะไร เรามักจะเจอคำอธิบายเช่น "ตัวแปรสุ่มอิสระสองตัว" หรือ "สุ่มตัวอย่างแบบสุ่ม" ฉันสงสัยว่าอะไรคือความแตกต่างที่แน่นอนระหว่างพวกเขา ใครสามารถอธิบายสิ่งนี้และยกตัวอย่างได้บ้าง เช่นกระบวนการไม่อิสระ แต่สุ่ม

5
อะไรทำให้ค่าเฉลี่ยของการแจกแจงบางอย่างไม่ได้กำหนดไว้?
PDF จำนวนมากมีตั้งแต่ลบไปจนถึงอินฟินิตี้เป็นบวก แต่มีวิธีการบางอย่างที่กำหนดและบางไฟล์ไม่ใช่ ลักษณะทั่วไปอะไรทำให้มีการคำนวณบ้าง

2
การกระจายแบบไม่ต่อเนื่องนี้มีชื่อหรือไม่?
การกระจายแบบไม่ต่อเนื่องนี้มีชื่อหรือไม่? สำหรับi∈1...Ni∈1...Ni \in 1...N f(i)=1N∑Nj=i1jf(i)=1N∑j=iN1jf(i) = \frac{1}{N} \sum_{j = i}^N \frac{1}{j} ฉันเจอการกระจายตัวนี้จากรายการต่อไปนี้: ฉันมีรายการของรายการที่ถูกจัดอันดับโดยฟังก์ชั่นยูทิลิตี้ ฉันต้องการสุ่มเลือกหนึ่งในรายการโดยให้ความเอนเอียงไปยังจุดเริ่มต้นของรายการ ดังนั้นก่อนอื่นให้เลือกดัชนีระหว่าง 1 ถึงอย่างสม่ำเสมอ จากนั้นผมก็เลือกรายการระหว่างดัชนี 1 และเจฉันเชื่อว่ากระบวนการนี้ส่งผลให้เกิดการกระจายตัวข้างต้นj N jNNNJjjยังไม่มีข้อความNNJjj

3
การกระจายตัวของเศษไม้ที่ใหญ่ที่สุด (spacings)
ปล่อยให้แท่งที่มีความยาว 1 แตกเป็นชิ้นเล็ก ๆ น้อย ๆ โดยมีการสุ่มk + 1k+1k+1การกระจายตัวของความยาวของส่วนที่ยาวที่สุดคืออะไร? เป็นทางการมากขึ้นให้เป็น IIDและให้เป็นคำสั่งทางสถิติที่เกี่ยวข้องนั่นคือเราเพียงแค่สั่ง ตัวอย่างในลักษณะที่{(k)} ให้ขวา)( ยู1, … คุณk)(ยู1,...ยูk)(U_1, \ldots U_k)ยู( 0 , 1 )ยู(0,1)U(0,1)U ( 1 ) ≤ U ( 2 ) ≤ , … , ≤ U ( k ) Z k = สูงสุด( U ( 1 ) , U ( …

2
ผลรวมของตัวแปรสุ่มไคสแควร์ที่ไม่ใช่ศูนย์กลาง
ฉันต้องการค้นหาการกระจายตัวของตัวแปรสุ่ม Y= ∑i = 1n( Xผม)2Y=Σผม=1n(Xผม)2Y=\sum_{i=1}^{n}(X_i)^2 โดยที่Xผม∼ N( μผม, σ2ผม)Xผม~ยังไม่มีข้อความ(μผม,σผม2)X_i\sim{\cal{N}}(\mu_i,\sigma^2_i)และXผมXผมX_i s ทั้งหมดเป็นอิสระ ฉันรู้ว่ามันเป็นไปได้ที่จะหาผลิตภัณฑ์ของทุกช่วงเวลาที่สร้างฟังก์ชั่นสำหรับและจากนั้นแปลงกลับเพื่อให้ได้การแจกแจงของอย่างไรก็ตามฉันสงสัยว่ามีรูปแบบทั่วไปสำหรับ YXผมXผมX_iYYYYYY เช่นกรณี Gaussian: เรารู้ว่าผลรวมของ Gaussian อิสระยังคงเป็น Gaussian และดังนั้นเราจำเป็นต้องทราบค่าเฉลี่ยและความแปรปรวนสรุป วิธีการเกี่ยวกับทุก ? เงื่อนไขนี้จะทำให้การแก้ปัญหาทั่วไป?σ2ผม= σ2σผม2=σ2\sigma^2_i=\sigma^2

5
หลังเบย์ต้องมีการกระจายที่เหมาะสมหรือไม่?
ฉันรู้ว่านักบวชไม่จำเป็นต้องเหมาะสมและฟังก์ชั่นความน่าจะเป็นไม่ได้รวมเข้ากับ 1 เช่นกัน แต่คนหลังต้องมีการกระจายตัวที่เหมาะสมหรือไม่? อะไรคือความหมายถ้ามัน / ไม่

3
ตัวแปรสุ่มสองตัวมีการแจกแจงแบบเดียวกัน แต่แตกต่างกันอย่างแน่นอนหรือไม่?
เป็นไปได้ว่าตัวแปรสุ่มสองตัวมีการแจกแจงแบบเดียวกัน แต่พวกเขาก็เกือบจะแตกต่างกันแน่นอน?

1
การกระจายตัวเล็กน้อยของเส้นทแยงมุมของเมทริกซ์ Wishart แบบกระจาย
สมมติว่า ) ฉันสนใจในการกระจายร่อแร่ขององค์ประกอบในแนวทแยงวินิจฉัย( X ) = ( x 11 , ... , x พีพี ) มีผลลัพธ์ง่าย ๆ สองสามข้อเกี่ยวกับการกระจายตัวของเมทริกซ์ย่อยของX (อย่างน้อยก็บางอันอยู่ในวิกิพีเดีย) จากนี้ฉันสามารถคิดได้ว่าการกระจายตัวขององค์ประกอบเดี่ยวใด ๆ ในแนวทแยงเป็นแกมมาผกผัน แต่ฉันไม่สามารถอนุมานการกระจายข้อต่อได้X∼ InvWishart( ν, Σ0)X~InvWishart⁡(ν,Σ0)X\sim \operatorname{InvWishart}(\nu, \Sigma_0)วินิจฉัย( X) = ( x11, … , xพีพี)วินิจฉัย⁡(X)=(x11,...,xพีพี)\operatorname{diag}(X) = (x_{11}, \dots, x_{pp})XXX ฉันคิดว่าบางทีมันอาจจะมาจากองค์ประกอบเช่น: p ( x11|xผมฉัน, ฉัน> 1 ) p ( x22|xผมฉัน, ฉัน> …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.