คำถามติดแท็ก distributions

การแจกแจงเป็นการอธิบายทางคณิตศาสตร์ของความน่าจะเป็นหรือความถี่

11
สัญชาตญาณของการกระจายเบต้าคืออะไร
ข้อจำกัดความรับผิดชอบ: ฉันไม่ใช่นักสถิติ แต่เป็นวิศวกรซอฟต์แวร์ ความรู้เกี่ยวกับสถิติส่วนใหญ่มาจากการเรียนรู้ด้วยตนเองดังนั้นฉันยังมีช่องว่างมากมายในการทำความเข้าใจแนวคิดที่อาจดูไม่สำคัญสำหรับคนอื่นที่นี่ ดังนั้นฉันจะขอบคุณมากถ้าคำตอบมีคำศัพท์เฉพาะน้อยกว่าและคำอธิบายเพิ่มเติม ลองนึกภาพว่าคุณกำลังคุยกับคุณยายอยู่ :) ฉันพยายามที่จะเข้าใจลักษณะของการแจกแจงเบต้า - สิ่งที่ควรใช้และวิธีตีความในแต่ละกรณี ถ้าเราพูดถึงการกระจายตัวแบบปกติเราสามารถอธิบายได้ว่าเป็นเวลาที่รถไฟมาถึง: บ่อยที่สุดมันมาถึงในเวลาน้อยกว่าบ่อยครั้งคือ 1 นาทีก่อนหน้าหรือ 1 นาทีและไม่ค่อยมาถึงด้วยความแตกต่าง 20 นาทีจากค่าเฉลี่ย การแจกแจงแบบสม่ำเสมอจะอธิบายโอกาสของตั๋วแต่ละใบด้วยลอตเตอรี การแจกแจงแบบทวินามอาจอธิบายได้ด้วยการโยนเหรียญและอื่น ๆ แต่มีคำอธิบายที่เข้าใจง่ายเกี่ยวกับการแจกแจงเบต้าหรือไม่ สมมติว่าα=.99α=.99\alpha=.99และ\β=.5β=.5\beta=.5การกระจายเบต้าB(α,β)B(α,β)B(\alpha, \beta)ในกรณีนี้มีลักษณะเช่นนี้ (สร้างใน R): แต่จริงๆแล้วมันหมายถึงอะไร? เห็นได้ชัดว่าแกน Y เป็นความหนาแน่นของความน่าจะเป็น แต่สิ่งที่อยู่ในแกน X? ฉันขอขอบคุณคำอธิบายใด ๆ ไม่ว่าจะด้วยตัวอย่างนี้หรืออย่างอื่น

2
เมื่อใด (และทำไม) คุณควรบันทึกการกระจาย (ของตัวเลข)?
สมมติว่าฉันมีข้อมูลในอดีตเช่นราคาหุ้นที่ผ่านมาความผันผวนของราคาตั๋วเครื่องบินข้อมูลทางการเงินในอดีตของ บริษัท ... ตอนนี้มีใครบางคน (หรือบางสูตร) มาพร้อมและกล่าวว่า "ขอใช้เวลา / ใช้เข้าสู่ระบบของการกระจาย" และนี่คือที่ที่ผมไปทำไม ? คำถาม: ทำไมคนเราควรจดบันทึกการกระจายสินค้าตั้งแต่แรก? บันทึกของการแจกแจง 'ให้ / ลดความซับซ้อน' ที่การกระจายดั้งเดิมไม่สามารถทำได้ / ไม่ได้? การเปลี่ยนแปลงบันทึกเป็น 'ไม่สูญเสีย' หรือไม่? คือเมื่อเปลี่ยนเป็น log-space และวิเคราะห์ข้อมูลข้อสรุปเดียวกันนี้มีไว้สำหรับการแจกแจงดั้งเดิมหรือไม่? มาทำไม และในที่สุดเมื่อไหร่ที่จะบันทึกการกระจาย? ภายใต้เงื่อนไขใดบ้างที่ตัดสินใจทำเช่นนี้ ฉันต้องการเข้าใจการแจกแจงแบบอิงบันทึก (เช่น lognormal) แต่ฉันไม่เคยเข้าใจแง่มุมว่าเมื่อใด / ทำไม - นั่นคือบันทึกการแจกแจงเป็นการแจกแจงแบบปกติดังนั้นจะเป็นอย่างไร สิ่งนั้นบอกอะไรกับฉันและทำไมตื๊อ ดังนั้นคำถาม! UPDATE : ตามความเห็นของ @ whuber ฉันดูที่โพสต์และด้วยเหตุผลบางอย่างฉันเข้าใจการใช้ log แปรรูปและการประยุกต์ในการถดถอยเชิงเส้นเนื่องจากคุณสามารถวาดความสัมพันธ์ระหว่างตัวแปรอิสระและบันทึกของตัวแปรตาม อย่างไรก็ตามคำถามของฉันเป็นเรื่องทั่วไปในแง่ของการวิเคราะห์การกระจายตัวเอง - ไม่มีความสัมพันธ์ต่อกันที่ฉันสามารถสรุปได้เพื่อช่วยให้เข้าใจเหตุผลของการบันทึกเพื่อวิเคราะห์การกระจาย …

8
ในการถดถอยเชิงเส้นเมื่อใดที่เหมาะสมที่จะใช้บันทึกของตัวแปรอิสระแทนที่จะเป็นค่าจริง
ฉันกำลังมองหาการกระจายการประพฤติที่ดีขึ้นสำหรับตัวแปรอิสระที่เป็นปัญหาหรือเพื่อลดผลกระทบของค่าผิดปกติหรืออย่างอื่นหรือไม่?

6
มูลค่าการแจกแจงความน่าจะเป็นที่เกิน 1 สามารถเป็นได้หรือไม่?
ในหน้า Wikipedia เกี่ยวกับตัวแยกประเภทซื่อๆ Bayesมีบรรทัดนี้: p(height|male)=1.5789p(height|male)=1.5789p(\mathrm{height}|\mathrm{male}) = 1.5789 (การกระจายความน่าจะเป็นที่มากกว่า 1 คือ OK มันคือพื้นที่ใต้เส้นโค้งระฆังที่เท่ากับ 1) ค่าจะตกลงได้อย่างไร? ผมคิดว่าน่าจะเป็นค่าทั้งหมดถูกแสดงในช่วง1 นอกจากนี้หากเป็นไปได้ที่จะมีค่าเช่นนั้นค่าที่ได้จากตัวอย่างที่แสดงในหน้าเป็นอย่างไร>1>1>10≤p≤10≤p≤10 \leq p \leq 1

2
วิธีการตรวจสอบการกระจายที่เหมาะกับข้อมูลของฉันที่ดีที่สุด?
ฉันมีชุดข้อมูลและต้องการทราบว่าการกระจายแบบใดที่เหมาะกับข้อมูลของฉันที่สุด ฉันใช้fitdistr()ฟังก์ชันเพื่อประมาณค่าพารามิเตอร์ที่จำเป็นเพื่ออธิบายการแจกแจงแบบสมมติ (เช่น Weibull, Cauchy, Normal) การใช้พารามิเตอร์เหล่านั้นฉันสามารถทำการทดสอบ Kolmogorov-Smirnov เพื่อประเมินว่าข้อมูลตัวอย่างของฉันมาจากการแจกแจงแบบเดียวกับการแจกแจงแบบสันนิษฐานของฉันหรือไม่ หากค่า p คือ> 0.05 ฉันสามารถสรุปได้ว่าข้อมูลตัวอย่างถูกดึงมาจากการแจกแจงแบบเดียวกัน แต่ค่า p ไม่ได้ให้ข้อมูลเกี่ยวกับความเหมาะสมของพระเจ้าใช่ไหม? ดังนั้นในกรณีที่ค่า p ของข้อมูลตัวอย่างของฉันคือ> 0.05 สำหรับการแจกแจงแบบปกติรวมถึงการแจกแบบไวบูลฉันจะรู้ได้อย่างไรว่าการแจกแจงแบบใดที่เหมาะกับข้อมูลของฉันดีกว่า นี่เป็นสิ่งที่ฉันทำ: > mydata [1] 37.50 46.79 48.30 46.04 43.40 39.25 38.49 49.51 40.38 36.98 40.00 [12] 38.49 37.74 47.92 44.53 44.91 44.91 40.00 41.51 47.92 36.98 43.40 [23] …

3
ช่วยฉันเข้าใจการแจกแจงแบบเบย์ก่อนและหลัง
ในกลุ่มนักเรียนมี 2 จาก 18 คนที่ถนัดซ้าย ค้นหาการกระจายด้านหลังของนักเรียนที่ถนัดซ้ายในประชากรที่คาดไม่ถึงมาก่อน สรุปผลลัพธ์ ตามวรรณกรรม 5-20% ของคนถนัดซ้าย นำข้อมูลนี้ไปพิจารณาก่อนและคำนวณหลังใหม่ ฉันรู้ว่าควรใช้การกระจายเบต้าที่นี่ ก่อนอื่นด้วยค่าและเป็น 1? สมการที่ฉันพบในวัสดุสำหรับด้านหลังคือαα\alphaββ\beta π(r|Y)∝r(Y+−1)×(1−r)(N−Y+−1)π(r|Y)∝r(Y+−1)×(1−r)(N−Y+−1)\pi(r \vert Y ) \propto r^{(Y +−1)} \times (1 − r)^{(N−Y +−1)} \\ Y=2Y=2Y=2N = 18 ,N=18N=18N=18 ทำไมในสมการนั้น? (แสดงถึงสัดส่วนของคนซ้ายส่ง) ไม่เป็นที่รู้จักดังนั้นมันจะอยู่ในสมการนี้ได้อย่างไร? สำหรับผมแล้วมันดูเหมือนว่าไร้สาระในการคำนวณรับและใช้ในสมการให้Rดีกับตัวอย่างผลที่ได้0,0019ฉันควรจะได้ข้อสรุปจากที่?rrrrrrrrrYYYrrrrrrr=2/18r=2/18r=2/180,00190,00190,0019fff สมการที่ให้ค่าคาดหวังของทราบและทำงานได้ดีขึ้นและให้ซึ่งฟังต้อง สมการเป็นE (R | X, N, α, β) = (α + X) / (α …

4
ประเมินการกระจายตัวของข้อมูลโดยประมาณตามฮิสโตแกรม
สมมติว่าฉันต้องการดูว่าข้อมูลของฉันเป็นเลขชี้กำลังอิงตามฮิสโตแกรมหรือไม่ (เช่นเอียงไปทางขวา) ฉันสามารถรับฮิสโตแกรมที่แตกต่างกันอย่างดุเดือดขึ้นอยู่กับว่าฉันจัดกลุ่มหรือถังข้อมูล ฮิสโทแกรมหนึ่งชุดจะทำให้ดูเหมือนว่าข้อมูลเป็นเลขชี้กำลัง อีกชุดหนึ่งจะทำให้ดูเหมือนว่าข้อมูลไม่ได้อธิบาย ฉันจะกำหนดการแจกแจงจากฮิสโทแกรมที่กำหนดอย่างดีได้อย่างไร

10
ทำไมการแจกแจงโคชีจึงไม่มีความหมาย?
จากฟังก์ชันความหนาแน่นของการกระจายเราสามารถระบุค่าเฉลี่ย (= 0) สำหรับการแจกแจงโคชีเช่นเดียวกับกราฟด้านล่างที่แสดง แต่ทำไมเราถึงบอกว่าการกระจาย Cauchy นั้นไม่มีความหมายเลย?

10
การทำความเข้าใจ“ ความแปรปรวน” อย่างสังหรณ์ใจ
อะไรคือวิธีที่สะอาดและง่ายที่สุดในการอธิบายแนวคิดเรื่องความแปรปรวนของใครบางคน? มันหมายถึงอะไรอย่างสังหรณ์ใจ? ถ้ามีใครอธิบายเรื่องนี้ให้ลูกฟัง มันเป็นแนวคิดที่ฉันมีปัญหาในการสื่อสาร - โดยเฉพาะอย่างยิ่งเมื่อเกี่ยวข้องกับความแปรปรวนกับความเสี่ยง ฉันเข้าใจในเชิงคณิตศาสตร์และสามารถอธิบายได้เช่นกัน แต่เมื่ออธิบายปรากฏการณ์ในโลกแห่งความเป็นจริงคุณจะทำให้คนหนึ่งเข้าใจถึงความแปรปรวนและการบังคับใช้ใน 'โลกแห่งความจริง' ได้อย่างไร สมมติว่าเรากำลังจำลองการลงทุนในหุ้นโดยใช้ตัวเลขสุ่ม (กลิ้งแม่พิมพ์หรือใช้แผ่นงาน Excel ไม่สำคัญ) เราได้รับผลตอบแทนจากการลงทุนโดยเชื่อมโยงแต่ละตัวแปรสุ่มกับ 'การเปลี่ยนแปลงบางอย่าง' ในผลตอบแทน เช่น.: การกลิ้ง 1 หมายถึงการเปลี่ยนแปลง 0.8 ต่อ$ 1 ในการลงทุน 5 การเปลี่ยนแปลง 1.1 ต่อ$ 1 และอื่น ๆ ตอนนี้หากการจำลองนี้ดำเนินการประมาณ 50 ครั้ง (หรือ 20 หรือ 100) เราจะได้รับค่าบางอย่างและมูลค่าสุดท้ายของการลงทุน ดังนั้น 'ความแปรปรวน' จริง ๆ แล้วบอกอะไรเราถ้าเราจะคำนวณจากชุดข้อมูลด้านบน สิ่งใดที่ "เห็น" - หากความแปรปรวนปรากฎเป็น 1.7654 …

4
ความสัมพันธ์ระหว่างปัวส์ซองกับการแจกแจงแบบเลขชี้กำลัง
เวลาที่รอสำหรับการแจกแจงปัวซองคือการแจกแจงแบบเอ็กซ์โพเนนเชียลพร้อมพารามิเตอร์แลมบ์ดา แต่ฉันไม่เข้าใจ ปัวซองเป็นตัวอย่างจำนวนของการมาถึงต่อหน่วยเวลา สิ่งนี้เกี่ยวข้องกับการแจกแจงเอ็กซ์โปเนนเชียลอย่างไร ช่วยบอกว่าความน่าจะเป็นของการมาถึง k ในหน่วยของเวลาคือ P (k) (แบบจำลองโดยปัวซอง) และความน่าจะเป็นที่ k + 1 คือ P (k + 1), แบบจำลองการแจกแจงแบบเอ็กซ์โพเนนเชียล

8
สร้างตัวแปรสุ่มที่มีความสัมพันธ์ที่กำหนดไว้กับตัวแปรที่มีอยู่
สำหรับการศึกษาการจำลองฉันต้องสร้างตัวแปรสุ่มที่แสดง prefined (ประชากร) ความสัมพันธ์กับตัวแปรที่มีอยู่YYYY ฉันดูในRแพ็คเกจcopulaและCDVineสามารถสร้างการแจกแจงหลายตัวแปรแบบสุ่มด้วยโครงสร้างการพึ่งพาที่กำหนด อย่างไรก็ตามเป็นไปไม่ได้ที่จะแก้ไขหนึ่งในตัวแปรที่เป็นผลลัพธ์ของตัวแปรที่มีอยู่ ความคิดและลิงก์ไปยังฟังก์ชั่นที่มีอยู่นั้นได้รับการชื่นชม! สรุป: คำตอบที่ถูกต้องสองคำขึ้นมาพร้อมกับโซลูชันที่แตกต่าง: R สคริปต์โดย Caracal ซึ่งจะคำนวณตัวแปรสุ่มกับที่แน่นอน (ตัวอย่าง) ความสัมพันธ์กับตัวแปรที่กำหนดไว้ล่วงหน้า R ฟังก์ชั่นฉันพบตัวเองซึ่งจะคำนวณตัวแปรสุ่มที่มีการกำหนดประชากรความสัมพันธ์กับตัวแปรที่กำหนดไว้ล่วงหน้า [@ttnphns 'นอกจากนี้: ฉันใช้เสรีภาพในการขยายชื่อคำถามจากกรณีตัวแปรคงที่เดียวเป็นจำนวนคงที่ของตัวแปรคงที่; เช่นวิธีการสร้างตัวแปรที่มีคอร์เรชั่นที่กำหนดไว้ล่วงหน้าพร้อมกับตัวแปรคงที่บางตัวที่มีอยู่]

7
การคำนวณพารามิเตอร์ของการแจกแจงแบบเบต้าโดยใช้ค่าเฉลี่ยและความแปรปรวน
ฉันจะคำนวณพารามิเตอร์และสำหรับการแจกแจงแบบเบต้าได้อย่างไรถ้าฉันรู้ค่าเฉลี่ยและความแปรปรวนที่ฉันต้องการให้การกระจายมี ตัวอย่างของคำสั่ง R เพื่อทำสิ่งนี้จะเป็นประโยชน์มากที่สุดบีตาαα\alphaββ\beta

4
'ช่วงเวลา' เกี่ยวกับ 'ช่วงเวลา' ของการแจกแจงความน่าจะเป็นอย่างไร
ฉันรู้ว่าช่วงเวลาใดและวิธีการคำนวณและวิธีการใช้ฟังก์ชั่นสร้างช่วงเวลาเพื่อให้ได้ช่วงเวลาที่ดีขึ้น ใช่ฉันรู้คณิตศาสตร์ ตอนนี้ฉันต้องได้รับความรู้สถิติของฉันหล่อลื่นสำหรับการทำงานฉันคิดว่าฉันก็อาจจะถามคำถามนี้ - มันเป็นเรื่องที่จู้จี้ฉันประมาณสองสามปีที่ผ่านมาและในวิทยาลัยกลับไม่มีอาจารย์รู้คำตอบหรือจะเลิกคำถาม . ดังนั้นคำว่า "ช่วงเวลา" หมายถึงอะไรในกรณีนี้ ทำไมต้องเลือกคำนี้ มันฟังดูไม่ง่ายสำหรับฉัน (หรือฉันไม่เคยได้ยินมาก่อนเลยในมหาวิทยาลัย :) ลองคิดดูสิฉันก็อยากรู้อยากเห็นด้วยการใช้งานใน "โมเมนต์ความเฉื่อย";) แต่ตอนนี้เราไม่ได้สนใจเรื่องนี้ ดังนั้น "ชั่วขณะ" ของการกระจายหมายถึงอะไรและมันพยายามทำอะไรและทำไมคำนั้น! :) ทำไมไม่มีใครสนใจช่วงเวลา ในขณะนี้ฉันรู้สึกอย่างอื่นเกี่ยวกับช่วงเวลานั้น) PS: ใช่ฉันอาจถามคำถามที่คล้ายกันเกี่ยวกับความแปรปรวน แต่ฉันให้คุณค่าความเข้าใจที่เข้าใจง่ายกว่า 'ดูในหนังสือเพื่อค้นหา' :)


4
วิธีระบุการกระจาย bimodal?
ฉันเข้าใจว่าเมื่อเราพล็อตค่าเป็นแผนภูมิเราสามารถระบุการแจกแจงแบบ bimodal ได้โดยการสังเกตยอดเขาคู่ แต่คนเราพบว่าเป็นแบบโปรแกรม (ฉันกำลังมองหาอัลกอริทึม)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.