คุณสมบัติของตัวแปรสุ่มไม่ต่อเนื่อง


11

หลักสูตรสถิติของฉันเพิ่งสอนฉันว่าตัวแปรสุ่มแบบแยกนั้นมีตัวเลือกจำนวนจำกัด ... ฉันไม่ได้ตระหนักถึงสิ่งนั้น ฉันคิดว่าคงมีจำนวนเต็มเป็นจำนวนอนันต์ Google และการตรวจสอบหน้าเว็บหลายหน้ารวมถึงบางส่วนจากหลักสูตรมหาวิทยาลัยไม่สามารถยืนยันได้โดยเฉพาะ อย่างไรก็ตามไซต์ส่วนใหญ่บอกว่าตัวแปรสุ่มแยกนั้นนับได้ - ฉันคิดว่านั่นหมายถึงการกำหนดหมายเลขอย่างถูกต้องหรือไม่

เป็นที่ชัดเจนว่าตัวแปรสุ่มแบบต่อเนื่องไม่มีที่สิ้นสุดแม้ว่า (ส่วนใหญ่?) มักจะถูก จำกัด ขอบเขต

แต่ถ้าตัวแปรสุ่มแบบแยกนั้นมีความเป็นไปได้ที่แน่นอนแล้วการกระจายตัวของจำนวนเต็มที่ไม่สิ้นสุดคืออะไร? มันไม่ต่อเนื่องหรือไม่ต่อเนื่อง? คำถามที่พบบ่อยนั้นเป็นเพราะตัวแปรมีแนวโน้มที่จะต่อเนื่อง & (ตามคำนิยาม) ไม่สิ้นสุดหรือไม่ต่อเนื่อง & จำกัด


10
คุณควรถามหลักสูตรสถิติของคุณเกี่ยวกับตัวแปรสุ่มและเรขาคณิตปัวซอง
ความน่าจะเป็นทาง

ออนไลน์แล้วข้อเสนอแนะที่มี จำกัด คุณกำลังบอกว่าพวกเขาเป็นตัวแปรประเภทที่สาม (และสี่?) ไม่ใช่แค่การกระจาย (!) เพียง?
James

4
การแจกแจงไม่ใช่ตัวแปรสุ่ม - และไม่สนใจว่าความแตกต่างมีความสับสนมากมาย ทฤษฎีบทที่สวยงามของคณิตศาสตร์ต้นศตวรรษที่ 20 ทฤษฎีบทการสลายตัวของ Lebesgueแสดงให้เห็นว่าจะเข้าใจการทำงานของการแจกแจงทั้งหมดซึ่งประกอบด้วยสามประเภทที่แตกต่าง: "ต่อเนื่อง" (ซึ่งแบ่งย่อยออกเป็นอย่างต่อเนื่องและต่อเนื่อง "
whuber

2
ไม่ใช่หลักสูตรที่ดีที่คุณกำลังฉันกลัว
Aksakal

สำหรับคำตอบทั้งหมดที่นี่ขอขอบคุณ (แม้ว่าบางอย่างจะอยู่เหนือหัวฉันฉันจะยอมรับ) ฉันอาจจะอ้างถึงสิ่งที่ก่อให้เกิดคำถามนี้ในการตรวจสอบฉันอาจตีความได้อย่างไม่ถูกต้อง: คำถามจริง / เท็จที่ระบุว่า "ตัวแปรสุ่มที่ไม่ต่อเนื่องสามารถรับค่าที่แตกต่างกันจำนวน จำกัด " ถือว่าเป็นจริง พร้อมคำอธิบายว่าคำสั่ง "เป็นหนึ่งในคุณสมบัติหลักของตัวแปรสุ่มแบบแยก" ถ้าเราสำรวจเกษตรกรถามจำนวนวัวที่พวกเขาเป็นเจ้าของมันจะเป็นไปไม่ได้ที่จะ จำกัด จำนวนไว้ก่อนมันไม่มีเหตุผลทางทฤษฎี แต่ไม่ต่อเนื่อง ... ?
James

คำตอบ:


15

ถ้านั่นคือสิ่งที่หลักสูตรของคุณพูดมันผิด

ในขณะที่การกระจายแบบไม่ต่อเนื่องสามารถมีผลลัพธ์ที่เป็นไปได้จำนวน จำกัด แต่ไม่จำเป็นต้อง; คุณสามารถมีการกระจายแบบไม่ต่อเนื่องที่มีจำนวนผลลัพธ์ที่เป็นไปได้ไม่ จำกัด จำนวนองค์ประกอบควรไม่เกินกว่าที่นับได้

ตัวอย่างทั่วไปคือการแจกแจงเชิงเรขาคณิต พิจารณาจำนวนการโยนเหรียญที่ยุติธรรมจนกว่าคุณจะได้รับหัว ไม่มีขอบเขตที่แน่นอนบนจำนวนของการโยนที่อาจจำเป็น อาจใช้เวลา 1 โยนหรือ 2 หรือ 3 หรือ 100 หรือหมายเลขอื่น ๆ

การกระจายแบบไม่ต่อเนื่องอาจเป็นค่าลบ (พิจารณาความแตกต่างระหว่างตัวแปรสุ่มสองตัวแปรที่กระจายแบบเรขาคณิตเช่นนั้นอาจเป็นจำนวนเต็มบวกหรือลบก็ได้)

การกระจายแบบไม่ต่อเนื่องไม่จำเป็นต้องมากกว่าจำนวนเต็มเหมือนในตัวอย่างของฉัน นั่นเป็นเพียงสถานการณ์ทั่วไปไม่ใช่ข้อกำหนด


ดังนั้นสภาพจริงที่ทำให้การกระจาย "ไม่ต่อเนื่อง" คืออะไร? :)
แมทธิว Drury

เงื่อนไขคือมันมี Lebesgue วัดศูนย์ไม่ใช่หรือไม่ @matthewDrury? ซึ่งในทางกลับกันนั้นจะเทียบเท่ากับการแจกแจงที่รวมกันเป็นหนึ่งตัวในชุดที่นับได้สูงสุด
Therkel

ฉันต้องยอมรับว่าฉันไม่รู้จักคำจำกัดความตามกฎหมาย ฉันอยากรู้เกี่ยวกับบทบาทของคะแนนสะสมทั้งหมดนี้
แมทธิวดรูรี่

1
@Therkel ฉันคิดว่าการกระจายตัวของชุดคันทอร์จะไม่ถือว่า "ไม่ต่อเนื่อง"
สะสม

หลังจากตรวจสอบen.wikipedia.org/wiki/Countable_setฉันยินดีที่จะยอมรับว่านี่เป็นคำตอบ ตัวอย่างการแจกแจงทางเรขาคณิตนั้นชัดเจนและดูเหมือนว่าจะเป็นตัวแทนของฉันทามติของการตอบสนองที่มีส่วนร่วม
James

5

ฉันกำลังเขียนคำตอบด้วยมุมมองที่ฉันมีเพียงความเข้าใจที่ไร้เดียงสามากเกี่ยวกับความน่าจะเป็นในการวัดตามทฤษฎี (ดังนั้นผู้เชี่ยวชาญโปรดแก้ไขฉันด้วย!)

ตัวแปรสุ่ม (มูลค่าจริง) เป็นฟังก์ชันโดยที่Sคือพื้นที่ตัวอย่างX:SRS

จะไม่ต่อเนื่องหาก X ( S )ซึ่งเป็นภาพของ S ที่เกิดจาก Xนั้นนับได้ Xอย่างต่อเนื่องถ้า XมีCDF อย่างต่อเนื่องแน่นอน (ฉันไม่รู้มากเกี่ยวกับฟังก์ชั่นต่อเนื่องดังนั้นฉันจึงไม่สามารถอธิบายรายละเอียดได้ในจุดนี้)XX(S)SXXX

อย่างไรก็ตามตัวแปรสุ่มทั้งหมดไม่ได้เป็นแบบแยกหรือแบบต่อเนื่อง มีตัวแปรสุ่ม "ผสม" ที่มี CDF ซึ่งเป็นผลรวมของฟังก์ชันขั้นตอนและฟังก์ชันต่อเนื่องพร้อมตัวบ่งชี้X(s)

นอกจากนี้คุณยังสามารถมีตัวแปรสุ่มที่มีค่าต่อเนื่องมิได้อย่างต่อเนื่องเช่นการกระจายต้นเสียง


1
คุณรู้ค่อนข้างมากเกี่ยวกับการแจกแจงแบบต่อเนื่องอย่างแน่นอนเพราะ (เกือบตามคำจำกัดความ) การกระจายตัวแบบต่อเนื่องเป็นสิ่งที่มีความหนาแน่น มีการกระจายอย่างต่อเนื่องที่ไม่ได้มีความหนาแน่นคือตัวอย่างเทพคือการกระจายเหนี่ยวนำโดยฟังก์ชั่นต้นเสียง
whuber

หากภาพที่นับได้มีจุดสะสมเราจะยังคงพูดต่อเนื่องกันหรือไม่?
แมทธิวดรูรี่

1
@ Matewew ใช่ ตัวอย่างที่ฉันพูดถึงในความคิดเห็นอื่น ( stats.stackexchange.com/a/104018/919 ) ซึ่งเห็นได้ชัดว่าไม่ต่อเนื่อง (ทุกค่าที่นับได้มีความน่าจะเป็นที่ไม่ใช่ศูนย์ดังนั้นฟังก์ชันการแจกแจงจึงไม่มีอะไรเลยยกเว้นการกระโดด) ช่วงเวลาทั้งหมดสำหรับชุดของคะแนนสะสม [0,1]
whuber

3

หากต้องการอ้างอิงหน้าวิกิพีเดียเกี่ยวกับตัวแปรแบบต่อเนื่องและแบบแยก :

ถ้ามัน [ตัวแปร] สามารถรับค่าจริงสองค่าเช่นนั้นก็สามารถรับค่าจริงทั้งหมดระหว่างพวกเขา (แม้ค่าที่อยู่ใกล้กันโดยพลการ) ค่าตัวแปรนั้นจะต่อเนื่องในช่วงเวลานั้น

ดังนั้นตัวแปรสุ่มไม่ต่อเนื่องจึงไม่จำเป็นต้องมี 'ตัวเลือกจำนวน จำกัด ' แต่จำเป็นต้องมีช่องว่างแบบไม่ จำกัด ระหว่างค่าที่เป็นไปได้ นี่เป็นกรณีที่มีการแจกแจงของจำนวนเต็มตั้งแต่ 'ระยะทาง' ระหว่างจำนวนเต็มสองตัวที่อยู่ใกล้เคียงคือ 1 และต้องไม่น้อยกว่านี้ ดังนั้นตัวแปรจึงไม่ต่อเนื่องเนื่องจากไม่ได้ 'ดำเนินการต่อ' ภายในช่องว่างเหล่านี้

แก้ไข: ฉันรู้ว่าอาจมีวิธีที่ดีกว่าและ / หรือแม่นยำกว่าในการตอบคำถามนี้ แต่นี่คือสิ่งที่ช่วยให้ฉันเข้าใจความแตกต่างเป็นการส่วนตัว


4
01

1
ผู้เขียนบางคนบอกว่าค่านิยมที่ได้รับอย่างใกล้ชิดโดยพลการนั้นไม่ได้แยกจากกัน แต่ฉันต้องยอมรับว่าฉันคิดว่ามันแปลก ๆ ตัวอย่างคือการแจกแจงความแตกต่างของสแควร์รูทของตัวแปรแบบปัวซงสองตัว (w.real แอปพลิเคชัน: บางครั้งผู้คนใช้สแควร์รูทพร้อมตัวแปรที่คิดว่าเป็นปัวซองเพื่อรักษาเสถียรภาพของความแปรปรวนและอาจสนใจว่า ศูนย์). ค่าอาจถูกปิดโดยพลการพร้อมกับความแปรปรวน แต่มักจะแตกต่างกัน (คุณสามารถแจกแจงแต่ละรายการ), ... ctd
Glen_b

Y=1/XXε>0XY

2
AA

1
ฉันคิดว่านั่นเป็นส่วนผสมที่ฉันมีในหัวของฉัน ฉันเป็นนักทอพอโลยีที่ผ่านการฝึกอบรมดังนั้นไม่ต่อเนื่องดังขึ้นในบริบททอพอโลยีเมื่อฉันได้ยินมัน ขอบคุณสำหรับการชี้แจง @whuber
แมทธิวดรูรี่
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.