การกระจายอย่างเป็นหมวดหมู่หมายถึงอะไร


12

นี่คือการกระจายประเภทที่แยกต่างหาก (เช่น: ทวินาม, เบอร์นูลลี, Multinomial) หรือการกระจายใด ๆ สามารถแสดงด้วยวิธีนี้ ใครบางคนสามารถอธิบายรายละเอียดด้วยตัวอย่างง่ายๆ

คำตอบ:


12

การจัดหมวดหมู่การกระจายเป็นลักษณะทั่วไปของการแจกแจงเบอร์นูลลีไปยังหมายเลขคงที่ 2k ของผลลัพธ์

มันเป็นกรณีพิเศษของการแจกแจงพหุนามที่มีจำนวนของ "ตัวเลือก" n ได้รับการแก้ไขที่หนึ่ง

ดังนั้นมันจึงมี pdf:

i=1kpixi(where 0pi and ipi=1)
มากกว่าการสนับสนุน
xi{0,1}
ที่ไหน
ni=1kxi=1.

ในการสรุป Bernoulli มี , ทวินามมี , พหุนามมีk \ ge2, n \ GE1และเด็ดขาดมีk \ ge2 n = 1k=2,n=1k=2,n1k2,n1k2,n=1


เป็นสิ่งที่จำเป็น xi = 0,1 ไม่สามารถทำได้มากกว่านั้น
subha

@subha: ความเข้าใจของฉันเกี่ยวกับการกระจายอย่างเป็นทางการนั้นเป็นแบบนั้น สำหรับพหุนามและทวินามแน่นอนว่ามันสามารถ
Neil G

5

ตัวแปรตามหมวดหมู่มีชุดของค่าที่ไม่ต่อเนื่อง ตัวอย่างเช่นเพศ (ชาย / หญิง), ประเทศ, ดาวเคราะห์ ฯลฯ เปรียบเทียบกับตัวแปรต่อเนื่องซึ่งสามารถใช้ค่าที่แตกต่างกันจำนวนนับไม่ถ้วน ตัวอย่างเช่นน้ำหนักลองจิจูดระยะทาง ฯลฯ

โปรดทราบว่าบางครั้งข้อมูลที่คล้ายกันสามารถแสดงในรูปแบบที่เป็นหมวดหมู่และต่อเนื่อง เช่นอาจจะแสดงเป็นplanet = earth distance to sun = 1 astronomical unit ≈ 150 million kilometersอย่างไรก็ตามไม่มีวิธีใดที่จะแสดงดาวเคราะห์จากดวงอาทิตย์ได้ 200 ล้านกิโลเมตรในแง่ของดาวเคราะห์เพราะไม่มีดาวเคราะห์อยู่ที่นั่น (ดาวอังคารอยู่ห่างจากดวงอาทิตย์ 228 ล้านกิโลเมตร) เดียวกัน 201 ล้านกิโลเมตร, 202 ฯลฯ ทั้งหมดที่คุณสามารถพูดเกี่ยวกับระยะทางเหล่านี้ในแง่ของดาวเคราะห์คือplanet = none; คุณไม่สามารถพูดplanet = 4/3×earthหรือ.88×Marsเพราะไม่มีวิธีที่มีความหมายในการคูณดาวเคราะห์หรือตัวแปรเด็ดขาดอื่น ๆ ในแง่ของดาวเคราะห์ระยะทางเหล่านี้จะแยกไม่ออก แต่แน่นอนว่าพวกมันมีระยะทางที่แตกต่างจากดวงอาทิตย์เมื่อแสดงเช่น - เป็นตัวแปรต่อเนื่อง

เราสามารถแสดงตัวแปรต่อเนื่องด้วยความแม่นยำตามอำเภอใจ (เช่นหน่วยดาราศาสตร์หนึ่งหน่วยคือ 149,597,871 กม. ไม่ตรงกับ 150 ล้านกม.) ในทางกลับกันไม่มีทางที่จะแสดงplanet = earthได้อย่างแม่นยำมากขึ้น โลกเป็นดินตรงไม่มากหรือน้อย ยิ่งไปกว่านั้นมันไม่สมเหตุสมผลเลยที่จะบอกว่าดาวเคราะห์ดวงอื่น ๆ นั้นมี "มากกว่า" หรือ "น้อย" กว่าโลกถ้าplanetเป็นตัวแปรที่ระบุ มันสามารถเขียนเป็นตัวแปรสั่ง (ลำดับ) แม้ว่า - ดาวเคราะห์ได้รับคำสั่งในแง่ของระยะทางไปยังดวงอาทิตย์ปริมาณจำนวนดวงจันทร์ ฯลฯ ตัวเลขเหล่านี้ล้วนมีความต่อเนื่องในเงื่อนไขของตนเอง (หรืออย่างน้อยนับซึ่งไม่ต่อเนื่อง แต่ไม่ใช่หมวดหมู่) แต่ไม่ใช่ในแง่ของดาวเคราะห์ mars > earth > venusเช่นถ้าดาวเคราะห์มีการสั่งซื้อโดยระยะทางจากดวงอาทิตย์หรือตามจำนวนของดวงจันทร์ ถ้าดาวเคราะห์ถูกเรียงตามปริมาตรearth > venus > mars. ไม่จำเป็นต้องเรียงลำดับตัวแปรและอาจมีบางคำสั่งไม่ได้ แต่การเพิ่มคำสั่งไม่ทำให้มีการจัดหมวดหมู่น้อยลง

ดังที่วิกิพีเดียกล่าวไว้ว่าการแจกแจงแบบแบ่งหมวดหมู่เป็นการวางนัยทั่วไปของการแจกแจงเบอร์นูลลี่มากกว่าสองค่าที่เป็นไปได้ การแจกแจงเบอร์นูลลีเป็นกรณีพิเศษของการแจกแจงทวินาม แต่ฉันจะไม่เรียกหมวดหมู่การแจกแจงทวินาม (มันไม่ต่อเนื่อง แต่เป็นตัวแปรนับดังนั้นระยะทางระหว่างค่าจะถูกกำหนด) แจกแจงพหุอาจจะแฟทต์กับการกระจายเด็ดขาด แต่วิกิพีเดียนี้ข้อควรระวังกับ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.