การแจกแจงนั้นเป็นเรื่องปกติ แต่ก็ถือว่าเบียนเสียนอย่างมากหรือเปล่า?


12

ฉันมีคำถามนี้คุณคิดว่าการกระจายเวลาที่ใช้ไปกับ YouTube ในแต่ละวันเป็นอย่างไร

คำตอบของฉันคือมันอาจกระจายตามปกติและเอียงไปทางซ้ายสูง ฉันคาดหวังว่าจะมีโหมดเดียวที่ผู้ใช้ส่วนใหญ่ใช้เวลาเฉลี่ยและจากนั้นก็ใช้เวลานานพอสมควรเนื่องจากผู้ใช้บางคนมีพลังที่ครอบงำ

นั่นเป็นคำตอบที่ยุติธรรมหรือไม่? มีคำพูดที่ดีกว่าสำหรับการแจกแจงแบบนั้นหรือไม่?


4
ในขณะที่คำตอบบางคำพูดถึง แต่ไม่เน้นย้ำความเบ้นั้นถูกตั้งชื่ออย่างไม่เป็นทางการสำหรับหางที่ยาวกว่าหากมีหนึ่งดังนั้นจึงเอียงขวาถ้าหางขวายาวขึ้น ซ้ายและขวาตามที่ใช้ในบริบทนี้ทั้งแสดงหน้าจอตามแบบแผนที่แสดงขนาดบนแกน hoirizontal หากเสียงนั้นชัดเจนเกินไปให้ลองพิจารณาการแสดงผลในโลกและวิทยาศาสตร์สิ่งแวดล้อมที่ขนาดนั้นสูงหรือลึกและแสดงในแนวตั้ง พิมพ์ขนาดเล็ก: การวัดความเบ้บางอย่างอาจเป็นศูนย์แม้ว่าการแจกแจงเบ้แบบเรขาคณิต
Nick Cox

1
รวมเวลาต่อวันสำหรับผู้ใช้ทั้งหมดหรือไม่ หรือเวลาต่อวันต่อคน? ถ้าอย่างหลังแน่นอนว่ามี spike ขนาดใหญ่พอสมควรที่ 0 ซึ่งในกรณีนี้คุณอาจต้องการการกระจายสไตล์ 'spike and slab' ที่มี Dirac delta ที่ 0
innisfree

6
"ปกติ" มีความหมายเหมือนกันกับ "เกาส์เซียน" และการแจกแจงแบบเกาส์เซียนหรือที่เรียกว่าการแจกแจงแบบปกติจะไม่เบ้
Michael Hardy

ฉันพบคำถามในชื่อต่างจากคำถามในเนื้อความ หรืออย่างน้อยชื่อก็สับสนมาก ไม่มีการแจกแจงแบบ 'ปกติ แต่เบ้สูง' ซึ่งขัดแย้งกัน ยิ่งไปกว่านั้นการแจกแจงแบบเกาส์เป็นอย่างดีและไม่เหมือนการกระจายเวลาที่ใช้ต่อวันบน YouTube ดังนั้นคำตอบของคำถามในหัวข้อจึงไม่ใช่เรื่องใหญ่ f(x)=12πσ2exp((xμ)22σ2)
Sextus Empiricus

2
ท้ายที่สุดคำถามคือ 'มีคำพูดที่ดีกว่าสำหรับการแจกแจงแบบนั้นหรือไม่?' คลุมเครือหรือกว้างมาก ข้อมูลดูเหมือนจะเป็นเพียง 'หนึ่งโหมด' และ 'หางยาวขวา' (ส่วนหนึ่งอาจกระจายตามปกติอาจไม่มีเหตุผล) อาจมีการแจกแจงจำนวนมากที่ตรงตามเงื่อนไขเหล่านี้ เป็นเรื่องที่น่าอัศจรรย์ใจที่คำถามนี้ดึงดูดคำตอบมากกว่าสิบคำตอบและอย่างน้อยก็มีข้อเสนอมากมายสำหรับการกระจายทางเลือกก่อนที่เราจะพยายามชี้แจงให้ชัดเจน (ไม่มีแม้แต่ข้อมูล)
Sextus Empiricus

คำตอบ:


14

เศษส่วนต่อวันย่อมไม่เป็นลบ กฎนี้แจกแจงการแจกแจงแบบปกติซึ่งมีความน่าจะเป็นเป็นจำนวนมากในแกนที่แท้จริงทั้งหมด - โดยเฉพาะอย่างยิ่งในครึ่งลบ

การแจกแจงกฎหมายพลังงานมักใช้เพื่อจำลองสิ่งต่าง ๆ เช่นการกระจายรายได้ขนาดของเมืองเป็นต้นพวกมันไม่เชิงลบและมักจะเบ้สูง นี่เป็นครั้งแรกที่ฉันจะลองทำแบบจำลองเวลาที่ใช้ดู YouTube (หรือตรวจสอบคำถามที่ข้ามการตรวจสอบแล้ว)

ข้อมูลเพิ่มเติมเกี่ยวกับกฎหมายพลังงานสามารถดูได้ที่นี่หรือที่นี่หรือในแท็กของเรา


16
คุณถูกต้องครบถ้วนว่าการแจกแจงปกติมีการสนับสนุนในสายจริง และยัง ... พวกเขาไม่ได้เป็นนางแบบที่น่ากลัวสำหรับคุณสมบัติเชิงบวกบางอย่างเช่นความสูงหรือน้ำหนักของผู้ใหญ่ซึ่งค่าเฉลี่ยและความแปรปรวนเป็นเช่นนั้นค่าเชิงลบนั้นไม่น่าเป็นไปได้มากนักภายใต้แบบจำลอง
Matt Krause

2
@MattKrause นั่นเป็นคำถามที่ดีจริง ๆ - มีความเป็นไปได้ไหมที่ฉันจะสูงหรือต่ำกว่าค่าเฉลี่ยของความสูงประมาณ 10 ซม. หรือ '10 สูงกว่าหรือต่ำกว่าความสูงเฉลี่ย '? เฉพาะกรณีแรกเท่านั้นที่สามารถรับประกันการกระจายปกติ
Tomáš Kafka

1
@ MattKrause: ฉันเห็นด้วยอย่างสิ้นเชิงในแง่ทั่วไป แต่คำถามปัจจุบันเกี่ยวกับสัดส่วนของเวลาในการดู YouTube ในแต่ละวัน เราไม่มีข้อมูลใด ๆ แต่ฉันจะประหลาดใจอย่างยิ่งถ้าการกระจายนั้นสมมาตรจากระยะไกล
เตฟาน Kolassa

43

การแจกแจงที่เป็นเรื่องปกติไม่เบ้อย่างมาก นั่นคือความขัดแย้ง ตัวแปรที่แจกแจงตามปกติมีความเบ้ = 0


1
เป็นวิธีที่ดีกว่าในการอธิบายการกระจายตัวคืออะไร? มีคำสำหรับการแจกแจงแบบนั้นที่มีศูนย์กลางอยู่ที่โหมดแล้วมีหางยาวหรือไม่?
Cauder

13
unimodal และเอียงอยู่ใกล้ที่สุดเท่าที่ฉันสามารถมาได้ ...
38917

9
เป็นเรื่องที่น่าเหลือเชื่อจริงๆที่คนให้เวลาเพื่อช่วยคนอื่นให้ดีขึ้นในสิ่งนี้ ฉันรู้ว่ามันผ่านไปโดยไม่บอกอะไร แต่มันยอดเยี่ยมมากในสิ่งที่คุณทั้งคู่ทำ!
Cauder

6
ใช่ แต่มันก็คุ้มค่าที่จะชี้แจงว่าข้อความนั้นเกี่ยวข้องกับประชากรที่กระจายตัวตามปกติ ตัวอย่างที่ดึงมาจากประชากรนั้นอาจจะเบ้มาก
gung - Reinstate Monica

เมื่อค่าความเบ้น้อย ("เล็ก" ถูกตัดสินโดยคนที่จัดการกับสถิติที่เป็นปัญหา) คุณยังคงสามารถรักษาประชากรได้ตามปกติแม้ว่าจะมีข้อผิดพลาดเล็กน้อยก็ตาม
Carl Witthoft


13

มันอาจเป็นการกระจายล็อกปกติ ในฐานะที่เป็นที่กล่าวถึงนี่ :

เวลาพักอาศัยของผู้ใช้ในบทความออนไลน์ (เรื่องตลกข่าว ฯลฯ ) ติดตามการแจกแจงแบบล็อกปกติ

การอ้างอิงที่ได้รับคือ Yin, Peifeng; Luo, Ping; ลี, วัง - เชียน; Wang, Min (2013) ความเงียบยังเป็นหลักฐาน: ตีความเวลาพักอาศัยเพื่อขอคำแนะนำจากมุมมองทางจิตวิทยา การประชุมนานาชาติ ACM สำหรับ KDD


7

"มีคำพูดที่ดีกว่าสำหรับการแจกจ่ายนั้นหรือไม่?

มีความแตกต่างที่คุ้มค่าที่นี่ระหว่างการใช้คำเพื่ออธิบายคุณสมบัติของการแจกแจงแทนที่จะพยายามหา "ชื่อ" สำหรับการแจกจ่ายเพื่อให้คุณสามารถระบุว่าเป็น (โดยประมาณ) ตัวอย่างของการแจกแจงมาตรฐานที่เฉพาะเจาะจง: หนึ่งสูตร หรือตารางสถิติอาจมีอยู่สำหรับฟังก์ชันการแจกแจงและคุณสามารถประมาณค่าพารามิเตอร์ได้ ในกรณีหลังนี้คุณมีแนวโน้มที่จะใช้การแจกแจงแบบระบุชื่อเช่น "ปกติ / เกาส์เซียน" (โดยทั่วไปคือคำสองคำที่มีความหมายเหมือนกัน) เป็นแบบจำลองที่รวบรวมคุณลักษณะที่สำคัญบางอย่างของข้อมูลของคุณแทนที่จะอ้างสิทธิ์ประชากร ดึงออกมาจากตรงตามที่กระจายทฤษฎี หากต้องการหลอกลวง George Box เล็กน้อยทุกรุ่นเป็น "ผิด" แต่บางรุ่นก็มีประโยชน์ หากคุณกำลังคิดเกี่ยวกับวิธีการสร้างแบบจำลองมันมีความคุ้มค่าที่จะพิจารณาว่าคุณลักษณะใดที่คุณต้องการรวมเข้าด้วยกัน

เป็นเบ้บวกเป็นตัวอย่างของการอธิบายทรัพย์สินที่จัดจำหน่ายมี แต่ไม่ได้มาใกล้กับที่ระบุซึ่งปิด -the-shelf กระจายคือ "" รูปแบบที่เหมาะสม มันจะแยกผู้สมัครบางคนออกตัวอย่างเช่นการแจกแจงแบบเกาส์ (เช่นปกติ) มีศูนย์เอียงดังนั้นจะไม่เหมาะสมที่จะสร้างแบบจำลองข้อมูลของคุณหากการเอียงเป็นคุณลักษณะที่สำคัญ อาจมีคุณสมบัติอื่น ๆ ของข้อมูลที่มีความสำคัญต่อคุณเช่นกันว่าunimodal (มีเพียงจุดสูงสุดเดียว) หรือว่ามีขอบเขตระหว่าง 0 ถึง 24 ชั่วโมง (หรือระหว่าง 0 และ 1 หากคุณเขียนเป็นเศษส่วน ของวัน) หรือว่ามีความน่าจะเป็นไปได้ที่จะมีสมาธิอยู่ที่ศูนย์ (เนื่องจากมีคนที่ไม่ได้ดู YouTube เลยในวันที่กำหนด)โด่ง และควรจำไว้ว่าแม้ว่าการกระจายของคุณจะมีรูปร่าง "โคก" หรือ "เส้นโค้งเบลล์" และมีความลาดเอียงเป็นศูนย์หรือใกล้เคียงศูนย์ แต่ก็ไม่ได้ปฏิบัติตามโดยอัตโนมัติว่าการกระจายปกตินั้น "ถูกต้อง" สำหรับมัน! ในทางกลับกันแม้ว่าจำนวนประชากรที่ข้อมูลของคุณถูกดึงมาจากการใช้งานจริงจะมีการกระจายที่แม่นยำเนื่องจากข้อผิดพลาดในการสุ่มตัวอย่างชุดข้อมูลของคุณอาจไม่คล้ายกับมันมากนัก ชุดข้อมูลขนาดเล็กมีแนวโน้มที่จะ "รบกวน" และอาจไม่ชัดเจนว่าคุณลักษณะบางอย่างที่คุณสามารถดูได้เช่นฮัมตัวเล็ก ๆ เพิ่มเติมหรือหางอสมมาตรเป็นคุณสมบัติของประชากรพื้นฐานที่ข้อมูลถูกดึงมาจาก (และอาจจะรวมอยู่ด้วย ในแบบจำลองของคุณ) หรือไม่ว่าสิ่งเหล่านั้นเป็นเพียงสิ่งประดิษฐ์จากตัวอย่างเฉพาะของคุณ (และเพื่อจุดประสงค์ในการสร้างแบบจำลองควรถูกละเว้น) หากคุณมีชุดข้อมูลขนาดเล็กและความลาดเอียงอยู่ใกล้กับศูนย์แสดงว่าการแจกแจงต้นแบบนั้นมีความสมมาตร ยิ่งชุดข้อมูลของคุณมีขนาดใหญ่ขึ้นและมีความเบ้มากเท่าไหร่ก็ยิ่งมีความน่าเชื่อถือน้อยลงเท่านั้น แต่ในขณะที่คุณสามารถทำการทดสอบที่สำคัญเพื่อดูว่าหลักฐานที่คุณเชื่อถือนั้นเป็นข้อมูลที่คุณได้รับจากความเบ้สิ่งนี้อาจหายไปจากจุดที่ว่าการแจกแจงแบบปกติ (หรือศูนย์เอียงอื่น ๆ ) มีความเหมาะสมเป็นแบบจำลอง ...

คุณสมบัติของข้อมูลใดมีความสำคัญต่อวัตถุประสงค์ที่คุณตั้งใจจะทำโมเดลจริงหรือไม่ โปรดทราบว่าหากความเบ้มีขนาดเล็กพอสมควรและคุณไม่สนใจมันมากนักแม้ว่าประชากรที่อยู่เบื้องล่างจะเบ้อย่างแท้จริงคุณก็อาจพบว่าการกระจายแบบปกติเป็นแบบจำลองที่มีประโยชน์เพื่อประมาณเวลาการกระจายที่แท้จริงของการรับชม แต่คุณควรตรวจสอบว่าสิ่งนี้ไม่ได้จบลงด้วยการทำนายโง่ ๆ เนื่องจากการแจกแจงแบบปกติไม่มีค่าสูงสุดหรือต่ำสุดที่เป็นไปได้ถึงแม้ว่าค่าสูงหรือต่ำสุดจะไม่น่าเป็นไปได้มากขึ้นคุณจะพบว่าแบบจำลองของคุณทำนายว่ามีบางอย่างความน่าจะเป็นที่จะรับชมเป็นจำนวนชั่วโมงติดลบต่อวันหรือมากกว่า 24 ชั่วโมง สิ่งนี้จะเป็นปัญหามากขึ้นสำหรับคุณถ้าความน่าจะเป็นที่คาดการณ์ของเหตุการณ์ที่เป็นไปไม่ได้นั้นสูง การกระจายแบบสมมาตรเช่นปกติจะทำนายได้ว่าผู้คนจำนวนมากจะมองดูเป็นระยะเวลานานกว่าเช่นค่าเฉลี่ยสูงกว่าค่าเฉลี่ย 50% และดูต่ำกว่าค่าเฉลี่ยน้อยกว่า 50% หากเวลาในการดูนั้นเบ้อย่างมากการคาดคะเนแบบนี้อาจเป็นไปไม่ได้ที่จะโง่และให้ผลลัพธ์ที่ทำให้เข้าใจผิดหากคุณใช้ผลลัพธ์ของแบบจำลองของคุณและใช้เป็นข้อมูลเพื่อวัตถุประสงค์อื่น (เช่นคุณ ใช้การจำลองเวลาดูเพื่อคำนวณการตั้งเวลาโฆษณาที่ดีที่สุด) หากความเบ้นั้นเป็นสิ่งที่น่าสังเกตมากคุณต้องการที่จะเก็บมันไว้เป็นส่วนหนึ่งของแบบจำลองของคุณการแจกแจงแบบเบ้ปกติอาจเหมาะสมกว่า หากคุณต้องการที่จะจับภาพทั้งเบ้และความโด่งแล้วพิจารณาเบ้เสื้อ หากคุณต้องการรวมขอบเขตบนและล่างที่เป็นไปได้ทางร่างกายไว้ให้พิจารณาใช้การแจกแจงแบบตัดทอนของรุ่นเหล่านี้ มีการแจกแจงความน่าจะเป็นอื่น ๆ อีกมากมายที่สามารถบิดเบือนและ unimodal (สำหรับตัวเลือกพารามิเตอร์ที่เหมาะสม) เช่นการแจกแจงแบบFหรือแกมม่าและคุณสามารถตัดส่วนเหล่านี้อีกครั้งเพื่อให้พวกเขาไม่คาดการณ์เวลาในการรับชมสูง การแจกแจงแบบเบต้าอาจเป็นทางเลือกที่ดีถ้าคุณกำลังสร้างโมเดลส่วนของวันที่ดูอยู่เนื่องจากจะมีขอบเขตระหว่าง 0 ถึง 1 เสมอโดยไม่จำเป็นต้องตัดทอนอีก หากคุณต้องการที่จะรวมความเข้มข้นของความน่าจะเป็นที่ตรงศูนย์เนื่องจากไม่ใช่นักดู-แล้วพิจารณาสร้างในรูปแบบกีดขวาง

แต่ ณ จุดที่คุณพยายามจะโยนในทุกคุณสมบัติที่คุณสามารถระบุจากข้อมูลของคุณและสร้างแบบจำลองที่ซับซ้อนมากขึ้นบางทีคุณควรถามตัวเองว่าทำไมคุณถึงทำเช่นนี้? จะมีข้อได้เปรียบสำหรับแบบจำลองที่ง่ายกว่าหรือไม่ตัวอย่างเช่นการทำงานกับคณิตศาสตร์ง่ายกว่าหรือมีพารามิเตอร์น้อยลงในการประมาณค่าหรือไม่ หากคุณกังวลว่าการทำให้เข้าใจง่ายเช่นนี้จะทำให้คุณไม่สามารถรวบรวมคุณสมบัติทั้งหมดที่คุณสนใจได้อาจเป็นไปได้ว่าการแจกจ่ายแบบ "ไม่อยู่ในชั้นวางสินค้า" นั้นเป็นสิ่งที่คุณต้องการ อย่างไรก็ตามเราไม่ได้ จำกัด การทำงานกับการแจกแจงที่มีชื่อซึ่งคุณสมบัติทางคณิตศาสตร์ได้รับการอธิบายก่อนหน้านี้ ให้พิจารณาใช้ข้อมูลของคุณเพื่อสร้างฟังก์ชันการกระจายเชิงประจักษ์. สิ่งนี้จะดักจับพฤติกรรมทั้งหมดที่มีอยู่ในข้อมูลของคุณ แต่คุณไม่สามารถตั้งชื่อเช่น "ปกติ" หรือ "แกมม่า" ได้อีกต่อไปและคุณไม่สามารถใช้คุณสมบัติทางคณิตศาสตร์ที่เกี่ยวข้องกับการแจกจ่ายเฉพาะ ตัวอย่างเช่นกฎ "95% ของข้อมูลอยู่ภายใน 1.96 ส่วนเบี่ยงเบนมาตรฐานของค่าเฉลี่ย" สำหรับการกระจายข้อมูลตามปกติและอาจไม่ใช้กับการแจกจ่ายของคุณ แม้ว่าโปรดทราบว่ากฎบางข้อบังคับใช้กับการแจกแจงทั้งหมดเช่นความไม่เท่าเทียมของ Chebyshevรับประกันอย่างน้อย75% ของข้อมูลของคุณต้องอยู่ภายในค่าเบี่ยงเบนมาตรฐานสองค่าโดยไม่คำนึงถึงความเบ้ น่าเสียดายที่การกระจายเชิงประจักษ์จะสืบทอดคุณสมบัติเหล่านั้นทั้งหมดของชุดข้อมูลของคุณที่เกิดขึ้นอย่างหมดจดโดยการสุ่มตัวอย่างข้อผิดพลาดไม่ใช่แค่การครอบครองโดยประชากรพื้นฐานดังนั้นคุณอาจพบฮิสโตแกรมของการกระจายเชิงประจักษ์ของคุณมี humps และ dips . คุณอาจต้องการตรวจสอบฟังก์ชันการกระจายเชิงประจักษ์ที่ราบรื่นขึ้นหรือดีขึ้นเพื่อเพิ่มขนาดตัวอย่างของคุณ

กล่าวโดยสรุป: แม้ว่าการแจกแจงแบบปกติจะมีศูนย์เบ้ แต่ความจริงแล้วข้อมูลของคุณเบ้ไม่ได้ตัดการแจกแจงแบบปกติเป็นแบบจำลองที่มีประโยชน์แม้ว่ามันจะแนะนำการกระจายแบบอื่น ๆ ที่เหมาะสมกว่าก็ตาม คุณควรพิจารณาคุณสมบัติอื่น ๆ ของข้อมูลเมื่อเลือกแบบจำลองของคุณนอกเหนือจากความเบ้และพิจารณาวัตถุประสงค์ที่คุณจะใช้แบบจำลองด้วยเช่นกัน มันปลอดภัยที่จะบอกว่าประชากรที่แท้จริงของคุณในการดูเวลาไม่ได้ปฏิบัติตามการกระจายชื่อที่มีชื่อเสียงบางชื่อ แต่นี่ไม่ได้หมายความว่าการเผยแพร่ดังกล่าวจะต้องไร้ประโยชน์เป็นแบบอย่าง อย่างไรก็ตามสำหรับวัตถุประสงค์บางอย่างคุณอาจต้องการใช้การกระจายเชิงประจักษ์เองแทนที่จะลองใช้การกระจายแบบมาตรฐาน



4

"ปกติ" และ "เสียน" หมายถึงสิ่งเดียวกัน ในฐานะที่เป็นคำตอบอื่น ๆ อธิบายการกระจายที่คุณกำลังพูดถึงไม่ปกติ / เสียนเพราะเห็นว่าน่าจะเป็นผู้รับมอบหมายกระจายไปยังคุ้มค่าในบรรทัดจริงทุกขณะที่การกระจายของคุณเท่านั้นที่อยู่ระหว่างและ  24024


3

ในกรณีที่อยู่ในมือเนื่องจากเวลาที่ใช้ต่อวันถูกผูกไว้จากถึง (ถ้านับเป็นเศษส่วนของวัน) การแจกแจงที่ไม่ได้ จำกัด ไว้ด้านบน (เช่น Pareto, เอียงปกติ, แกมม่า, บันทึกปกติ) ชนะ ' ไม่ทำงาน แต่จะเบต้า01


2

รุ่นอุปสรรค์ล่ะ?

แบบจำลองอุปสรรค์มีสองส่วน อย่างแรกคือการทดลองของ Bernoulli ที่กำหนดว่าคุณใช้ YouTube หรือไม่ หากคุณไม่ทำเช่นนั้นเวลาการใช้งานของคุณจะเป็นศูนย์อย่างชัดเจนและเสร็จสิ้นแล้ว หากคุณทำเช่นนั้นคุณจะ "ผ่านอุปสรรค์นั้น" จากนั้นเวลาการใช้งานจะมาจากการแจกแจงที่เป็นบวกอย่างอื่น

แนวคิดที่เกี่ยวข้องอย่างใกล้ชิดเป็นรูปแบบที่ไม่พองศูนย์ สิ่งเหล่านี้มีจุดประสงค์เพื่อจัดการกับสถานการณ์ที่เราสังเกตเห็นศูนย์จำนวนหนึ่ง แต่ไม่สามารถแยกความแตกต่างระหว่างศูนย์ที่เป็นศูนย์และบางครั้งก็ได้ ตัวอย่างเช่นพิจารณาจำนวนบุหรี่ที่คนสูบบุหรี่ในแต่ละวัน สำหรับผู้ที่ไม่สูบบุหรี่จำนวนนั้นเป็นศูนย์เสมอ แต่ผู้สูบบุหรี่บางคนอาจไม่สูบบุหรี่ในวันที่กำหนด (จากการสูบบุหรี่นอกเที่ยวบินที่ยาวนาน?) ซึ่งแตกต่างจากรุ่นอุปสรรค์การกระจาย "ผู้สูบบุหรี่" ที่นี่ควรมีศูนย์ แต่จำนวนเหล่านี้เป็น 'พอง' โดยมีส่วนร่วมที่ไม่สูบบุหรี่ 'เกินไป


0

หากการแจกจ่ายนั้นเป็น'ส่วนย่อย'ของการแจกแจงแบบปกติคุณควรพิจารณารูปแบบที่ถูกตัดทอน ใช้กันอย่างแพร่หลายในบริบทนี้เป็นตระกูลของโมเดลของ TOBIT
พวกเขาจำเป็นต้องแนะนำไฟล์ PDF ที่มีมวลความน่าจะเป็น (บวก) ที่ 0 แล้ว'ตัดส่วนหนึ่งของการแจกแจงปกติ'สำหรับค่าบวก
ฉันจะละเว้นจากการพิมพ์สูตรที่นี่และค่อนข้างจะแนะนำให้คุณบทความ Wikipedia: https://en.wikipedia.org/wiki/Tobit_model


-4

การแจกแจงแบบปกติเป็นการ จำกัด แบบไม่เบ้ดังนั้นคุณจึงไม่มีทั้งสองอย่าง หากการแจกแจงเบ้เหลือจะไม่สามารถเป็นเกาส์เซียนได้ คุณจะต้องเลือกใหม่! สิ่งที่ใกล้เคียงกับคำขอของคุณมากที่สุดที่ฉันนึกได้คือ:

https://en.wikipedia.org/wiki/Skew_normal_distribution


5
ฉันเห็นด้วยยกเว้นว่า OP กำลังสับสนด้านซ้ายและขวาเบ้อย่างที่ชี้ไปแล้ว และ @behold ได้เสนอคำตอบที่เอียงแล้วในคำตอบ ดังนั้นฉันไม่เห็นว่าสิ่งนี้จะเพิ่มคำตอบที่มีอยู่
Nick Cox

มันสรุปจำนวนมากของพวกเขาในการตอบสนองสามบรรทัดตรงไปข้างหน้า
เดวิด

4
ขออภัยที่ยังคงซ้ำซ้อน
Nick Cox

ตกลง ... ใครสนใจล่ะ
David

4
ฉันทำ และใครก็ตามที่เพิ่ม +1 ในความคิดเห็นของฉัน (ไม่ใช่ฉันอย่างชัดเจน) และใครก็ตามที่ปฏิเสธคำตอบของคุณ (ไม่ใช่ฉันตามที่เกิดขึ้น) กระทู้นี้มีความยาวและซ้ำแล้วซ้ำอีก; แต่ความคิดเห็นที่ซ้ำซ้อนมากขึ้นไม่ได้ปรับปรุงสำหรับผู้อ่านในอนาคต
Nick Cox
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.