ทำไมเวลาการเอาชีวิตรอดจึงมีการกระจายอย่างทวีคูณ


36

ฉันกำลังเรียนรู้การวิเคราะห์ความอยู่รอดจากบทความนี้ใน UCLA IDREและได้ดีดตัวขึ้นที่หัวข้อ 1.2.1 บทช่วยสอนบอกว่า:

... ถ้าเวลารอดชีวิตนั้นมีการแจกแจงแบบเลขชี้กำลังแล้วความน่าจะเป็นในการสังเกตเวลาการอยู่รอด ...

ทำไมเวลาการเอาชีวิตรอดจึงมีการกระจายอย่างทวีคูณ ดูเหมือนว่าฉันผิดธรรมชาติมาก

ทำไมไม่กระจายตามปกติ? สมมติว่าเรากำลังตรวจสอบช่วงชีวิตของสิ่งมีชีวิตบางอย่างภายใต้เงื่อนไขบางประการ (พูดจำนวนวัน) ควรจะอยู่ตรงกลางรอบจำนวนที่มีการเปลี่ยนแปลงบ้างหรือไม่ (พูด 100 วันกับความแปรปรวน 3 วัน)?

หากเราต้องการให้เวลาเป็นบวกอย่างเคร่งครัดทำไมไม่แจกแจงแบบปกติด้วยค่าเฉลี่ยที่สูงขึ้นและความแปรปรวนน้อยมาก (แทบจะไม่มีโอกาสได้จำนวนลบ)


9
Heuristically ฉันไม่สามารถนึกถึงการแจกแจงแบบปกติเป็นวิธีที่ใช้งานง่ายในการจำลองเวลาที่ล้มเหลว มันไม่เคยถูกครอบตัดในงานที่ฉันสมัครเลย พวกมันเอียงไปทางขวาเสมอ ฉันคิดว่าการแจกแจงแบบปกติที่เรียนรู้มาเป็นเรื่องของค่าเฉลี่ยในขณะที่เวลาในการเอาชีวิตรอดนั้นเป็นเรื่องของ extrema เช่นผลกระทบของความเป็นอันตรายคงที่ที่นำมาใช้กับลำดับของส่วนประกอบแบบขนานหรืออนุกรม
AdamO

6
ฉันเห็นด้วยกับ @AdamO เกี่ยวกับการแจกแจงขั้นสุดขีดที่มีอยู่เพื่อความอยู่รอดและเวลาที่ล้มเหลว ตามที่คนอื่น ๆ ได้ตั้งข้อสังเกตการยกกำลังมีข้อได้เปรียบของการเป็นเวไนย ปัญหาที่ใหญ่ที่สุดกับพวกเขาคือข้อสันนิษฐานโดยนัยของอัตราการสลายตัวคงที่ รูปแบบการทำงานอื่น ๆ เป็นไปได้และมาเป็นตัวเลือกมาตรฐานขึ้นอยู่กับซอฟต์แวร์เช่นแกมม่าทั่วไป สามารถใช้ความดีของการทดสอบแบบพอดีเพื่อทดสอบรูปแบบการทำงานและข้อสมมติฐานที่แตกต่างกัน ข้อความที่ดีที่สุดในการสร้างแบบจำลองการอยู่รอดคือการวิเคราะห์การอยู่รอดของ Paul Allison โดยใช้ SAS, 2nd ed ลืม SAS- มันเป็นรีวิวที่ยอดเยี่ยม
Mike Hunter

8
ฉันจะทราบว่าคำแรกในคำพูดของคุณคือ " if "
Fomite

คำตอบ:


40

การแจกแจงแบบเอ็กซ์โพเนนเชียลมักใช้เพื่อจำลองเวลาการเอาชีวิตรอดเนื่องจากเป็นการแจกแจงแบบง่ายที่สุดที่สามารถใช้เพื่อระบุลักษณะข้อมูลการรอดชีวิต / ความน่าเชื่อถือ นี่เป็นเพราะพวกมันไม่มีหน่วยความจำและทำให้ฟังก์ชั่นอันตรายนั้นมีค่าคงที่โดยไม่มีเวลาซึ่งทำให้การวิเคราะห์ง่ายมาก ข้อสันนิษฐานประเภทนี้อาจใช้ได้เช่นชิ้นส่วนอิเล็กทรอนิกส์บางประเภทเช่นวงจรรวมคุณภาพสูง ฉันแน่ใจว่าคุณสามารถนึกถึงตัวอย่างเพิ่มเติมที่ผลกระทบของเวลาต่ออันตรายสามารถสันนิษฐานได้ว่าปลอดภัยเล็กน้อย

อย่างไรก็ตามคุณมีความถูกต้องที่จะสังเกตว่านี่ไม่ใช่ข้อสันนิษฐานที่เหมาะสมในหลาย ๆ กรณี การแจกแจงแบบปกติสามารถใช้ได้ในบางสถานการณ์แม้ว่าเวลาการเอาตัวรอดในแง่ลบจะไม่มีความหมาย ด้วยเหตุผลนี้การแจกแจงแบบปกติจึงถูกพิจารณา ตัวเลือกทั่วไปอื่น ๆ ได้แก่ Weibull, ค่าสุดขีดที่เล็กที่สุด, ค่าสุดขีดที่ใหญ่ที่สุด, โลจิสติกส์ ฯลฯ ตัวเลือกที่เหมาะสมสำหรับแบบจำลองจะได้รับการแจ้งจากประสบการณ์ในสาขาวิชาและการวางแผนความน่าจะเป็น นอกจากนี้คุณยังสามารถพิจารณาการสร้างแบบจำลองที่ไม่ใช่พารามิเตอร์

การอ้างอิงที่ดีสำหรับการสร้างแบบจำลองพารามิเตอร์แบบคลาสสิกในการวิเคราะห์การเอาตัวรอดคือ: William Q. Meeker และ Luis A. Escobar (1998) วิธีการทางสถิติสำหรับข้อมูลความน่าเชื่อถือไวลีย์


คุณสามารถอธิบายเพิ่มเติมเกี่ยวกับ "ฟังก์ชั่นอันตรายเป็นค่าคงที่โดยใช้เวลา / r / t"?
Haitao Du

4
@ hxd1011: สมมุติโดย "ฟังก์ชันอันตราย" ผู้เขียนอ้างถึงฟังก์ชันกำหนดโดยโดยที่เป็น pdf ของและคือส่วนท้าย ของ ( ) นี้เรียกว่ายังมีอัตราความล้มเหลว ข้อสังเกตคือสำหรับ , อัตราความล้มเหลวคือซึ่งคงที่ นอกจากนี้มันไม่ยากที่จะแสดงให้เห็นว่าเพียงการกระจายชี้แจงมีคุณสมบัตินี้R X ( T ) = F X ( T ) / ˉ F X ( T ) X X ˉ F X X ˉ F X ( T ) = 1 - F X ( T ) = ทีเอฟเอ็กซ์ ( x )rXrX(t)=fX(t)/F¯X(t)fXXF¯XXExp ( λ ) r ( t ) = ( λ e - λ t ) / ( e - λ t ) = λF¯X(t)=1FX(t)=tfX(x)dxExp(λ)r(t)=(λeλt)/(eλt)=λ
wchargin

22

วิธีเพิ่มสัญชาตญาณทางคณิตศาสตร์ที่อยู่เบื้องหลังวิธีการที่เลขชี้กำลังปรากฏขึ้นในการแจกแจงการอยู่รอด:

ความหนาแน่นของความน่าจะเป็นของตัวแปรเอาชีวิตรอดคือโดยที่เป็นอันตรายในปัจจุบัน (ความเสี่ยงสำหรับบุคคลที่ "ตาย" ในวันนี้) และคือ ความน่าจะเป็นว่าคนที่รอดชีวิตมาได้จนกระทั่งทีสามารถขยายได้เป็นความน่าจะเป็นว่าคนที่รอดชีวิตจากวันที่ 1 และวันที่รอดชีวิต 2, ... ถึงวันทีจากนั้น: ด้วยอันตรายที่คงที่และเล็กเราสามารถใช้: ไปประมาณเพียงแค่ H ( T ) S ( T ) เสื้อS ( T ) T P ( s ยูอาร์วีฉันวีอีd d Y T ) = 1 - ชั่วโมง( T ) P ( s u r v i v e d d af(t)=h(t)S(t)h(t)S(t)tS(t)t

P(survived day t)=1h(t)
λ อี- λ1 - λ S ( T ) ( 1 - λ ) เสื้ออี- λ ทีเอฟ( T ) = H ( T ) S ( T ) = λ e
P(survived days 1,2,...,t)=(1h(t))t
λ
eλ1λ
S(t)
(1λ)teλt
และความหนาแน่นของความน่าจะเป็นนั้นคือ
f(t)=h(t)S(t)=λeλt

ข้อจำกัดความรับผิดชอบ:นี่เป็นความพยายามในรูปแบบ pdf ที่เหมาะสม - ฉันเพิ่งคิดว่านี่เป็นเรื่องบังเอิญและยินดีต้อนรับความคิดเห็นใด ๆ ว่าทำไมสิ่งนี้ถึงถูกต้อง / ไม่ถูกต้อง

แก้ไข: เปลี่ยนการประมาณตามคำแนะนำโดย @SamT ดูความคิดเห็นสำหรับการอภิปราย


1
+1 สิ่งนี้ช่วยให้ฉันเข้าใจเพิ่มเติมเกี่ยวกับคุณสมบัติของการแจกแจงเอ็กซ์โปเนนเชียล
Haitao Du

1
คุณสามารถอธิบายบรรทัดสุดท้ายของคุณได้ไหม มันบอกว่าดังนั้นทางซ้ายมือคือฟังก์ชันของ ; ยิ่งกว่านั้นเป็นสิ่งที่ถูกต้อง อย่างไรก็ตามทั้งสองแง่กลางเป็นหน้าที่ของ (เป็นทางด้านขวามือ) แต่ไม่ได้ฟังก์ชั่นของเสื้อนอกจากนี้ประมาณเท่านั้นถือสำหรับ{n}) มันไม่แน่นอนความจริงที่ว่า - มันไม่ได้ประมาณจริงสำหรับขนาดใหญ่ทีฉันเดาว่านี่เป็นเพียงความผิดพลาดที่คุณได้ทำ ... t λ t ( 1 + x / n ) n e x x = o ( S(t)=...tλt(1+x/n)n exx=o(n)limt(1λt/t)t=eλtt
Sam T

@SamT - ขอบคุณสำหรับความคิดเห็นที่แก้ไข มาจากพื้นหลังที่ใช้ฉันยินดีอย่างยิ่งที่จะแก้ไขใด ๆ โดยเฉพาะอย่างยิ่ง บนสัญกรณ์ ผ่านไปขีด จำกัด WRTได้อย่างแน่นอนไม่จำเป็นต้องมี แต่ฉันยังคงเชื่อว่าประมาณถือสำหรับขนาดเล็กเป็นที่พบมักจะอยู่ในรูปแบบการอยู่รอด หรือคุณจะบอกว่ามีอย่างอื่นที่ทำให้การประมาณนี้เกิดขึ้นโดยบังเอิญ? tλ
juod

1
ดูดีขึ้นตอนนี้ :) - ปัญหาคือในขณะที่อาจมีขนาดเล็ก แต่ก็ไม่เป็นความจริงที่มีขนาดเล็ก เช่นนี้คุณไม่สามารถใช้การประมาณ (โดยตรง): ไม่ใช่แม้แต่ "คุณสามารถใช้คณิตศาสตร์ได้ แต่ไม่บริสุทธิ์"; มันก็ไม่ได้ถือเลย อย่างไรก็ตามเราสามารถหลีกเลี่ยงสิ่งนี้ได้: เรามีมีขนาดเล็กดังนั้นเราจึงสามารถไปที่นั่นได้โดยตรงเขียนแน่นอนดังนั้นเราจึงสามารถสรุปได้ว่าλλt
(1+x/n)nex
λ
eλt=(eλ)t(1λ)t.
λ=λt/t
eλt(1λt/t)t.
Sam T

คุณอาจรู้สึกว่านี่เป็นเรื่องพิถีพิถันเล็กน้อย แต่ประเด็นก็คือการให้เหตุผลไม่ถูกต้อง ขั้นตอนที่ไม่ถูกต้องคล้ายกันอาจไม่เป็นจริง แน่นอนว่าในฐานะที่มีคนสมัครคุณอาจยินดีที่จะทำตามขั้นตอนนี้ค้นหาในหลาย ๆ กรณีและไม่ต้องกังวลกับรายละเอียดเฉพาะ! ในฐานะคนที่ทำคณิตศาสตร์บริสุทธิ์นี่เป็นคำถามสำหรับฉัน แต่ฉันเข้าใจว่าเราต้องการทั้งบริสุทธิ์และนำไปใช้! (และโดยเฉพาะอย่างยิ่งในสถิติมันเป็นเรื่องดีที่จะไม่จมอยู่กับความบริสุทธิ์ในด้านเทคนิค)
Sam T

11

แน่นอนคุณจะต้องการดูวิศวกรรมความน่าเชื่อถือและการคาดการณ์สำหรับการวิเคราะห์เวลาการเอาชีวิตรอดอย่างละเอียด ภายในนั้นมีการแจกแจงบางอย่างที่มักใช้:

การกระจาย Weibull (หรือ "อ่างอาบน้ำ") นั้นซับซ้อนที่สุด มันอธิบายถึงโหมดความล้มเหลวสามประเภทซึ่งครองในยุคต่าง ๆ : การตายของทารก (ที่ชิ้นส่วนที่ชำรุดแตกเร็ว), ความล้มเหลวที่เกิดขึ้น (ที่ชิ้นส่วนแตกสุ่มตลอดอายุการใช้งานของระบบ) และการสึกหรอ ใช้). ตามที่ใช้มันมี PDF ซึ่งดูเหมือนว่า "\ __ /" สำหรับอุปกรณ์อิเล็กทรอนิกส์บางอย่างโดยเฉพาะคุณอาจได้ยินเกี่ยวกับเวลา "เบิร์นอิน" ซึ่งหมายความว่าชิ้นส่วนเหล่านั้นได้รับการดำเนินการผ่านส่วน "\" ของเส้นโค้งและความล้มเหลวก่อนหน้านี้ได้ถูกคัดออก (อุดมคติ) น่าเสียดายที่การวิเคราะห์ Weibull แยกย่อยอย่างรวดเร็วหากชิ้นส่วนของคุณไม่เหมือนกัน (รวมถึงสภาพแวดล้อมการใช้งาน!) หรือหากคุณใช้งานในช่วงเวลาที่แตกต่างกัน (เช่นหากบางส่วนใช้งานได้โดยตรงและส่วนอื่น ๆ เข้าสู่ที่จัดเก็บก่อนอัตราความล้มเหลวแบบสุ่ม จะแตกต่างกันอย่างมากเนื่องจากเป็นการผสมผสานการวัดสองครั้ง (ชั่วโมงการทำงานกับชั่วโมงการใช้งาน)

การแจกแจงแบบปกติมักผิดปกติ การแจกแจงแบบปกติทุกครั้งจะมีค่าเป็นลบ บางครั้งอาจเป็นการประมาณค่าที่มีประโยชน์ แต่เวลาที่เป็นจริงคุณมักจะดูล็อกปกติอยู่แล้วดังนั้นคุณอาจใช้การกระจายที่ถูกต้อง การแจกแจงแบบบันทึกตามปกติจะใช้อย่างถูกต้องเมื่อคุณมีความล้มเหลวแบบสุ่มที่ล้าสมัยและล้มเหลวเล็กน้อยและไม่มีเหตุการณ์อื่นใด! เช่นเดียวกับการแจกแจงแบบปกติพวกมันมีความยืดหยุ่นเพียงพอที่คุณสามารถบังคับให้พวกมันพอดีกับข้อมูลส่วนใหญ่ คุณจำเป็นต้องต่อต้านการกระตุ้นและตรวจสอบว่าสถานการณ์เหมาะสม

ในที่สุดการแจกแจงแบบเอ็กซ์โพเนนเชียลเป็นสิ่งที่เทียมได้จริง คุณมักจะไม่ทราบว่าชิ้นส่วนเก่าเป็นอย่างไร (ตัวอย่างเช่นเมื่อชิ้นส่วนไม่ได้ต่อเนื่องกันและมีเวลาต่างกันเมื่อเข้าสู่บริการ) ดังนั้นการกระจายแบบอิงหน่วยความจำจะหมด นอกจากนี้หลายส่วนมีระยะเวลาการสึกหรอที่ยาวมากจนไม่สามารถควบคุมได้โดยสิ้นเชิงจากความล้มเหลวที่เกิดขึ้นหรือนอกกรอบเวลาที่มีประโยชน์ของการวิเคราะห์ ดังนั้นในขณะที่มันอาจจะไม่เป็นแบบอย่างที่สมบูรณ์แบบเหมือนกับการแจกแจงแบบอื่น แต่ก็ไม่ได้สนใจสิ่งที่เดินทางไป หากคุณมี MTTF (จำนวนเวลา / จำนวนประชากรล้มเหลว) แสดงว่าคุณมีการแจกแจงแบบเอ็กซ์โปเนนเชียล นอกเหนือจากนั้นคุณไม่จำเป็นต้องมีความเข้าใจด้านร่างกายของระบบของคุณ คุณสามารถทำประมาณการชี้แจงเพียงขึ้นอยู่กับการสังเกตส่วน MTTF (สมมติว่ามีตัวอย่างมากพอ) และพวกเขาก็ออกมาใกล้แดง นอกจากนี้ยังมีความยืดหยุ่นในการทำให้เกิด: หากทุก ๆ เดือนมีคนเบื่อและเล่นกีฬาชนิดหนึ่งที่มีบางส่วนจนกว่ามันจะหยุดพักบัญชีที่อธิบายถึงสิ่งนั้น (มันม้วนเข้าสู่ MTTF) เอกซ์โปเนนเชียลก็ง่ายพอที่คุณสามารถทำการคำนวณแบบ back-of-the- ซองจดหมายสำหรับความพร้อมใช้งานของระบบที่ซ้ำซ้อนและสิ่งนี้ซึ่งเพิ่มประโยชน์อย่างมาก


3
นี่เป็นคำตอบที่ดี แต่โปรดทราบว่าการแจกแจงแบบ Weibull ไม่ใช่การกระจายพารามิเตอร์แบบ "ซับซ้อนที่สุด" สำหรับแบบจำลองการเอาตัวรอด ฉันไม่แน่ใจว่าจะมีเรื่องแบบนี้หรือไม่ แต่แน่นอนว่าเกี่ยวข้องกับ Weibull นั่นคือการแจกแจงแกมม่าทั่วไป & การกระจายทั่วไป Fซึ่งทั้งสองอย่างสามารถนำ Weibull เป็นกรณีพิเศษโดยตั้งค่าพารามิเตอร์เป็น 0
gung - Reinstate Monica

มันเป็นสิ่งที่ซับซ้อนที่สุดที่ใช้กันทั่วไปในด้านวิศวกรรมความน่าเชื่อถือ (วรรคแรก :) ฉันไม่เห็นด้วยกับประเด็นของคุณ แต่ฉันก็ไม่เคยเห็นการใช้งานจริงเช่นกัน (การจดบันทึกว่าพวกเขาสามารถนำมาใช้ได้อย่างไร )
fectin - ฟรี Monica

9

เพื่อตอบคำถามที่ชัดเจนของคุณคุณไม่สามารถใช้การแจกแจงแบบปกติเพื่อความอยู่รอดได้เพราะการแจกแจงแบบปกติไปที่อนันต์เชิงลบและการอยู่รอดนั้นไม่ใช่แบบเชิงลบอย่างเคร่งครัด ยิ่งกว่านั้นฉันไม่คิดว่ามันเป็นความจริงที่ว่า "ทุกคนในความเป็นจริงจะมีการแจกแจงเวลาการเอาชีวิตรอด

เมื่อเวลาการเอาชีวิตรอดถูกจำลองแบบพารามิเตอร์ (เช่นเมื่อการแจกแจงชื่อใด ๆ ถูกเรียกใช้) การแจกแจงแบบ Weibullเป็นจุดเริ่มต้นทั่วไป โปรดทราบว่า Weibull มีสองพารามิเตอร์รูปร่างและสเกลและเมื่อรูปร่าง = 1 Weibull จะลดความซับซ้อนของการแจกแจงแบบเอ็กซ์โพเนนเชียล วิธีคิดเกี่ยวกับสิ่งนี้คือการแจกแจงเอ็กซ์โพเนนเชียลเป็นการแจกแจงแบบพารามิเตอร์ที่ง่ายที่สุดสำหรับเวลาการเอาชีวิตรอดซึ่งเป็นเหตุผลว่าทำไมจึงมีการพูดคุยกันบ่อยครั้งแรกเมื่อมีการสอนการวิเคราะห์การรอดชีวิต (โดยการเปรียบเทียบให้พิจารณาว่าเรามักจะเริ่มสอนการทดสอบสมมติฐานโดยไปที่ตัวอย่างหนึ่ง -test ที่เราแกล้งรู้จักประชากร SD a-Priori จากนั้นจึงทดสอบ -test) tzt

การแจกแจงเอ็กซ์โพเนนเชียลถือว่าความเป็นอันตรายเหมือนกันเสมอไม่ว่าหน่วยนั้นจะอยู่รอดได้นานเท่าไร (พิจารณาจากคำตอบของ @ CaffeineConnoisseur ) ในทางตรงกันข้ามเมื่อรูปร่างเป็นในการแจกแจงแบบ Weibull ก็หมายความว่าอันตรายจะเพิ่มความอยู่รอดของคุณให้นานขึ้น (เช่น 'โค้งของมนุษย์'); และเมื่อมันเป็นมันหมายถึงอันตรายลดลง ('ต้นไม้') < 1>1<1

โดยทั่วไปการแจกแจงการอยู่รอดนั้นซับซ้อนและไม่เหมาะสมกับการแจกแจงที่มีชื่อ ผู้คนมักจะไม่รำคาญที่จะคิดออกว่ามันอาจจะมีการกระจาย นั่นคือสิ่งที่ทำให้รูปแบบอันตรายตามสัดส่วนของค็อกซ์เป็นที่นิยมมาก: มันเป็นแบบกึ่งพารามิเตอร์ซึ่งความเป็นอันตรายพื้นฐานนั้นไม่สามารถระบุได้อย่างสมบูรณ์ แต่ส่วนที่เหลือของแบบจำลองสามารถเป็นตัวแปรในแง่ของความสัมพันธ์กับพื้นฐานที่ไม่ระบุ


4
"ยิ่งไปกว่านั้นฉันไม่คิดว่ามันเป็นความจริงที่ว่า" ทุกครั้งที่มีการเอาชีวิตรอดจะถือว่ามีการเอาชีวิตรอดแทน " ฉันพบว่ามันค่อนข้างพบได้บ่อยในระบาดวิทยา
Fomite

1
@ gung, คุณช่วยอธิบายได้ไหม
Gaurav Singhal

7

นิเวศวิทยาบางอย่างอาจช่วยตอบ "ทำไม" ที่อยู่เบื้องหลังคำถามนี้

เหตุผลที่การแจกแจงแบบเอ็กซ์โพเนนเชียลใช้เพื่อการอยู่รอดแบบจำลองเกิดจากกลยุทธ์ชีวิตที่เกี่ยวข้องกับสิ่งมีชีวิตในธรรมชาติ มีสองขั้วโดยคำนึงถึงกลยุทธ์การเอาชีวิตรอดที่มีที่ว่างสำหรับพื้นกลาง

นี่คือภาพที่แสดงให้เห็นถึงสิ่งที่ฉันหมายถึง (มารยาทของ Khan Academy):

https://www.khanacademy.org/science/biology/ecology/population-ecology/a/life-tables-survivorship-age-sex-structure

กราฟนี้พล็อตรอดชีวิตบุคคลบนแกน Y และ "ร้อยละของอายุขัยสูงสุด" (aka การประมาณอายุของบุคคล) บนแกน X

Type I คือมนุษย์ซึ่งเป็นแบบจำลองสิ่งมีชีวิตที่มีการดูแลระดับสูงสุดของลูกหลานของพวกเขาเพื่อให้แน่ใจว่าการตายของทารกต่ำมาก บ่อยครั้งที่สปีชี่ส์เหล่านี้มีลูกหลานน้อยมากเพราะแต่ละคนใช้เวลาและความพยายามของพ่อแม่เป็นจำนวนมาก ส่วนใหญ่ของสิ่งที่ฆ่าสิ่งมีชีวิตประเภทที่ 1 คือประเภทของภาวะแทรกซ้อนที่เกิดขึ้นในวัยชรา กลยุทธ์ที่นี่คือการลงทุนที่สูงเพื่อผลตอบแทนที่สูงในระยะยาวชีวิตที่มีประสิทธิผลหากราคาของจำนวนที่แท้จริง

ในทางกลับกัน Type III ถูกจำลองโดยต้นไม้ (แต่อาจเป็นแพลงก์ตอน, ปะการัง, ปลาวางไข่, แมลงหลายชนิด, ฯลฯ ) ซึ่งผู้ปกครองลงทุนค่อนข้างน้อยในแต่ละลูกหลาน แต่สร้างตันของพวกเขาด้วยความหวังว่า อยู่รอด. กลยุทธ์ที่นี่คือ "สเปรย์และอธิษฐาน" หวังว่าในขณะที่ลูกหลานส่วนใหญ่จะถูกทำลายอย่างรวดเร็วโดยนักล่าที่ใช้ประโยชน์จากการเลือกง่าย ๆ ไม่กี่คนที่รอดมานานพอที่จะเติบโตจะกลายเป็นเรื่องยากที่จะฆ่า กิน ในขณะที่บุคคลเหล่านี้ผลิตลูกหลานจำนวนมากหวังว่าบางคนจะมีชีวิตรอดไปตามอายุของตัวเองเช่นกัน

Type II เป็นกลยุทธ์ที่มีการลงทุนปานกลางเพื่อความอยู่รอดในระดับปานกลางในทุกช่วงอายุ

ฉันมีศาสตราจารย์นิเวศวิทยาที่พูดแบบนี้:

"Type III (ต้นไม้) คือ 'Curve of Hope' เพราะยิ่งมีชีวิตอยู่ต่อไปนานเท่าไหร่โอกาสที่มันจะยังคงอยู่รอดก็จะมากขึ้นเท่านั้นในขณะเดียวกัน Type I (มนุษย์) คือ 'Curve of Despair' เพราะยิ่งนานขึ้น คุณมีชีวิตอยู่มีโอกาสมากขึ้นที่คุณจะตาย "


สิ่งนี้น่าสนใจ แต่โปรดทราบว่าสำหรับมนุษย์ก่อนการแพทย์แผนปัจจุบัน (และในบางสถานที่ในโลกปัจจุบัน) การตายของทารกสูงมาก การอยู่รอดของมนุษย์พื้นฐานมักถูกจำลองด้วย " อันตรายจากอ่างอาบน้ำ "
gung - Reinstate Monica

@gung แน่นอนว่านี่เป็นลักษณะทั่วไปและมีการเปลี่ยนแปลงภายในมนุษย์ในภูมิภาคและช่วงเวลาต่างกัน ความแตกต่างที่สำคัญคือชัดเจนเมื่อคุณเปรียบเทียบสุดขั้วเช่นครอบครัวมนุษย์ตะวันตก (ประมาณ 2.5 ลูกต่อคู่ซึ่งส่วนใหญ่ไม่ตายในวัยทารก) เทียบกับปะการังหรือปลาวางไข่ (ไข่นับล้านปล่อยต่อวงจรการผสมพันธุ์ซึ่งส่วนใหญ่ เสียชีวิตเนื่องจากถูกกินตายอดอาหารเคมีทางน้ำที่เป็นอันตรายหรือล้มเหลวในการล่องลอยสู่จุดหมายปลายทางที่อยู่อาศัยได้)
CaffeineConnoisseur

1
ในขณะที่ฉันทุกคนอธิบายจากนิเวศวิทยาฉันจะสังเกตสมมติฐานเช่นนี้เช่นกันเช่นฮาร์ดไดรฟ์และเครื่องยนต์อากาศยาน
Fomite

6

สิ่งนี้ไม่ได้ตอบคำถามโดยตรง แต่ฉันคิดว่ามันสำคัญมากที่จะต้องทราบและไม่สอดคล้องกับความคิดเห็นเดียว

ในขณะที่การแจกแจงเอ็กซ์โพเนนเชียลนั้นมีแหล่งกำเนิดทางทฤษฎีที่ดีมากและสมมติว่าข้อมูลที่สร้างขึ้นตามกลไกที่ใช้ในการแจกแจงเอ็กซ์โพเนนเชียลนั้นในทางทฤษฎีควรให้การประมาณค่าที่เหมาะสมที่สุด ใกล้เคียงกับผลลัพธ์ที่ยอมรับได้ (แน่นอนขึ้นอยู่กับประเภทข้อมูลที่ฉันวิเคราะห์เกือบทุกข้อมูลชีวภาพ) ตัวอย่างเช่นฉันเพิ่งดูชุดรูปแบบที่มีการแจกแจงที่หลากหลายโดยใช้ชุดข้อมูลแรกที่ฉันสามารถหาได้ในแพ็คเกจ R ของฉัน สำหรับการตรวจสอบรูปแบบของการแจกแจงพื้นฐานเรามักจะเปรียบเทียบกับตัวแบบกึ่งพารามิเตอร์ ลองดูผลลัพธ์

เส้นโค้งการอยู่รอด

จาก Weibull การกระจาย log-log และ log-normal ไม่มีผู้ชนะที่ชัดเจนในแง่ของความเหมาะสมที่เหมาะสม แต่มีผู้แพ้ที่ชัดเจน: การแจกแจงแบบเลขชี้กำลัง! เป็นประสบการณ์ของฉันที่ขนาดของการปรับที่ไม่ถูกต้องนี้ไม่ได้ยอดเยี่ยม แต่เป็นบรรทัดฐานสำหรับการแจกแจงแบบเลขชี้กำลัง

ทำไม? เนื่องจากการแจกแจงแบบเอ็กซ์โพเนนเชียลเป็นพารามิเตอร์ตระกูลเดียว ดังนั้นถ้าฉันระบุค่าเฉลี่ยของการแจกแจงนี้ฉันได้ระบุช่วงเวลาอื่น ๆ ของการแจกแจงทั้งหมด ตระกูลอื่น ๆ เหล่านี้เป็นตระกูลพารามิเตอร์ทั้งสอง ดังนั้นจึงมีความยืดหยุ่นมากขึ้นในการปรับตัวเข้ากับข้อมูลเอง

ตอนนี้โปรดทราบว่าการแจกแจงแบบ Weibull มีการแจกแจงแบบเอ็กซ์โพเนนเชียลเป็นกรณีพิเศษ (เช่นเมื่อพารามิเตอร์รูปร่าง = 1) ดังนั้นแม้ว่าข้อมูลจะเป็นเลขชี้กำลังอย่างแท้จริงเราเพียง แต่เพิ่มสัญญาณรบกวนให้กับประมาณการของเราเพียงเล็กน้อยโดยใช้การแจกแจงแบบ Weibull มากกว่าการแจกแจงแบบเลขชี้กำลัง ดังนั้นฉันจะไม่แนะนำให้ใช้การแจกแจงเอ็กซ์โพเนนเชียลเพื่อสร้างแบบจำลองข้อมูลจริง (และฉันอยากรู้ว่าผู้อ่านรายใดมีตัวอย่างว่าเมื่อใดเป็นความคิดที่ดีจริง ๆ )


1
ฉันไม่มั่นใจในคำตอบนี้: 1) "ใช้ชุดข้อมูลแรกที่ฉันสามารถหาได้ในแพ็คเกจ R" ของฉัน ... จริงเหรอ? ... บน stats.stackexchange? ตัวอย่างหนึ่งตัวอย่างและเราได้ข้อสรุปทั่วไปหรือไม่ 1b) สำหรับแบบจำลองที่เวลาความล้มเหลวมีแนวโน้มที่จะกระจายไปตามค่าที่กำหนด (เช่นชีวิตของผู้คน) ให้เห็นอย่างชัดเจนว่าการแจกแจงเช่นแกมม่า, ไวบูลล์ ฯลฯ เหมาะสมกว่า; เมื่อเหตุการณ์มีแนวโน้มที่เท่าเทียมกันการแจกแจงเอ็กซ์โพเนนเชียลนั้นเหมาะสมกว่า ฉันเดิมพัน "ชุดข้อมูลชุดแรก" ของคุณด้านบนเป็นประเภทแรก 2) โมเดลอื่น ๆ ทั้งหมดมี 2 พารามิเตอร์หนึ่งควรใช้เช่น Bayes factor เพื่อเปรียบเทียบโมเดล
Luca Citi

2
@LucaCiti: "ชุดข้อมูลแรกในแพ็คเกจ R ของฉัน" หมายถึงชุดข้อมูลชุดแรกในแพ็คเกจ R- ที่ฉันเผยแพร่ (icenReg) และฉันก็ทราบว่าประสบการณ์ของฉันกับการแจกแจงเอ็กซ์โปเนนเชียลที่มีความพอดีไม่ดีนั้นขึ้นอยู่กับประเภทของข้อมูลที่ฉันวิเคราะห์ ข้อมูลทางชีววิทยาเกือบเฉพาะ ในที่สุดตามที่ระบุไว้ในตอนท้ายฉันอยากรู้อยากเห็นตัวอย่างที่ใช้จริงซึ่งมีเหตุผลที่น่าเชื่อถือที่จะใช้การแจกแจงเอ็กซ์โปเนนเชียลดังนั้นถ้าคุณมีโปรดแบ่งปัน
หน้าผา AB

1
สถานการณ์ที่คุณอาจต้องการใช้การแจกแจงแบบเอ็กซ์โพเนนเชียลคือเมื่อ (ก) คุณมีข้อมูลในอดีตจำนวนมากที่แสดงให้เห็นว่าข้อมูลนั้นมีความใกล้เคียงกับการแจกแจงแบบเอ็กซ์โปเนนเชียลและ (b) ที่คุณต้องการ ie n <10) แต่ฉันไม่รู้แอพพลิเคชันที่แท้จริงเช่นนี้ อาจมีปัญหาในการควบคุมคุณภาพการผลิตหรือไม่
หน้าผา AB

1
สวัสดีคลิฟขอบคุณที่สละเวลาตอบความคิดเห็นของฉัน ฉันคิดว่าการพูดการแจกแจงอย่างคร่าวๆเช่น Weibull เหมาะกับสถานการณ์ที่ดีขึ้นซึ่งสอดคล้องกับคำถามเช่น "เวลาชีวิตของแต่ละ x ในตัวอย่างของฉัน" หรือ "เมื่อเซลล์ประสาท x จะยิงอีกครั้ง" หรือ "เมื่อหิ่งห้อย x กำลังจะกะพริบอีกครั้ง " ในทางกลับกันการแจกแจงแบบยกตัวอย่างคำถามเช่น "เมื่อใดความตายครั้งต่อไปที่คาดว่าจะเกิดขึ้นในประชากรของฉัน", "เมื่อใดจะมีเซลล์ประสาทต่อไปที่จะยิง" หรือ "เมื่อหิ่งห้อยในฝูงจะกะพริบ"
Luca Citi

@LucaCiti; ฮาเพิ่งรู้ว่าเรื่องตลกก่อนหน้าของคุณเป็นเรื่องตลกเกี่ยวกับการอนุมานด้วย n = 1 ไม่รู้ว่าฉันพลาดมันครั้งแรกได้ยังไง ในการป้องกันของฉันถ้าเรามีทฤษฎีที่บอกว่าตัวประมาณค่าควรเป็นแบบปกติเชิง asymptotically แต่มันก็เป็น 4 ส่วนเบี่ยงเบนมาตรฐานจากค่าประมาณแบบปกติแบบ asymptotically เราสามารถทำได้! แต่ในความจริงจังทั้งหมดมันไม่ได้เป็นพล็อตเดียวที่ทำให้ฉันเชื่อ แต่เห็นการเบี่ยงเบนในระดับเดียวกันนั้นอย่างสม่ำเสมอ ฉันอาจถูกบล็อกหากฉันสแปม exponential ไม่เหมาะสมมากกว่า 20 พล็อต
หน้าผา AB

4

อีกเหตุผลหนึ่งที่การแจกแจงแบบเอ็กซ์โพเนนเชียลเพิ่มขึ้นบ่อยครั้งเพื่อจำลองช่วงเวลาระหว่างเหตุการณ์ต่าง ๆ ดังต่อไปนี้

เป็นที่ทราบกันดีว่าภายใต้สมมติฐานบางอย่างผลรวมของตัวแปรสุ่มอิสระจำนวนมากจะใกล้เคียงกับการแจกแจงแบบเกาส์ ทฤษฎีบทที่คล้ายกันนี้มีไว้สำหรับกระบวนการต่ออายุเช่นโมเดลสุ่มสำหรับเหตุการณ์ที่เกิดขึ้นแบบสุ่มในเวลาที่มีช่วงเวลาระหว่างเหตุการณ์ IID ในความเป็นจริงปาล์ม Khintchine ทฤษฎีบทระบุว่าการทับซ้อนของเป็นจำนวนมาก (ไม่จำเป็นต้อง Poissonian) กระบวนการต่ออายุพฤติกรรม asymptotically เช่นที่กระบวนการ Poisson ช่วงเวลาระหว่างเหตุการณ์ของกระบวนการปัวซองนั้นมีการแจกแจงแบบเอ็กซ์โพเนนเชียล


3

tl; dr - การแจกแจงแบบ expontential เทียบเท่ากับการสันนิษฐานว่าบุคคลนั้นมีแนวโน้มที่จะตายในช่วงเวลาที่กำหนด

รากศัพท์

  1. สมมติว่าบุคคลที่มีชีวิตมีแนวโน้มที่จะตายในช่วงเวลาใดเวลาหนึ่งเช่นเดียวกับคนอื่น ๆ

  2. ดังนั้นอัตราการตายเป็นสัดส่วนกับประชากรP PdPdtP

dPdt  P
  1. การแก้ WolframAlphaแสดงให้เห็น:

P(t)=c1et

ดังนั้นประชากรตามการแจกแจงแบบเลขชี้กำลัง

โน้ตคณิตศาสตร์

คณิตศาสตร์ข้างต้นเป็นการลดสมการอนุพันธ์สามัญอันดับหนึ่ง (ODE)ลำดับที่หนึ่ง ปกติเราก็จะแก้ปัญหาสำหรับโดยสังเกตเงื่อนไขขอบเขตว่าประชากรเริ่มต้นที่ค่าที่กำหนดบางในช่วงเริ่มต้นเวลาt_0 P ( t 0 ) t 0c0P(t0)t0

จากนั้นสมการจะกลายเป็น:

P(t)=etP(t0).

ตรวจสอบความเป็นจริง

การแจกแจงเอ็กซ์โปเนนเชียลสันนิษฐานว่าผู้คนในประชากรมีแนวโน้มที่จะตายในอัตราเดียวกันตลอดเวลา ในความเป็นจริงอัตราการตายจะมีแนวโน้มที่แตกต่างกันไปสำหรับประชากรที่ จำกัด

ขึ้นมาพร้อมกับการกระจายที่ดีขึ้นเกี่ยวข้องกับสมการเชิงอนุพันธ์สุ่ม จากนั้นเราไม่สามารถพูดได้ว่ามีโอกาสตายอย่างต่อเนื่อง ค่อนข้างเราจะต้องเกิดการกระจายสำหรับอัตราต่อรองของแต่ละคนที่กำลังจะตายในช่วงเวลาใดเวลาหนึ่งจากนั้นรวมต้นไม้ที่เป็นไปได้ต่าง ๆ เหล่านั้นเข้าด้วยกันสำหรับประชากรทั้งหมดแล้วแก้สมการเชิงอนุพันธ์นั้นตลอดเวลา

ฉันจำไม่ได้ว่าเคยเห็นสิ่งนี้ทำในสิ่งที่ออนไลน์มาก่อนดังนั้นคุณอาจจะไม่เจอมัน แต่นั่นเป็นขั้นตอนการสร้างแบบจำลองถัดไปหากคุณต้องการปรับปรุงการแจกแจงเอ็กซ์โปเนนเชียล


3

(โปรดทราบว่าในส่วนที่คุณยกมาคำสั่งนั้นมีเงื่อนไขประโยคนั้นไม่ได้อธิบายถึงการเอาชีวิตรอดแบบเอกซ์โปเนนเชียลมันอธิบายถึงผลของการทำเช่นนั้นอย่างไรก็ตามการสันนิษฐานของการเอาชีวิตรอดแบบเอ็กซ์โพเนนเชียลเป็นเรื่องธรรมดา เลขชี้กำลัง "และ" ทำไมไม่ปกติ "- ตั้งแต่แรกได้รับการคุ้มครองค่อนข้างดีแล้วฉันจะมุ่งเน้นไปที่สิ่งที่สอง)

โดยปกติเวลาการเอาชีวิตรอดแบบกระจายไม่สมเหตุสมผลเพราะมีความเป็นไปได้ที่ไม่ใช่ศูนย์ของเวลาการเอาชีวิตรอดในแง่ลบ

หากคุณ จำกัด การพิจารณาของคุณไว้ที่การแจกแจงแบบปกติที่แทบจะไม่มีโอกาสอยู่ใกล้ศูนย์คุณไม่สามารถสร้างแบบจำลองข้อมูลการรอดชีวิตที่มีความน่าจะเป็นที่สมเหตุสมผลในระยะเวลาการอยู่รอดสั้น:

เอาชีวิตรอดเวลา - ปกติหมายถึง 100 sd 10 เทียบกับการแจกแจงแบบพิเศษที่มีค่าเฉลี่ย 100 และ sd 42 ซึ่งมีความน่าจะเป็นมากกว่า 20% ของเวลาการเอาชีวิตรอดระหว่าง 0 ถึง 50

บางทีครั้งหนึ่งในการเอาชีวิตรอดที่แทบจะไม่มีโอกาสรอดชีวิตในช่วงเวลาสั้น ๆ จะสมเหตุสมผล แต่คุณต้องการการแจกแจงที่มีเหตุผลในทางปฏิบัติ - โดยปกติแล้วคุณจะสังเกตเวลาการเอาชีวิตรอดระยะสั้นและระยะยาว การกระจายของเวลาการอยู่รอด) การแจกแจงแบบปกติที่ไม่ได้แก้ไขจะไม่ค่อยมีประโยชน์ในทางปฏิบัติ

[ ปกติที่ถูกตัดทอนอาจเป็นการประมาณคร่าวๆที่สมเหตุสมผลมากกว่าปกติ แต่การแจกแจงแบบอื่นมักจะทำได้ดีกว่า]

ความเสี่ยงคงที่ของเลขชี้กำลังบางครั้งเป็นการประมาณที่สมเหตุสมผลสำหรับเวลาเอาชีวิตรอดตัวอย่างเช่นหาก "เหตุการณ์สุ่ม" เช่นอุบัติเหตุเป็นสาเหตุสำคัญที่ทำให้อัตราการเสียชีวิตการอยู่รอดของเอ็กซ์โปเนนเชียลค่อนข้างดี (ในบรรดาประชากรสัตว์บางครั้งทั้งการปล้นสะดมและโรคสามารถกระทำได้อย่างน้อยก็เหมือนกับกระบวนการเสี่ยงโดยทิ้งบางสิ่งเช่นเลขชี้กำลังแทนการประมาณครั้งแรกที่สมเหตุสมผลกับเวลาการอยู่รอด)


คำถามเพิ่มเติมที่เกี่ยวข้องกับการตัดทอนปกติ: หากปกติไม่เหมาะสมทำไมไม่ยกกำลังสองปกติ (ไคสแควร์กับ df 1)

แน่นอนว่าอาจจะดีขึ้นเล็กน้อย ... แต่โปรดทราบว่าสิ่งนี้จะสอดคล้องกับอันตรายที่ไม่มีที่สิ้นสุดที่ 0 ดังนั้นบางครั้งมันก็จะมีประโยชน์ ในขณะที่มันสามารถสร้างแบบจำลองกรณีที่มีสัดส่วนที่สูงมากของเวลาที่สั้นมาก แต่ก็มีปัญหาการสนทนาเท่านั้นที่จะสามารถสร้างแบบจำลองกรณีที่มีการรอดชีวิตเฉลี่ยสั้นกว่ามาก (25% ของเวลาการอยู่รอดต่ำกว่า 10.15% ของเวลาเฉลี่ย ครึ่งหนึ่งของเวลาการเอาชีวิตรอดมีค่าน้อยกว่า 45.5% ของค่าเฉลี่ยนั่นคือค่าเอาชีวิตรอดเฉลี่ยน้อยกว่าค่าเฉลี่ยครึ่งหนึ่ง)

ลองดูมาตราส่วน (เช่นแกมม่าที่มีพารามิเตอร์รูปร่าง ): 1χ1212

พล็อตที่คล้ายกันมาก่อน แต่ยังมีความหนาแน่นของตัวแปรที่เป็น 100 เท่าไคสแควร์ (1);  มันมีจุดสูงสุดสูงที่ 0 และหางที่หนักมาก - ค่าเฉลี่ยคือ 100 แต่ sd อยู่ที่ประมาณ 141 และค่ามัธยฐานประมาณ 45

[บางทีถ้าคุณหาผลรวมสองตัวจากแปรผัน ... หรือบางทีถ้าคุณคิดว่าไม่ใช่ศูนย์กลางคุณจะได้รับความเป็นไปได้ที่เหมาะสม นอกเหนือจากเลขชี้กำลังตัวเลือกทั่วไปของการแจกแจงแบบพาราเมตริกเพื่อการเอาชีวิตรอด ได้แก่ Weibull, lognormal, แกมม่า, log-logistic ท่ามกลางคนอื่น ๆ ... โปรดทราบว่า Weibull และแกมมารวมถึง exponential เป็นกรณีพิเศษ] χ 2χ12χ2


ขอบคุณฉันรอคำตอบของคุณตั้งแต่เมื่อวานนี้ :) คำถามเพิ่มเติมที่เกี่ยวข้องกับการตัดทอนปกติ: หากปกติไม่เหมาะสมทำไมไม่ยกกำลังสองปกติ (ไคสแควร์กับ df 1)
Haitao Du

แน่นอนว่าอาจจะดีขึ้นเล็กน้อย ... แต่โปรดทราบว่าสิ่งนี้จะสอดคล้องกับอันตรายที่ไม่มีขีด จำกัด ที่ 0 - ดังนั้นบางครั้งจะมีประโยชน์เท่านั้น มันมีปัญหาการสนทนาของกรณีการสร้างแบบจำลองเท่านั้นที่มักจะสั้นกว่าการเอาชีวิตรอดเฉลี่ย (25% ของเวลาการเอาชีวิตรอดต่ำกว่า 10.15% ของเวลาการเอาชีวิตเฉลี่ยและครึ่งหนึ่งของการเอาชีวิตรอดน้อยกว่า 45.5% ของค่าเฉลี่ย) บางทีถ้าคุณรวม สองรายการที่คุณสามารถรับฟังก์ชั่นอันตรายที่น่าประหลาดใจได้น้อยลง . .; Pχ12
Glen_b

ขอบคุณอีกครั้งสำหรับการศึกษาปรีชาของฉันที่อยู่เบื้องหลังสิ่งต่าง ๆ ฉันเคยเห็นแบบฝึกหัดระดับสูตรมากเกินไปและผู้คนทำสิ่งต่าง ๆ โดยไม่ทราบสาเหตุ CV เป็นสถานที่ที่ดีในการเรียนรู้
Haitao Du

1

หากเราต้องการให้เวลาเป็นบวกอย่างเคร่งครัดทำไมไม่แจกแจงแบบปกติด้วยค่าเฉลี่ยที่สูงขึ้นและความแปรปรวนน้อยมาก (แทบจะไม่มีโอกาสได้จำนวนลบ)

เพราะ

  1. ที่ยังคงมีความเป็นไปได้ที่ไม่ใช่ศูนย์ของการเป็นเชิงลบดังนั้นมันจึงไม่ใช่เชิงบวกอย่างเด็ดขาด

  2. ค่าเฉลี่ยและความแปรปรวนเป็นสิ่งที่คุณสามารถวัดได้จากประชากรที่คุณพยายามจำลอง หากประชากรของคุณมีค่าเฉลี่ย 2 และความแปรปรวน 1 และคุณจำลองด้วยการแจกแจงแบบปกติการแจกแจงแบบปกตินั้นจะมีมวลอยู่ต่ำกว่าศูนย์ หากคุณสร้างโมเดลด้วยการแจกแจงแบบปกติที่มีค่าเฉลี่ย 5 และค่าความแปรปรวน 0.1 โมเดลของคุณจะมีคุณสมบัติที่แตกต่างกันอย่างมากสำหรับสิ่งที่มันควรจะเป็นแบบจำลอง

การกระจายตัวแบบปกติมีรูปร่างเฉพาะและรูปร่างนั้นสมมาตรกับค่าเฉลี่ย วิธีเดียวในการปรับรูปร่างคือการย้ายไปทางขวาและซ้าย (เพิ่มหรือลดค่าเฉลี่ย) หรือเพื่อให้กระจายออกไปมากขึ้นหรือน้อยลง (เพิ่มหรือลดความแปรปรวน) นี่หมายความว่าวิธีเดียวที่จะได้การแจกแจงแบบปกติโดยที่มวลส่วนใหญ่อยู่ระหว่างสองถึงสิบและมีจำนวนน้อยนิดที่อยู่ต่ำกว่าศูนย์คุณต้องใส่ค่าเฉลี่ยของคุณที่พูดหก (กึ่งกลางของช่วง ) และตั้งค่าความแปรปรวนให้เล็กพอที่จะมีตัวอย่างเพียงเล็กน้อยเท่านั้นที่เป็นลบ แต่คุณอาจพบว่าตัวอย่างส่วนใหญ่ของคุณคือ 5, 6 หรือ 7 ในขณะที่คุณควรจะมี 2s, 3s, 4s, 8s, 9s และ 10s

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.