จะบอกความน่าจะเป็นของความล้มเหลวได้อย่างไรถ้าไม่มีความล้มเหลว?


50

ฉันสงสัยว่ามีวิธีที่จะบอกความน่าจะเป็นของสิ่งที่ล้มเหลว (ผลิตภัณฑ์) ถ้าเรามีผลิตภัณฑ์ 100,000 รายการในเขตข้อมูลเป็นเวลา 1 ปีและไม่มีความล้มเหลวหรือไม่? ความน่าจะเป็นที่ผลิตภัณฑ์หนึ่งใน 10,000 รายการที่ขายไปนั้นล้มเหลวคืออะไร


4
มีบางอย่างบอกฉันว่านี่ไม่ใช่ปัญหาความน่าเชื่อถือที่แท้จริง ไม่มีผลิตภัณฑ์ที่มีอัตราความล้มเหลวต่ำเช่นนี้
Aksakal

คุณต้องการแบบจำลองสำหรับการกระจายอัตราความสำเร็จ / ความล้มเหลวที่เป็นไปได้ก่อนที่คุณจะสามารถอนุมานอะไรก็ได้จากสถิติไปจนถึงความน่าจะเป็นสำหรับอัตราความสำเร็จ / ความล้มเหลวที่เกิดขึ้นจริง คำอธิบายของคุณให้พื้นฐานน้อยมากในการอนุมาน / ถือว่าการแจกจ่ายดังกล่าว
RBarryYoung

1
@RarryYoung โปรดตรวจสอบคำตอบที่ให้ - พวกเขาให้แนวทางที่น่าสนใจและถูกต้องกับปัญหา หากคุณไม่เห็นด้วยกับวิธีการเหล่านี้โปรดแสดงความคิดเห็นหรือให้คำตอบด้วยตนเอง
ทิม

2
@ Aksakal - อัตราความล้มเหลวต่ำไม่ได้เป็นไปไม่ได้ถ้ามันเป็นผลิตภัณฑ์ที่เรียบง่ายที่มีมูลค่าสูงและมีความเสี่ยงสูงในกรณีที่เกิดความล้มเหลว (เช่นเครื่องมือผ่าตัด) ที่ผ่านการทดสอบและตรวจสอบระดับ รับรอง) ก่อนที่จะปล่อย แน่นอนว่าสิ่งที่ตรงกันข้ามอาจเป็นจริงผลิตภัณฑ์อาจมีค่าต่ำซึ่งผู้ใช้ปลายทางไม่ได้รายงานปัญหาเกี่ยวกับผลิตภัณฑ์ที่มีข้อบกพร่อง (ผู้ผลิต gumball แน่นอนมีอัตราการรายงานข้อบกพร่องน้อยกว่า 1/100000 หรือไม่) ผู้บริโภคเพียงทิ้ง มันและลองใหม่
จอห์นนี่

@Johnny เมื่อโมโตโรล่าขึ้นมาด้วย6σพวกเขาเคยโม้ว่ามีความล้มเหลว 3 ต่อ 100 ล้านผลิตภัณฑ์หรือสิ่งที่ต้องการที่
Aksakal

คำตอบ:


43

ความน่าจะเป็นที่ผลิตภัณฑ์จะล้มเหลวนั้นเป็นหน้าที่ของเวลาและการใช้งาน เราไม่มีข้อมูลเกี่ยวกับการใช้งานและมีเพียงหนึ่งปีเท่านั้นที่ไม่มีข้อผิดพลาด (ขอแสดงความยินดี!) ดังนั้นลักษณะนี้ (เรียกว่าฟังก์ชันการอยู่รอด ) ไม่สามารถประเมินได้จากข้อมูลของคุณ

คุณสามารถคิดของความล้มเหลวภายในหนึ่งปีดึงจากการกระจายทวินามอย่างไร คุณยังไม่มีความล้มเหลว แต่ตอนนี้เป็นปัญหาที่พบบ่อย วิธีแก้ปัญหาง่ายๆคือใช้กฎ 3ซึ่งมีความถูกต้องกับขนาดใหญ่(ซึ่งคุณมีอย่างแน่นอน) โดยเฉพาะคุณจะได้รับขอบเขตบนของด้านเดียว 95% ช่วงความเชื่อมั่น (เช่นขอบเขตที่ต่ำเป็น0 ) บนความน่าจะเป็นความจริงของความล้มเหลวภายในหนึ่งปี3 / N ในกรณีของคุณคุณเป็น 95% มั่นใจว่าเป็นอัตราที่น้อยกว่า0.00003 ยังไม่มีข้อความ03/ยังไม่มีข้อความ0.00003

คุณยังถามถึงวิธีการคำนวณความน่าจะเป็นที่ 10k หนึ่งตัวหรือมากกว่านั้นล้มเหลว วิธีที่ง่ายและรวดเร็ว (แม้ว่าสุดขีด) เพื่อขยายการวิเคราะห์ข้างต้นคือการใช้ขอบเขตบนเป็นความน่าจะเป็นพื้นฐานและใช้ binomial CDF ที่สอดคล้องกันเพื่อรับความน่าจะเป็นที่จะไม่มีความล้มเหลว การใช้รหัสเราสามารถทำได้: ซึ่งให้โอกาสในการเห็นความล้มเหลวอย่างน้อยหนึ่งรายการในผลิตภัณฑ์ 10k ถัดไป โดยมีการใช้ที่ถูกผูกไว้ด้านบนนี้ไม่ได้ประมาณการจุดที่ดีที่สุดของความน่าจะเป็นของการมีอย่างน้อยหนึ่งความล้มเหลวมากกว่าที่คุณสามารถพูดได้ว่ามันไม่น่าเป็นไปได้มากว่าน่าจะเป็นของ1ความล้มเหลวเป็นมากกว่า26 %0R1-pbinom(0, size=10000, prob=0.00003)0.2591851126%(รับรู้ว่านี่เป็นกรอบที่ค่อนข้าง 'มือหยัก') เป็นไปได้ก็คือการใช้@ ข้อเสนอแนะของอะมีบาของประมาณการจากกฎเลซของความสำเร็จ กฎของการสืบทอดนั้นระบุว่าความน่าจะเป็นของความล้มเหลวโดยประมาณคือโดยที่Fคือจำนวนความล้มเหลว ในกรณีที่ P = 9.9998 × 10 - 06และการคำนวณสำหรับความน่าจะเป็นที่คาดการณ์ของ1 +ความล้มเหลวใน 10,000 ต่อไปคือการยอมหรือ(F+1)/(ยังไม่มีข้อความ+2)Fพี^=9.9998×10-061+1-pbinom(0, size=10000, prob=9.9998e-06)0.09516122 % 10%


3
+1 ฉันไม่เคยได้ยินเกี่ยวกับ "กฎ 3" มาก่อน ฉันสงสัยว่ามีการเชื่อมต่อระหว่างกฎ 3 และ "กฎการสืบทอดของ Laplace" หรือไม่? ตามหลัง (ถ้าฉันใช้มันอย่างถูกต้อง) น่าจะเป็นของความล้มเหลวสามารถประมาณเป็น ) 1/(ยังไม่มีข้อความ+2)
อะมีบาพูดว่า Reinstate Monica

14
@amoeba กฎ 3 ข้อนี้มีค่าความเชื่อมั่นด้านเดียว 95% สมมติว่าการนับความล้มเหลวมีการแจกแจงแบบทวินามแล้วโอกาสของการได้เห็นความล้มเหลวไม่เป็น( 1 - P ) n เพื่อให้ที่ยิ่งใหญ่กว่า5 %แก้( 1 - P ) n0.05สำหรับพี การใช้บันทึก( 1 - p ) - pสำหรับpเล็กการแก้ปัญหาคือp - บันทึก(n,พี)(1-พี)n5%(1-พี)n0.05พีเข้าสู่ระบบ(1-พี)-พีพี n ตั้งแต่ 0.05 = 1 / 20 อี3เราได้รับ P 3 / n นั่นคือ "กฎของ 3" มันคุ้มค่าที่รู้เพราะตอนนี้คุณรู้วิธีที่จะแตกต่างกันไป "3" ถ้าคุณต้องการที่จะปรับระดับความเชื่อมั่นและคุณยังสามารถกลับเพื่อหาต่ำสุดที่ nที่จำเป็นในการตรวจสอบอัตรา Pหรือมากกว่า พี-เข้าสู่ระบบ(0.05)/n0.05=1/20อี3พี3/nnพี
whuber

1
@ amoeba ตามที่ฉันพูดไปแล้วฉันได้ใส่เครื่องแบบก่อนหน้าความน่าจะเป็นของความล้มเหลว ฉันเชื่อว่าสิ่งต่าง ๆ ก่อนหน้านี้จะนำไปสู่ผลลัพธ์ที่แตกต่างอย่างมาก
Yair Daon

1
การแก้ไขของคุณเป็นความคืบหน้าที่ดี (+1) อย่างไรก็ตามมันทำให้เกิดปัญหาในการตีความ เราไม่ "มั่นใจ" โอกาสไม่เกินเพราะเรายังไม่แน่ใจในโอกาสที่แท้จริง เราไม่มี "ขอบเขตบน" บนpแต่มีเพียงขีด จำกัด ความมั่นใจสูงสุด เมื่อคุณคาดการณ์เหตุการณ์ในอนาคตคุณจะต้อง (a) ประมาณและ (b) กำหนดขอบเขตให้ ดูมันเช่นนี้: ให้ขอบเขตกับYเมื่อX Binomial ( n , p ) , Y Binomial ( m , p )อย่างอิสระ, มีเงื่อนไข26%pYXBinomial(n,p)YBinomial(m,p) 0 ขอบเขตเหล่านั้นเป็นช่วงเวลาที่การคาดการณ์สำหรับ Yบนพื้นฐานของX X=0YX
whuber

2
Yay สำหรับ "กฎสามข้อ" ฉันกำปั้นเห็นมันหลายปีที่ผ่านมาในบันทึกสั้นที่ "วารสารของสมาคมการแพทย์อเมริกัน" jama.jamanetwork.com/article.aspx?articleid=385438
dwin

25

คุณสามารถใช้วิธีการแบบเบส์ แสดงถึงความน่าจะเป็นของความล้มเหลวโดยและคิดว่ามันเป็นตัวแปรสุ่ม เบื้องต้นก่อนที่คุณจะเห็นผลของการทดลองที่คุณอาจเชื่อว่าΘ ~ U ( 0 , 1 ) ถ้าคุณเชื่อถือวิศวกรที่จะทำให้ผลิตภัณฑ์นี้มีความน่าเชื่อถืออาจจะคุณสามารถใช้Θ ~ U ( 0 , 0.1 )หรือดังนั้น ขึ้นอยู่กับคุณ จากนั้นคุณสามารถใช้ทฤษฎีบทของเบย์ในการคำนวณการกระจายหลังของθ แสดงว่ากรณีที่คุณสังเกต ( nทดลองกับศูนย์ความล้มเหลว)ΘΘ~ยู(0,1)Θ~ยู(0,0.1)θAn

ทุกอย่างง่าย:Θมีความสม่ำเสมอดังนั้นp(θ)จึงมีค่าคงที่ ตั้งแต่คุณเรียกnทดลองP(|θ)เป็นเพียงน่าจะเป็นของที่ไม่มีความล้มเหลวในnทดลอง bernouli กับความน่าจะเป็นของความล้มเหลวθ

พี(Θ=θ|A)=พี(A|Θ=θ)พี(Θ=θ)พี(A)=พี(A|θ)พี(θ)พี(A|θ)พี(θ)dθ.
Θพี(θ)nพี(A|θ)nθ

เมื่อคุณมีคุณเป็นทองคำ: คุณสามารถคำนวณความน่าจะเป็นของเหตุการณ์Bใด ๆโดยการรวม: P ( B ) = p ( B | θ ) p ( θ | A ) d θพี(θ|A)BP(B)=พี(B|θ)พี(θ|A)dθ

ด้านล่างฉันทำงานผ่านโซลูชันอย่างละเอียดโดยทำตามวิธีข้างต้น ฉันจะใช้ทางลัดมาตรฐานเล็กน้อย

ให้ก่อนที่จะ ) จากนั้น: P ( θ | ) α พี( | θ ) 1 = ( 1 - θ ) n ค่าคงที่การทำให้เป็นมาตรฐานp ( A ) = p ( A | θ ) p ( θ ) d θพบว่าเป็นB ( 1 , nยู(0,1)

พี(θ|A)αพี(A|θ)1=(1-θ)n.
พี(A)=พี(A|θ)พี(θ)dθ - วิกิพีเดียดูหน้าฟังก์ชั่นเบต้าและการกระจายเบต้า ดังนั้น p ( θ | A ) = ( 1 - θ ) nB(1,n+1)ซึ่งเป็นเบต้ากระจายกับพารามิเตอร์1,n+1พี(θ|A)=(1-θ)nB(1,n+1)1,n+1

แสดงว่าน่าจะเป็นของความล้มเหลวในไม่มีผลิตภัณฑ์ในปีถัดไปโดยB น่าจะเป็นของอย่างน้อยหนึ่งความล้มเหลวคือ1 - P ( B ) จากนั้น 1 - P ( B ) = 1 - ( 1 - θ ) m ( 1 - θ ) nม.B1-P(B)

1-P(B)=1-(1-θ)ม.(1-θ)nB(1,n+1)dθ=B(1,n+ม.+1)B(1,n+1)

ซึ่งเป็นประมาณโดยใช้n = 100 , 000 , M = 10 , 000 ไม่น่าประทับใจมาก? ฉันใช้การแจกแจงแบบสม่ำเสมอบนความน่าจะเป็นของความล้มเหลว บางทีคุณอาจมีความเชื่อมั่นในวิศวกรของคุณก่อนดีกว่า0.1n=100,000,ม.=10,000


3
มันดูแปลกที่จะขาดวิธีแก้ปัญหาจริงสำหรับปัญหาง่ายๆโดยเฉพาะอย่างยิ่งเมื่อวิธีนั้นดูดี คุณแนะนำการคำนวณนั้นยากหรือไม่?
whuber

2
@ เมื่อฉันไม่ลืมฉันคิดว่าขั้นตอนสุดท้ายนี้ชัดเจน สิ่งที่ฉันหมายถึงโดย "ไม่บีบอัด" คือความน่าจะเป็นที่ 10% ของความล้มเหลวยังคงมีขนาดใหญ่เมื่อเทียบกับความล้มเหลวในการวิ่ง 100,000 ครั้งแรก นอกจากนี้ขอขอบคุณสำหรับความคิดเห็นเกี่ยวกับคู่คอนจูเกตฉันคิดว่ามันอาจสับสน OP และเบี่ยงเบนความสนใจของพวกเขาจากสิ่งที่สำคัญจึงละเว้นมัน
Yair Daon

3
เห็นได้ชัดว่าใช่ - แต่เมื่อคุณจบด้วยค่า 0.9 นั่นคือจำนวนคนที่จะเห็นเกือบจะไม่ว่าคุณจะพูดเกี่ยวกับเรื่องนี้ในข้อความก่อนหน้า เพื่อที่คุณจะได้ไม่เข้าใจผิดมันจะเป็นประโยชน์เสมอที่จะให้ความกระจ่างเกี่ยวกับคำตอบที่คุณเสนอ (+1 สำหรับคำตอบที่ปรับปรุงแล้ว BTW)
whuber

3
อันที่จริงโดยไม่คำนึงถึงความเชื่อของคุณในวิศวกรของคุณมันไม่ได้จริงๆน่าแปลกใจมากว่าถ้าคุณสังเกตการทดลองที่ไม่มีความล้มเหลวของคุณควรเฉลี่ยคาดหวังเกี่ยวกับkความล้มเหลวภายในต่อไปk nการทดลองจึงควรคาดหวังว่าอย่างน้อยหนึ่ง ความล้มเหลวที่มีความน่าจะเป็น1 - อี- kซึ่งมีประมาณkขนาดเล็กk ดังนั้นการทดลองที่ประสบความสำเร็จ 100,000 ครั้งทำให้มีความน่าจะเป็นประมาณ 10% ของความล้มเหลวอย่างน้อยหนึ่งครั้งในการทดสอบ 10,000 ครั้งถัดไป n1kkn1ekkk
Ilmari Karonen

2
@whuber คุณสันนิษฐานว่าก่อนหน้านี้ไม่สำคัญไม่เป็นความจริงในกรณีที่ไม่มีความล้มเหลว มันขึ้นอยู่กับความลาดเอียงที่ใกล้ศูนย์เป็นอย่างมากเช่นเครื่องแบบแบนก่อน (เบต้า 1,1) และเจฟฟรีย์ก่อน (เบต้า 0.5, 0.5) จะให้หลังที่แตกต่างกันอย่างมาก
Erik

12

แทนที่จะคำนวณความน่าจะเป็นทำไมไม่คาดการณ์ว่าจะมีผลิตภัณฑ์กี่รายการที่ล้มเหลว

การสร้างแบบจำลองการสังเกต

มีผลิตภัณฑ์ในฟิลด์และอีกm = 10,000ภายใต้การพิจารณา สมมติความล้มเหลวของพวกเขาทุกคนเป็นอิสระและอย่างต่อเนื่องกับความน่าจะเป็นพีn=100000m=10000p

เราอาจจะจำลองสถานการณ์นี้โดยวิธีการของการทดลองทวินาม: ออกจากกล่องของตั๋วที่มีสัดส่วนที่ไม่รู้จักของตั๋ว "ความล้มเหลว" และ1 - พี "ความสำเร็จ" ตั๋ววาดม. + n = 110000ตั๋ว (ด้วยการเปลี่ยนเพื่อให้ โอกาสของความล้มเหลวยังคงเหมือนเดิม) นับความล้มเหลวในหมู่แรกnตั๋ว - ปล่อยให้ที่จะX --and นับความล้มเหลวในหมู่ที่เหลือเมตรตั๋วเรียกว่าYp1pm+n=110000nXmY

การวางกรอบคำถาม

โดยหลักการแล้วและ0 Y mอาจเป็นอะไรก็ได้ สิ่งที่เรามีความสนใจในโอกาสที่Y = u ที่ได้รับว่าX + Y = U (กับยูจำนวนใด ๆ ใน{ 0 , 1 , ... , ม. } ) เนื่องจากความล้มเหลวอาจเกิดขึ้นได้ทุกที่ในตั๋วn + mทุกรูปแบบที่เป็นไปได้ที่มีโอกาสเท่ากันจึงพบได้โดยการหารจำนวนของu0Xn0YmY=u X+Y=uu{0,1,,m}n+mu-subsets ของ things ตามจำนวนของu -subsets ของn + mสิ่งของทั้งหมด:mun+m

p(u;n,m)=Pr(Y=u|X+Y=u)=(mu)(n+mu)=m(m1)(mu+1)(n+m)(n+m1)(n+mu+1).

สูตรเทียบเคียงสามารถนำมาใช้ในการคำนวณเมื่อX=1,2,.

บนขีด จำกัด ของการทำนาย1α (UPL) สำหรับจำนวนของความล้มเหลวในช่วงที่ผ่านมาตั๋วเสื้อα ( X ; n , ม. )มอบให้โดยที่เล็กที่สุดU (ขึ้นอยู่กับX ) ซึ่งP ( U ; n , เมตร) อัลฟ่าmtα(X;n,m)uXp(u;n,m)α

การตีความ

UPL ก็ควรจะตีความในแง่ของความเสี่ยงของการใช้ , ประเมินก่อนที่ทั้งXหรือYเป็นที่สังเกต กล่าวอีกนัยหนึ่งสมมติว่าเป็นหนึ่งปีที่ผ่านมาและคุณจะถูกขอให้แนะนำขั้นตอนการคาดการณ์จำนวนความล้มเหลวในผลิตภัณฑ์mถัดไปเมื่อสังเกตเห็นnแรก ลูกค้าของคุณถามtαXYmn

มีโอกาสที่ขั้นตอนของคุณจะต่ำกว่าคืออะไร? ฉันไม่ได้ตั้งใจในอนาคตหลังจากที่คุณมีข้อมูลมากขึ้น ฉันหมายถึงตอนนี้เพราะฉันต้องตัดสินใจตอนนี้และโอกาสเดียวที่ฉันจะมีให้ฉันคือคนที่สามารถคำนวณได้ในขณะนี้ "Y

คำตอบของคุณสามารถ

ตอนนี้มีโอกาสที่จะไม่มีมากกว่าแต่ถ้าคุณวางแผนที่จะใช้การคาดคะเนขนาดเล็กมีโอกาสที่จะเกินααα

ผล

สำหรับ , m = 10 4และX = 0เราอาจคำนวณได้n=105m=104X=0

p(0,n,m)=1; p(1,n,m)=1110.091; p(2,n,m)=9091099990.0083;

ดังนั้นเมื่อมีการตั้งข้อสังเกตX=0 ,

  • นานถึงเชื่อมั่น (นั่นคือเมื่อ9.1 % α ) คาดการณ์มีมากที่สุดเสื้อα ( 0 ; n , ม. ) = 1ความล้มเหลวในครั้งต่อไป10 , 000ผลิตภัณฑ์1α=90.9%9.1%αtα(0;n,m)=110,000

  • ได้ถึงเชื่อมั่น (นั่นคือเมื่อ0.8 % α < 9.1 % ) คาดการณ์มีมากที่สุดเสื้อα ( 0 ; n , ม. ) = 2ความล้มเหลวในครั้งต่อไป10 , 000ผลิตภัณฑ์99.2%0.8%α<9.1%tα(0;n,m)=210,000

  • เป็นต้น


ความคิดเห็น

วิธีการนี้จะใช้เมื่อใดและทำไม สมมติว่า บริษัท ของคุณสร้างผลิตภัณฑ์ที่แตกต่างกันมากมาย หลังจากสังเกตประสิทธิภาพของของแต่ละคนในสนามมันก็ชอบที่จะสร้างหลักประกันเช่น "เสร็จสมบูรณ์โดยไม่มีค่าใช้จ่ายแทนความล้มเหลวใด ๆ ภายในหนึ่งปี" ด้วยการ จำกัด การคาดการณ์สำหรับจำนวนความล้มเหลวคุณสามารถควบคุมค่าใช้จ่ายทั้งหมดในการรับประกันการรับประกันเหล่านั้นได้ เนื่องจากคุณสร้างผลิตภัณฑ์จำนวนมากและคาดว่าจะเกิดความล้มเหลวเนื่องจากสถานการณ์สุ่มที่อยู่นอกเหนือการควบคุมของคุณประสบการณ์ของแต่ละผลิตภัณฑ์จะเป็นอิสระ มันสมเหตุสมผลที่จะควบคุมความเสี่ยงของคุณในระยะยาวn. บางครั้งคุณอาจต้องจ่ายค่าสินไหมทดแทนมากกว่าที่คาดไว้ แต่ส่วนใหญ่คุณจะจ่ายน้อยลง หากการจ่ายเงินมากกว่าที่ประกาศอาจเป็นการทำลายคุณจะตั้งค่าให้เล็กมาก (และคุณน่าจะใช้โมเดลความล้มเหลวที่ซับซ้อนยิ่งขึ้นเช่นกัน!) มิฉะนั้นหากค่าใช้จ่ายน้อยคุณสามารถใช้ชีวิตด้วยความมั่นใจต่ำ (สูงα ) การคำนวณเหล่านี้แสดงให้เห็นถึงวิธีการสร้างสมดุลระหว่างความมั่นใจและความเสี่ยงαα

โปรดทราบว่าเราไม่ได้มีการคำนวณขั้นตอนเต็มเสื้อเรารอจนกว่าจะสังเกตXแล้วจึงทำการคำนวณสำหรับX นั้น (ที่นี่X = 0 ) ดังที่แสดงไว้ด้านบน โดยหลักการแล้วเราสามารถทำการคำนวณค่าXที่เป็นไปได้ทั้งหมดตั้งแต่เริ่มแรกtXXX=0X

วิธีการแบบเบย์ (อธิบายในคำตอบอื่น ๆ ) เป็นสิ่งที่น่าดึงดูดและจะทำงานได้ดีหากผลลัพธ์ไม่ได้ขึ้นอยู่กับก่อนหน้านี้อย่างมาก น่าเสียดายที่เมื่ออัตราความล้มเหลวต่ำมากจนมีการสังเกตน้อย (หรือไม่มีความล้มเหลว) ผลลัพธ์จะอ่อนไหวต่อตัวเลือกก่อนหน้า


+1 แต่ดูเหมือนจะไม่ถูกต้อง p(0,n,m)=1
อะมีบาพูดว่า Reinstate Monica

1
@COOLSerdash เนื่องจากและข้อกำหนดสำหรับu = 1 , 2 ...ไม่เท่ากับศูนย์ up(u,n,m)=1u=1,2...
อะมีบากล่าวว่า Reinstate Monica

1
เหตุผลที่คุณได้รับในขณะที่ @amoeba โน้ตเป็นเพราะp ( u ; n , m ) = ( mup(u;n,m)>1ไม่ใช่Pr(Y=u|X=0p(u;n,m)=(mu)(n+mu)แต่เป็น P r ( Y = u | X + Y = u ) = P r ( X = 0 | X + Y = u ) (และควร ดังนั้นจะถูกแทนด้วยเช่น p ( 0 ; n , m , u )Pr(Y=u|X=0)Pr(Y=u|X+Y=u) = Pr(X=0|X+Y=u)p(0;n,m,u)หรืออะไรทำนองนั้น) ฉันมีปัญหาในการติดตามสิ่งที่คุณทำกับสิ่งนั้นในภายหลัง แต่ฉันค่อนข้างแน่ใจว่าไม่ว่ามันจะเป็นอะไร แต่น่าเสียดายที่มันไม่ใช่ทางออกที่ถูกต้องสำหรับปัญหาดังที่ถาม
Ilmari Karonen

1
@IlmariKaronen ขอบคุณสำหรับความคิดเห็นของคุณ คุณพูดถูกฉันควรจะมีลักษณะชัดเจนขึ้นเล็กน้อยเพราะมันไม่ใช่การแจกแจงความน่าจะเป็นเหนือu -มันเป็นความน่าจะเป็นแบบมีเงื่อนไข - แต่ฉันเชื่อว่าคำตอบนั้นถูกต้องแล้ว ฉันมั่นใจอย่างยิ่งว่าวิธีการคำนวณขีด จำกัด การทำนายนี้มีทั้งถูกต้องและธรรมดา ฉันจะแก้ไขโพสต์นี้เพื่อชี้แจงประเด็นเหล่านี้ p(u;n,m)u
whuber

1
@Ilmari ฉันทำการแก้ไขแล้ว - คุณสามารถดูได้ในประวัติการแก้ไข ฉันถือว่าไม่มีนักบวชและใช้คำจำกัดความของช่วงการทำนายกับปัญหานี้เท่านั้น หากคุณต้องการท้าทายว่า "มีความหมายทางสถิติ" หรือไม่คุณจะพบว่าตัวเองท้าทายโครงสร้างมาตรฐานนี้อย่างถี่ถ้วน ตัวอย่างเช่น Hahn & Meeker ช่วงเวลาทางสถิติ (J. Wiley 1991)
whuber

9

ต่อไปนี้เป็นคำตอบแบบเบย์ต่อ "ผลิตภัณฑ์ใหม่ 10,000 รายการมีกี่รายการที่คาดว่าจะล้มเหลวหากผลิตในอดีต 100,000 รายการไม่ได้ล้มเหลว" แต่คุณควรพิจารณาความไวต่อนักบวชที่แตกต่างกัน

สมมติว่ามีความเป็นอิสระและมีการแจกแจงแบบมีเงื่อนไขซึ่งได้รับΘ = θเช่นนั้นX1,...,XnΘ=θและใช้ผันก่อน Θ ~ บีอีที ( , )มี , B > 0X1|Θ=θ~BอีRnโอยูล.ล.ผม(θ)Θ~Bอีเสื้อa(a,)a,b>0

สำหรับเรามี E [ n i = m + 1 X im<n

E[i=m+1nXi|X1=0,Xm=0]=i=m+1nE[XiX1=0,Xm=0].

สำหรับเรามี E [ X iX 1 = 0 , X m = 0 ]m+1in

E[XiX1=0,Xm=0]=Pr(Xi=1X1=0,Xm=0)=01Pr(Xi=1Θ=θ)fΘX1,,Xm(θ0,,0)dθ=Γ(m+a+b)Γ(m+a+b+1)Γ(a+1)Γ(a)=am+a+b,
ในการที่เราใช้ )ΘX1=0,,Xm=0Beta(a,m+b)

เสียบหมายเลขของคุณด้วยเครื่องแบบก่อนหน้า ( ) คุณคาดว่าอัตราความล้มเหลวรอบ 10 %ในขณะที่ฟรีย์เหมือนก่อน ( = 1 / 2 , B = 1 / 2 ) ช่วยให้คุณมีความล้มเหลว อัตราใกล้เคียงกับ 5 %a=1,b=110%a=1/2,b=1/25%

การคาดการณ์แบบคาดการณ์นี้ดูเหมือนจะไม่เป็นบทสรุปที่ดีเนื่องจากการกระจายการทำนายนั้นเบ้อย่างมาก เราสามารถไปต่อและคำนวณการกระจายการทำนาย ตั้งแต่ ปรับสภาพตามที่เราทำก่อนที่เราจะมี Pr ( n i = m + 1 X i = t

i=m+1nXi|Θ=θBin(nm+2,θ),
สำหรับT=0,1,...,n-ม.+2
Pr(i=m+1nXi=t|X1=0,Xm=0)=(nm+2t)Γ(m+a+b)Γ(a)Γ(m+b)Γ(t+a)Γ(nt+2)Γ(n+a+2),
t=0,1,,nm+2

ฉันจะจบการคำนวณช่วงเวลาภายหลัง95%


3
+1 สำหรับแสดงให้เห็นว่าผลลัพธ์มีความอ่อนไหวต่อรูปร่างของค่าใกล้ 0 ก่อนหน้านี้ (มันน่าสังเกตว่าเนื่องจากฟังก์ชันความน่าจะเป็นเข้มข้นอย่างมากใกล้ศูนย์เมื่อmมีขนาดใหญ่นั่นเป็นเพียงส่วนหนึ่งของรุ่นก่อนที่สำคัญสำหรับ ตัวอย่างเช่นสำหรับก่อนหน้านี้ความคาดหวังaBeta(a,b)จะอยู่ที่ประมาณสัดส่วนกับแต่เกือบเป็นอิสระจากข ในทำนองเดียวกันสำหรับเครื่องแบบก่อนมันไม่ได้โดดเรื่องมากไม่ว่าจะเป็นก่อนเป็นU(0,1)หรือU(0,0.01)แต่สิ่งที่จะเปลี่ยนแปลงอย่างรวดเร็วถ้าเราสันนิษฐานว่าก่อนเช่นU(0.01,1))am+a+bamabU(0,1)U(0,0.01)U(0.01,1)
Ilmari Karonen

6

ด้วยวิธีการแก้ปัญหาพระอาทิตย์ขึ้นของ Laplace เราได้รับความน่าจะเป็นที่ผลิตภัณฑ์จะล้มเหลวภายในหนึ่งปี 1 ถัดไปความน่าจะเป็นที่nผลิตภัณฑ์ใหม่ที่ไม่มีล้มเหลวภายในหนึ่งปีคือ(1-p)n ดังนั้นความน่าจะเป็นที่ผลิตภัณฑ์อย่างน้อยหนึ่งรายการของnจะล้มเหลวในปีหน้าคือ1-(1- 1

p=1100000+1
n
(1p)n
nสำหรับn=10,000ค่าคือP
1(11100001)n
n=100000.095 ในกรณีของ whuber P 2000000.87ค่อนข้างสูงในความเป็นจริงP100000.095P2000000.87

แน่นอนคุณควรอัปเดตข้อมูลของคุณในขณะที่มีการขายผลิตภัณฑ์เพิ่มมากขึ้นและในที่สุดจะเกิดข้อผิดพลาด


คำตอบนี้ดูเหมือนจะไม่ถูกต้อง: การคำนวณพระอาทิตย์ขึ้นหนึ่งครั้งในอนาคตจะไม่ขยายเพิ่มขึ้นเพียงแค่การคูณ หลังจากที่ทุกคนคิดว่าจำนวนถูกแทนที่ด้วย200 , 000 คุณจะยืนยันความน่าจะเป็นของความล้มเหลวคือ200000 / 100001 2 ?? คุณควรเปรียบเทียบคำตอบของคุณกับการวิเคราะห์ในคำตอบของ Yair Daon และความคิดเห็นที่เกี่ยวข้อง 10,000200,000200000/1000012
whuber

@whuber แก้ไขมัน
Aksakal

1
0.865

@whuber ใช่มันเป็นหนึ่งในศูนย์น้อย
อักซากัล

5

มีคำตอบที่ดีหลายข้อสำหรับคำถามนี้ แต่เมื่อไม่นานมานี้ฉันมีโอกาสตรวจทานแหล่งข้อมูลเพียงเล็กน้อยในหัวข้อนี้และดังนั้นฉันจึงตัดสินใจที่จะแบ่งปันผลลัพธ์

k=0n

(1)P(K=k)=kn=0

การประมาณการดังกล่าวค่อนข้างน่าพอใจเนื่องจากข้อเท็จจริงที่ว่าเราสังเกตว่าไม่มีความล้มเหลวในตัวอย่างของเราแทบจะพิสูจน์ได้ว่าเป็นไปไม่ได้โดยทั่วไป ออกของข้อมูลความรู้ที่แสดงให้เห็นว่ามีบางอย่างที่น่าจะเป็นของความล้มเหลวแม้ว่าไม่ใช่ถูกตั้งข้อสังเกต (ยัง) การมีความรู้เบื้องต้นทำให้เราใช้วิธีการแบบเบย์ซึ่งตรวจสอบโดย Bailey (1997), Razzaghi (2002), Basu et al (1996), และ Ludbrook และ Lew (2009)

ท่ามกลางเครื่องมือประมาณค่าแบบ "ขอบเขตบน" ซึ่งถือว่า (Bailey, 1997)

ว่ามันจะไม่เป็นตรรกะสำหรับตัวประมาณค่า P ในกรณีที่เกิดความล้มเหลวเป็นศูนย์เพื่อให้เกิดความน่าจะเป็นมากกว่าที่คาดการณ์ไว้โดยตัวประมาณความน่าจะเป็นสูงสุดในกรณีความล้มเหลวเดียวซึ่งเป็นขอบเขตที่สมเหตุสมผล

นิยามว่าเป็น

(2)1n

สามารถกล่าวถึง ขณะที่การตรวจสอบโดย Ludbrook ลิว (2009), ความเป็นไปได้อื่น ๆ ที่มี "กฎของสาม" (cf นี่ , วิกิพีเดียหรือ Eypasch, et al, 1995)

(3)3n

หรือรูปแบบอื่น ๆ :

(4)3n+1

"กฎของ 3.7" โดย Newcombe และ Altman (หรือ 3.6)

(5)3.7n

"กฎใหม่ของสี่":

(6)4n+4

แต่สรุปโดย Ludbrook และ Lew (2009) "rule of threes" คือ "ถัดจากไร้ประโยชน์" และ "rule of 3.6" (และ 3.7) "มีข้อ จำกัด ที่ร้ายแรง - มีข้อผิดพลาดร้ายแรง - หากขนาดตัวอย่างเริ่มต้นน้อยกว่า 50" และพวกเขาไม่แนะนำวิธีการ (3) - (6) แนะนำให้ใช้ตัวประมาณแบบเบย์ (ดูด้านล่าง)

ในบรรดาตัวประมาณค่าแบบเบย์สามารถพูดได้หลายอย่าง ตัวประมาณค่าแรกที่แนะนำโดย Bailey (1997) คือ

(7)1-0.51n

สำหรับการประเมินค่ามัธยฐานภายใต้เครื่องแบบก่อน

(8)1-0.51n+1

หรือสำหรับการประเมินค่าเฉลี่ยภายใต้ก่อนหน้านี้

(9)1n+2

อีกวิธีหนึ่งที่สมมติว่ารูปแบบความล้มเหลวแบบเอ็กซ์โปเนนเชียลมีอัตราความล้มเหลวคงที่ (การแจกแจงแบบปัวซง)

(10)1/3n

a

(11)aa++n

a==1a==0.5

(12)12(n+1)

n


Bailey, RT (1997) การประมาณจากข้อมูลความล้มเหลวเป็นศูนย์การวิเคราะห์ความเสี่ยง, 17 , 375-380

Razzaghi, M. (2002) ในการประมาณค่าความน่าจะเป็นของความสำเร็จทวินามกับการเกิดขึ้นเป็นศูนย์ในตัวอย่าง วารสารวิธีการทางสถิติประยุกต์ที่ทันสมัย, 1 (2), 41

Ludbrook, J. , & Lew, MJ (2009) การประมาณความเสี่ยงของภาวะแทรกซ้อนที่หายาก: เป็น 'กฎของสาม' ดีพอหรือไม่ANZ วารสารการผ่าตัด 79 (7‐8), 565-570

Eypasch, E. , Lefering, R. , Kum, CK, และ Troidl, H. (1995) ความน่าจะเป็นของเหตุการณ์ไม่พึงประสงค์ที่ยังไม่เกิดขึ้น: การเตือนทางสถิติ BMJ 311 (7005): 619–620

Basu, AP, Gaylor, DW, & Chen, JJ (1996) การประมาณความน่าจะเป็นของการเกิดเนื้องอกสำหรับมะเร็งที่หายากที่มีการเกิดขึ้นเป็นศูนย์ในตัวอย่าง พิษวิทยาและข้อบังคับทางเภสัชวิทยา, 23 (2), 139-144


1
รีวิวที่ยอดเยี่ยมของสิ่งที่อยู่ที่นั่น!
AlefSin

สำหรับความคิดเห็นที่เริ่มต้นด้วย "ในบรรดาตัวประมาณแบบเบย์หลายตัว ... " ไม่เป็นที่แน่ชัดว่าความคิดเห็นที่ระบุเกี่ยวข้องกับสูตรด้านบนหรือด้านล่าง คุณช่วยทำให้ชัดเจนกว่านี้ได้ไหม?
gung - Reinstate Monica

2

คุณต้องกลับไปที่นักออกแบบผลิตภัณฑ์ของคุณจริงๆ มันเป็นปัญหาพื้นฐานทางวิศวกรรมไม่ใช่เชิงสถิติ พวกเขาจะมีความคิดเกี่ยวกับความน่าจะเป็นที่จะเกิดความล้มเหลวของแต่ละองค์ประกอบและจากนั้นความน่าจะเป็นความล้มเหลวสุทธิของผลิตภัณฑ์ที่ประกอบทั้งหมด พวกเขาสามารถให้จำนวนที่คาดหวังของความล้มเหลวตลอดอายุการออกแบบทั้งหมดของผลิตภัณฑ์

วิศวกรโยธาออกแบบสะพานให้มีอายุการออกแบบ 120 ปี ส่วนประกอบของสะพานแต่ละแห่งมีโอกาสเกิดความล้มเหลวเล็กน้อย การโหลดแต่ละครั้งมีโอกาสเล็กน้อยที่จะเกิน ในการสร้างสะพานเศรษฐกิจเพื่อสร้างการล่มสลายทั้งหมดจะเกิดขึ้นเพียงครั้งเดียวในปี 2400 ซึ่งยาวกว่าสะพานที่จะรักษาไว้ ไม่น่าแปลกใจเลยที่สะพานจะไม่ล้มเหลวในปีที่ 1 หรือปีที่ 2 ถึงปีที่ 120 นั่นไม่ได้เป็นการยุบตัวที่บอกคุณน้อยมาก โอกาสในการล้มเหลวที่หลากหลายตามเวลาสามารถประเมินได้โดยนักออกแบบดั้งเดิมเท่านั้น


0

นี่คล้ายกับปัญหาที่ฉันเผชิญเมื่อเราแนะนำกระบวนการผลิตใหม่เพื่อขจัดความล้มเหลวในการผลิต

ระบบใหม่ไม่เกิดความล้มเหลวดังนั้นผู้คนจึงถามคำถามเดียวกันว่า: เราจะทำนายอัตราความล้มเหลวได้อย่างไร ในกรณีของคุณเนื่องจากคุณได้กำหนดช่วงเวลาที่ความล้มเหลวสามารถเกิดขึ้นได้โดยไม่ต้องกังวลว่าเมื่อใดที่ความล้มเหลวเกิดขึ้นภายในช่วงเวลานั้น และมันก็เป็นเพียงแค่กรณีของสิ่งที่ล้มเหลวหรือไม่ ด้วยที่ระบุไว้ - บนด้วยคำตอบของฉัน

โดยสังหรณ์ใจดูเหมือนว่าเราต้องการความล้มเหลวอย่างน้อยหนึ่งครั้งเพื่อให้สามารถคำนวณอัตราความล้มเหลวได้ อย่างไรก็ตามสมมติฐานนี้มีข้อผิดพลาดโดยนัยอยู่ภายใน เราจะไม่คำนวณอัตราความล้มเหลว นั่นเป็นเพราะเรากำลังเผชิญกับตัวอย่าง ดังนั้นเราสามารถประมาณช่วงของอัตราความล้มเหลวที่เป็นไปได้เท่านั้น วิธีการทำเช่นนี้คือการหาการกระจายสำหรับอัตราความล้มเหลว การแจกแจงที่ทำงานในอินสแตนซ์นี้คือการแจกแจงแบบเบต้าโดยที่พารามิเตอร์คือ: α = n + 1 และβ = N - n + 1

หมายเหตุ: Nคือขนาดตัวอย่างและnคือจำนวนความล้มเหลว (ในกรณีของคุณ 0)

สำหรับสถานการณ์ของคุณการแจกแจงอัตราความล้มเหลวแสดงอยู่ด้านล่าง ป้อนคำอธิบายรูปภาพที่นี่ .

จากนั้นคุณจะป้อนการแจกแจงนั้นลงในสูตรความน่าจะเป็นทวินามที่เกี่ยวข้องเพื่อรับการแจกแจงสำหรับความน่าจะเป็นของการล้มเหลวหนึ่งหน่วย (สามารถทำการวิเคราะห์หรือใช้ Monte Carlo) ฉันสงสัยว่าตัวเลขจะต่ำมาก

โปรดทราบว่ากระบวนการนี้สามารถใช้งานได้ไม่ว่าจะมีจำนวนความล้มเหลวในชุดกำปั้นของคุณ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.