การรวมความน่าจะเป็น / ข้อมูลจากแหล่งต่าง ๆ


26

ให้บอกว่าฉันมีสามแหล่งที่มาที่เป็นอิสระและแต่ละคนก็ทำนายสภาพอากาศในวันพรุ่งนี้ อันแรกบอกว่าความน่าจะเป็นของฝนในวันพรุ่งนี้คือ 0 จากนั้นอันที่สองบอกว่าความน่าจะเป็นที่ 1 และสุดท้ายอันสุดท้ายบอกว่าความน่าจะเป็นคือ 50% ฉันต้องการทราบความน่าจะเป็นทั้งหมดที่ได้รับจากข้อมูลนั้น

ถ้าใช้ทฤษฎีบทการคูณสำหรับเหตุการณ์อิสระฉันได้ 0 ซึ่งดูไม่ถูกต้อง เหตุใดจึงเป็นไปไม่ได้ที่จะคูณทั้งสามถ้าแหล่งทั้งหมดเป็นอิสระ? มีวิธีการแบบเบย์ในการอัปเดตก่อนหน้านี้เมื่อฉันรับข้อมูลใหม่หรือไม่

หมายเหตุ: นี่ไม่ใช่การบ้านเป็นสิ่งที่ฉันคิด


1
คุณรู้หรือไม่ว่าแหล่งข้อมูลที่เชื่อถือได้นั้นมีความน่าเชื่อถือเพียงใด
Dilip Sarwate

ไม่นิรนัยฉันคิดว่าแหล่งข้อมูลทั้งหมดมีความน่าเชื่อถือเท่า ๆ กัน
Biela Diela

3
นี่เป็นคำถามที่ดีที่ฉันคิดเช่นกัน ฉันจะเพิ่มคำถามที่สอง: หากการคาดคะเนทั้งหมดเท่ากับ 0.75 ความน่าจะเป็นรวมคืออะไร สูงกว่า 0.75? กรอบอย่างเป็นทางการสำหรับการวิเคราะห์คำถามประเภทนี้จะเป็นอย่างไร
Karsten W.

2
มีข้อมูลไม่เพียงพอจริงๆ เราต้องการโมเดลว่าการคาดการณ์นั้นเกี่ยวข้องกับความเป็นจริงอย่างไร
Glen_b

ฉันไม่แน่ใจว่า "แหล่งที่มาทั้งหมดมีความน่าเชื่อถือเท่า ๆ กัน" เมื่อแหล่งข้อมูลมีข้อความเกี่ยวกับความน่าจะเป็นหรือระดับความเชื่อมั่น / ความน่าเชื่อถือ หากเรากำลังพูดถึงความน่าจะเป็น - ที่ - ความน่าจะเป็น - มี - - - - ค่าที่ดูเหมือนจะทำให้เกิดปัญหาแนวความคิด BTW หากแหล่งที่มา 1 และ 2 มีความน่าเชื่อถือเท่ากันทั้งคู่จะต้องถูกต้องด้วยความน่าจะเป็น 0.50 ... (และความน่าจะเป็นของฝนคือ 1/2)
AG

คำตอบ:


32

คุณถามเกี่ยวกับสามสิ่ง: (a) วิธีรวมการพยากรณ์หลายอย่างเข้าด้วยกันเพื่อให้ได้การพยากรณ์เดี่ยว (b) ถ้าสามารถใช้วิธีการแบบเบย์ในที่นี่ได้อย่างไรและ (c) วิธีจัดการกับความน่าจะเป็นศูนย์

รวมการคาดการณ์เป็นหลักปฏิบัติทั่วไป หากคุณมีการพยากรณ์หลายครั้งกว่าที่คุณใช้ค่าเฉลี่ยของการคาดการณ์เหล่านั้นการคาดการณ์รวมที่เกิดขึ้นควรจะดีกว่าในแง่ของความแม่นยำกว่าการพยากรณ์แต่ละอย่าง โดยเฉลี่ยพวกเขาที่คุณสามารถใช้ถัวเฉลี่ยถ่วงน้ำหนักที่น้ำหนักจะขึ้นอยู่กับข้อผิดพลาดผกผัน (เช่นความแม่นยำ) หรือเนื้อหาข้อมูล หากคุณมีความรู้เกี่ยวกับความน่าเชื่อถือของแหล่งข้อมูลแต่ละแหล่งคุณสามารถกำหนดน้ำหนักที่เป็นสัดส่วนกับความน่าเชื่อถือของแหล่งที่มาแต่ละแหล่งดังนั้นแหล่งที่เชื่อถือได้มากขึ้นจะมีผลกระทบมากขึ้นต่อการคาดการณ์รวมสุดท้าย ในกรณีของคุณคุณไม่มีความรู้ใด ๆ เกี่ยวกับความน่าเชื่อถือของพวกเขาดังนั้นการพยากรณ์แต่ละครั้งจะมีน้ำหนักเท่ากันดังนั้นคุณจึงสามารถใช้ค่าเฉลี่ยเลขคณิตอย่างง่ายของการพยากรณ์ทั้งสาม

0%×.33+50%×.33+100%×.33=(0%+50%+100%)/3=50%

ตามที่แนะนำในความคิดเห็นโดย@AndyWและ@ArthurB นอกจากนี้ยังมีวิธีการอื่นนอกเหนือจากวิธีถ่วงน้ำหนักง่ายๆ มีวิธีการหลายอย่างที่อธิบายไว้ในวรรณกรรมเกี่ยวกับการคาดคะเนโดยผู้เชี่ยวชาญที่ฉันไม่คุ้นเคยมาก่อนดังนั้นขอบคุณพวก ในการคาดการณ์ของผู้เชี่ยวชาญโดยเฉลี่ยบางครั้งเราต้องการแก้ไขเพราะข้อเท็จจริงที่ว่าผู้เชี่ยวชาญมักจะถอยกลับไปที่ค่าเฉลี่ย (Baron et al, 2013) หรือทำให้การคาดการณ์ของพวกเขารุนแรงขึ้น (Ariely et al, 2000; Erev et al, 1994) เพื่อให้บรรลุถึงสิ่งนี้สามารถใช้การแปลงการพยากรณ์แต่ละเช่นฟังก์ชันlogitpi

(1)logit(pi)=log(pi1pi)

อัตราต่อรองกับ -th พลังงานa

(2)g(pi)=(pi1pi)a

โดยที่หรือการเปลี่ยนแปลงรูปแบบทั่วไปเพิ่มเติม0<a<1

(3)t(pi)=piapia+(1pi)a

โดยที่หากไม่มีการแปลงใด ๆ หากพยากรณ์แต่ละครั้งทำให้สุดขั้วมากขึ้นถ้าคาดการณ์ต่ำลงสุดขีดสิ่งที่แสดงในภาพด้านล่าง (ดู Karmarkar, 1978; Baron et al, 2013 )a=1a>10<a<1

ป้อนคำอธิบายรูปภาพที่นี่

หลังจากการพยากรณ์การเปลี่ยนแปลงดังกล่าวเป็นค่าเฉลี่ย (โดยใช้ค่าเฉลี่ยเลขคณิตค่ามัธยฐานค่าเฉลี่ยถ่วงน้ำหนักหรือวิธีอื่น) หากมีการใช้สมการ (1) หรือ (2) ผลลัพธ์จะต้องมีการแปลงกลับโดยใช้ log log สำหรับ (1) และอัตราต่อรองผกผันสำหรับ (2) หรือสามารถใช้ค่าเฉลี่ยทางเรขาคณิต (ดู Genest และ Zidek, 1986; cf. Dietrich and List, 2014)

(4)p^=i=1Npiwii=1Npiwi+i=1N(1pi)wi

หรือวิธีการที่เสนอโดยSatopää et al (2014)

(5)p^=[i=1N(pi1pi)wi]a1+[i=1N(pi1pi)wi]a

ที่มีน้ำหนัก ในกรณีส่วนใหญ่จะใช้น้ำหนักที่เท่ากันยกเว้นว่ามีข้อมูลเบื้องต้นที่แนะนำตัวเลือกอื่นอยู่ วิธีการดังกล่าวใช้ในการพยากรณ์ค่าเฉลี่ยของผู้เชี่ยวชาญเพื่อแก้ไขความไม่มั่นใจหรือต่ำเกินไป ในกรณีอื่น ๆ คุณควรพิจารณาว่าการเปลี่ยนการพยากรณ์เป็นมากกว่าหรือน้อยกว่านั้นเป็นธรรมเพราะมันสามารถทำให้การประเมินโดยรวมลดลงจากขอบเขตที่ทำเครื่องหมายโดยการพยากรณ์ต่ำสุดและสูงสุดwiwi=1/N

ถ้าคุณมีเบื้องต้นความรู้เกี่ยวกับความน่าจะเป็นฝนที่คุณสามารถใช้ Bayes ทฤษฎีบทที่จะปรับปรุงการคาดการณ์ที่กำหนดเบื้องต้นน่าจะเป็นของฝนตกลงมาในลักษณะคล้ายที่อธิบายไว้ในที่นี่ นอกจากนี้ยังมีวิธีการง่ายๆที่สามารถนำมาประยุกต์ใช้คือการคำนวณถัวเฉลี่ยถ่วงน้ำหนักของคุณคาดการณ์ (ตามที่กล่าวไว้ข้างต้น) ซึ่งก่อนน่าจะเป็นจะถือว่าเป็นจุดข้อมูลเพิ่มเติมที่มีน้ำหนัก prespecified บางในขณะนี้ตัวอย่างเช่นไอเอ็ม ( ดูแหล่งที่มาหรือที่นี่และที่นี่เพื่อสนทนา cf. Genest และ Schervish, 1985), เช่นpiπwπ

(6)p^=(i=1Npiwi)+πwπ(i=1Nwi)+wπ

จากคำถามของคุณ แต่ไม่ได้ติดตามว่าคุณมีความรู้เบื้องต้นเกี่ยวกับปัญหาของคุณดังนั้นคุณอาจใช้ชุดเครื่องแบบก่อนเช่นสมมติว่ามี โอกาสของปริมาณน้ำฝนและสิ่งนี้ไม่ได้เปลี่ยนแปลงมากนักในกรณีของตัวอย่างที่คุณให้ไว้ .50%

สำหรับการจัดการกับศูนย์มีหลายวิธีที่เป็นไปได้ ก่อนอื่นคุณควรสังเกตุว่าโอกาสของฝนนั้นไม่น่าเชื่อถือจริง ๆ เพราะมันบอกว่ามันเป็นไปไม่ได้ที่ฝนจะตก ปัญหาที่คล้ายกันมักเกิดขึ้นในการประมวลผลภาษาธรรมชาติเมื่ออยู่ในข้อมูลของคุณคุณจะไม่สังเกตเห็นค่าบางอย่างที่อาจเกิดขึ้นได้ (เช่นคุณนับความถี่ของตัวอักษรและข้อมูลของคุณตัวอักษรธรรมดาบางตัวไม่เกิดขึ้นเลย) ในกรณีนี้ตัวประมาณความน่าจะเป็นแบบดั้งเดิมคือ0%

pi=niini

ที่คือจำนวนของการเกิดขึ้นของ TH ค่า (จากหมวดหมู่) จะช่วยให้คุณถ้า0 นี้เรียกว่าปัญหาศูนย์ความถี่ สำหรับค่าดังกล่าวคุณรู้ว่าความน่าจะเป็นไม่ใช่ศูนย์ (มีอยู่จริง!) ดังนั้นการประเมินนี้จึงไม่ถูกต้อง นอกจากนี้ยังมีข้อกังวลในทางปฏิบัติ: การคูณและหารด้วยเลขศูนย์จะนำไปสู่ค่าศูนย์หรือผลลัพธ์ที่ไม่ได้กำหนดดังนั้นค่าศูนย์จึงเป็นปัญหาในการจัดการniidpi=0ni=0

การแก้ไขที่ง่ายและใช้กันทั่วไปคือการเพิ่มค่าคงที่ให้กับจำนวนของคุณดังนั้นβ

pi=ni+β(ini)+dβ

ตัวเลือกทั่วไปสำหรับคือคือการใช้เครื่องแบบก่อนหน้านี้โดยยึดตามกฎการสืบทอดอย่างต่อเนื่องของ Laplace ,สำหรับการประมาณการ Krichevsky-Trofimov หรือสำหรับตัวประเมิน Schurmann-Grassberger (1996) อย่างไรก็ตามโปรดสังเกตว่าสิ่งที่คุณทำที่นี่คือคุณใช้ข้อมูลที่ไม่อยู่ในข้อมูล (ก่อนหน้า) ในแบบจำลองของคุณ ด้วยการใช้วิธีการนี้คุณจะต้องจดจำข้อสันนิษฐานที่คุณทำและนำมาพิจารณาด้วย ความจริงที่ว่าเรามีความรู้เบื้องต้นที่แข็งแกร่งว่าไม่ควรมีความน่าจะเป็นศูนย์ใด ๆ ในข้อมูลของเราโดยตรงแสดงให้เห็นถึงวิธีการแบบเบย์ที่นี่โดยตรง ในกรณีของคุณคุณไม่มีความถี่ แต่น่าจะเป็นดังนั้นคุณจะเพิ่มบางอย่าง1 1 / 2 1 / dβ11/21/dค่าที่น้อยมากเพื่อแก้ไขให้เป็นศูนย์ โปรดสังเกตว่าในบางกรณีวิธีการนี้อาจมีผลกระทบที่ไม่ดี (เช่นเมื่อต้องจัดการกับบันทึก ) ดังนั้นจึงควรใช้ด้วยความระมัดระวัง


Schurmann, T. และ P. Grassberger (1996) การประมาณค่าเอนโทรปีของลำดับสัญลักษณ์ ความโกลาหล, 6, 41-427

Ariely, D. , Tung Au, W. , Bender, RH, Budescu, DV, Dietz, CB, Gu, H. , Wallsten, TS และ Zauberman, G. (2000) ผลกระทบของการประมาณค่าความน่าจะเป็นแบบอัตนัยระหว่างและภายในผู้ตัดสิน วารสารจิตวิทยาการทดลอง: ประยุกต์ 6 (2), 130

บารอน, เจ, Mellers, BA, Tetlock, PE, Stone, E. และ Ungar, LH (2014) เหตุผลสองประการที่ทำให้การคาดการณ์ความน่าจะเป็นรวมนั้นรุนแรงมากขึ้น การวิเคราะห์การตัดสินใจ, 11 (2), 133-145

Erev, I. , Wallsten, TS, และ Budescu, DV (1994) พร้อมกันเกินความมั่นใจ: บทบาทของข้อผิดพลาดในกระบวนการตัดสิน รีวิวจิตวิทยา, 101 (3), 519

Karmarkar สหรัฐอเมริกา (1978) ยูทิลิตี้ถ่วงน้ำหนักส่วนตัว: ส่วนขยายเชิงพรรณนาของตัวแบบอรรถประโยชน์ที่คาดหวัง พฤติกรรมองค์การและสมรรถนะของมนุษย์, 21 (1), 61-72

เทอร์เนอร์, BM, Steyvers, M. , Merkle, EC, Budescu, DV และ Wallsten, TS (2014) การรวมการพยากรณ์ผ่านการปรับเทียบใหม่ การเรียนรู้ของเครื่อง, 95 (3), 261-289

Genest, C. , และ Zidek, JV (1986) การรวมการแจกแจงความน่าจะเป็น: บทวิจารณ์และบรรณานุกรมที่มีคำอธิบายประกอบ วิทยาศาสตร์สถิติ, 1 , 114–135

Satopää, VA, Baron, J. , Foster, DP, Mellers, BA, Tetlock, PE และ Ungar, LH (2014) การรวมการทำนายความน่าจะเป็นหลาย ๆ แบบโดยใช้แบบจำลอง logit อย่างง่าย วารสารการพยากรณ์ระหว่างประเทศ, 30 (2), 344-356

Genest, C. และ Schervish, MJ (1985) การสร้างแบบจำลองการตัดสินของผู้เชี่ยวชาญสำหรับการปรับปรุงแบบเบย์ พงศาวดารสถิติ , 1198-1212

Dietrich, F. , และ List, C. (2014) การรวบรวมความคิดเห็นที่น่าจะเป็น (ไม่ได้เผยแพร่)


2
ฉันต้องการเพิ่มในสิ่งนี้แทนที่จะเริ่มคำตอบใหม่ อีกวิธีที่รู้จักกันดีคือการรวมความน่าจะเป็นทั้งสาม (หรือ N) เข้าด้วยกันโดยใช้ค่าเฉลี่ยเรขาคณิต (แทนที่จะเป็นค่าเฉลี่ยเลขคณิต) ฮินตันชี้ให้เห็นว่าสิ่งนี้ให้แบบอย่างที่มีความน่าจะเป็นสูงหรือต่ำมากพลัง 'ยับยั้ง' ในหมู่ผู้อื่นแทนที่จะเฉลี่ยทุกอย่างที่อาจทำให้คุณเสียหาย
Zhubarb

ดังนั้นหากการพยากรณ์ทั้งสามนั้นมีทั้งหมด 75% และไม่มีข้อมูลเกี่ยวกับความน่าเชื่อถือของพวกเขาการพยากรณ์ขั้นสุดท้ายจะเป็น 75%?
Karsten W.

@KarstenW ใช่ทำไมคุณถึงคาดหวังบางสิ่งที่แตกต่างกัน หากคุณไม่มีข้อมูลสำคัญกว่านี้เป็นข้อมูลเดียวที่คุณมีดังนั้นคุณไม่มีเหตุผลที่จะพิจารณาผลลัพธ์สุดท้ายที่จะแตกต่างกัน ...
ทิม

1
ยังไม่ได้อ่านเอกสารการศึกษาของ Tetlock แต่ฉันจะเริ่มต้นที่นั่น เช่นสองเหตุผลในการสร้างความน่าจะเป็นที่คาดการณ์รวมมากขึ้น ฉันจะค้นหาถ้อยคำที่แน่นอนของ Phil ฉันอาจจำคำผิดได้มาก
Andy W

1
ฉันสนิทกับสุดโต่งแต่ไม่มาก ฉันควรจะได้ใช้extremizedดูที่นี่ นอกจากบารอนและคณะ กระดาษกล่าวถึงผมเห็นวิลล์Satopääมีการทำงานบางอย่างในหัวข้อarxiv.org/abs/1506.06405
Andy W

6

การคิดถึงปัญหามีสองวิธี หนึ่งคือการบอกว่าแหล่งที่มาสังเกตตัวแปรแฝงรุ่นที่มีเสียงดัง "มันจะฝนตก / มันจะไม่ฝนตก"

ตัวอย่างเช่นเราสามารถพูดได้ว่าแหล่งที่มาแต่ละแห่งใช้การประมาณค่าจากการแจกแจงแบบหากฝนตกและการแจกแจงแบบหากไม่เป็นเช่นนั้นBeta(a+b,a)Beta(a,a+b)

ในกรณีนี้พารามิเตอร์หยดออกและสามคาดการณ์ ,และจะรวมกันเป็นaxyz

p=11+(1x1)b(1y1)b(1z1)b

bคือพารามิเตอร์ที่ควบคุมวิธีการภายใต้ ( ) หรือสูงกว่า ( ) มั่นใจในแหล่งที่มา หากเราสมมติว่าการประมาณการแหล่งที่มานั้นไม่เอนเอียงแล้วและการประมาณการจะลดความซับซ้อนลงเป็นb>1b<1b=1

p1p=x1xy1yz1z

ซึ่งเป็นเพียงการพูด: อัตราต่อรองของฝนเป็นผลผลิตของราคาที่ได้รับจากแต่ละแหล่ง หมายเหตุว่ามันไม่ได้กำหนดไว้ได้ดีถ้าแหล่งที่มาให้การประมาณการว่าและอื่น ๆ จะช่วยให้การประมาณการว่าแต่ภายใต้รูปแบบของเรานี้ไม่เคยเกิดขึ้นแหล่งที่มาไม่เคยที่มีความมั่นใจ แน่นอนว่าเราสามารถแก้ไขโมเดลเพื่อให้สิ่งนี้เกิดขึ้นได้10

แบบจำลองนี้ใช้งานได้ดีกว่าถ้าคุณคิดถึงคนสามคนที่บอกคุณว่าฝนตกเมื่อวานนี้หรือไม่ ในทางปฏิบัติเรารู้ว่ามีองค์ประกอบสุ่มที่ลดไม่ได้ในสภาพอากาศและดังนั้นจึงเป็นการดีกว่าที่จะสมมติว่าธรรมชาติเลือกความน่าจะเป็นของฝนเป็นครั้งแรกซึ่งเป็นแหล่งที่สังเกตได้อย่างน่าสังเกตและจากนั้นพลิกเหรียญอคติเพื่อตัดสินใจว่า ฝนกำลังจะตกหรือไม่

ในกรณีดังกล่าวการประมาณแบบรวมจะมีลักษณะเหมือนค่าเฉลี่ยระหว่างการประมาณที่ต่างกัน


x, y, z จะอยู่ในรูปแบบใด
Karsten W.

มันจะเป็นการทำนายที่ต่างกันสามแบบ
Arthur B.

ตัวอย่างที่คุณสงสัยเกี่ยวกับการจะเป็น{4} ในกรอบที่ผมแนะนำให้เป็นทางเลือกที่เหมาะสมคุณจะมี{28} เพราะนี่คือหมายถึง 3-1 อัตราต่อรองเพื่อให้สินค้าที่มีความหมาย 27-1 อัตราต่อรองหรือความน่าจะเป็น x=y=z=34p=2728342728
Arthur B.

การเปลี่ยนจาก 3/4 เป็น 27/28 นั้นรุนแรงมากเหมือนสามคนกำลังบอกคุณว่าท้องฟ้าเป็นสีน้ำเงินเข้มและคุณสรุปว่ามันเป็นสีดำ ...
ทิม

มันขึ้นอยู่กับรุ่น ที่นี่ฉันสมมติว่าแต่ละแหล่งมีมุมมองที่มีเสียงดังในตัวแปรไบนารีที่ซ่อนเร้นฝนหรือไม่มีฝน มันเหมือนมีคนสามคนบอกคุณว่าฝนตกเมื่อวานนี้ นอกจากนี้คุณยังสามารถสร้างแบบจำลองระบบเนื่องจากมีความน่าจะเป็นที่ซ่อนเร้นของฝนและแหล่งพยากรณ์อากาศว่าเป็นรุ่นที่มีเสียงดังของการพยากรณ์นั้น
Arthur B.

3

ในกรอบการทำงานของแบบจำลองความเชื่อที่ถ่ายโอนได้ (TBM)เป็นไปได้ที่จะรวมการทำนายที่แตกต่างกันโดยใช้ตัวอย่างเช่น ในการใช้กฎนี้คุณต้องเปลี่ยนความน่าจะเป็นของการทำนายเป็นการกำหนดความเชื่อพื้นฐาน สิ่งนี้สามารถเกิดขึ้นได้ด้วยหลักการที่เรียกว่าหลักการน้อยที่สุด ใน R:

library(ibelief)
#probabilities
p1 <- c(0.99, 0.01) # bad results for 0 and 1
p2 <- c(0.01, 0.99)
p3 <- c(0.5, 0.5)

# basic belief assignment, 
# each row represents a subset of (rain, not rain)
# each column represents one prediction
Mat <- LCPrincple(rbind(p1,p2,p3))

# combine beliefs
m <- DST(Mat, 1)

# resulting probability distribution (pignistic probability)
mtobetp(m)
# returns 0.5 and 0.5

สำหรับตัวอย่างที่สองของการคาดการณ์อิสระสามครั้งที่ 0.75 วิธีการนี้จะส่งคืนค่าที่สูงกว่า:

p4 <- c(0.75, 0.25)
Mat <- LCPrincple(rbind(p4,p4,p4))
m <- DST(Mat, 1)
mtobetp(m)
#returns 0.9375 0.0625

นี่ไม่ไกลจากแนวทางแบบเบย์ที่แสดงในคำตอบของ Arthur B


2

ฉันคิดว่ามันคุ้มค่าที่จะดูรูปแบบการถ่วงน้ำหนักตามข้อผิดพลาดผกผันที่กล่าวถึงในหนึ่งในคำตอบ หากแหล่งที่มาเป็นอิสระอย่างแท้จริงและเรา จำกัด น้ำหนักที่จะรวมเป็นหนึ่งน้ำหนักจะได้รับจาก

w1=σ22σ32σ12σ22+σ12σ32+σ22σ32, w2=σ12σ32σ12σ22+σ12σ32+σ22σ32, w3=σ12σ22σ12σ22+σ12σ32+σ22σ32.

หากเป็นสถานะ OP การคาดการณ์มีความน่าเชื่อถือเท่า ๆ กันน้ำหนักทั้งหมดจะลดความซับซ้อนลงที่และการคาดการณ์แบบรวมสำหรับตัวอย่างที่กำหนดจะเป็น 50%13

โปรดทราบว่าค่าของไม่จำเป็นต้องทราบหากทราบสัดส่วนที่สัมพันธ์กัน ดังนั้นถ้าดังนั้นการคาดการณ์ในตัวอย่างจะเป็นσ 2 1 : σ 2 2 : σ 2 3 = 1 : 2 : 4 , f = 8σiσ12:σ22:σ32=1:2:4,

f=814(0)+414(1)+214(0.5)=0.3571

1

ตัวเลขของพวกเขาสำหรับโอกาสในการเกิดฝนตกเป็นเพียงครึ่งหนึ่งของเรื่องราวเท่านั้นเนื่องจากเราจะต้องทำให้การคาดการณ์ของพวกเขาสงบลงด้วยความน่าจะเป็นที่พวกเขาจะแม่นยำเมื่อทำการเดา

เพราะฝนบางอย่างไม่เหมือนกัน (ฝนตกหรือไม่ในการตั้งค่านี้) พวกเขาไม่สามารถแก้ไขได้พร้อมกับความน่าจะเป็น 75% ตามที่ Karsten แนะนำ (ฉันคิดว่ายากที่จะบอกด้วยความสับสนที่ฉันได้ยินเกี่ยวกับความหมาย เพื่อค้นหา "ความน่าจะเป็นรวม")

เมื่อพิจารณาถึงความสามารถส่วนตัวของพวกเขาในการทำนายสภาพอากาศเราสามารถแทง (a la Thomas Bayes เช่นเดียวกับที่คนตาบอดยิงในที่มืด) ในโอกาสที่ฝนจะตกในวันพรุ่งนี้

สถานีที่ 1 นั้นถูกต้องในการคาดการณ์ของพวกเขา 60% ของเวลาที่สอง 30% ของเวลาและสถานีสุดท้ายที่น่าสงสาร 10% ของเวลา

E [rain] = Px X + Py Y + Pz * Z เป็นรูปแบบที่เรากำลังดูที่นี่:

(.6) (0) + (. 3) (1) + (. 1) (. 5) = E [rain] = โอกาส 35% ของฝนที่มีความแม่นยำในการทำนาย


1
อัลกอริทึมนี้สามารถสร้างค่าได้สูงกว่า 1
Andy W

1

มีคำตอบที่ซับซ้อนมากมายสำหรับคำถามนี้ แต่สิ่งที่เกี่ยวกับค่าความแปรปรวนแบบถ่วงน้ำหนักของค่าเฉลี่ย: https://en.wikipedia.org/wiki/Inverse-variance_weighting

แทนที่จะใช้การวัดซ้ำซ้ำด้วยเครื่องมือเดียวหากผู้ทดลองสร้างปริมาณที่เท่ากันกับเครื่องมือที่แตกต่างกัน n ที่มีคุณภาพการวัดที่แตกต่างกัน ...

ตัวแปรสุ่มแต่ละตัวจะถูกถ่วงน้ำหนักในสัดส่วนผกผันกับความแปรปรวน

ค่าเฉลี่ยถ่วงน้ำหนักความแปรปรวนแบบผกผันดูเหมือนจะตรงไปตรงมามากในการคำนวณและเนื่องจากโบนัสมีความแปรปรวนน้อยที่สุดในค่าเฉลี่ยถ่วงน้ำหนักทั้งหมด


-1

สำหรับการรวมความน่าเชื่อถือสูตร go-to ของฉันคือ r1xr2xr3 ÷ (r1xr2xr3 + (1-r1) x (1-r2) x (1-r3) ดังนั้นสำหรับ 3 แหล่งความน่าเชื่อถือ 75% ทั้งหมดที่พูดในสิ่งเดียวกันฉันจะมี .75 ^ 3 ÷ (.75 ​​^ 3 + .25 ^ 3) => 96% ความน่าเชื่อถือของการตอบสนองแบบรวม


1
ดูเหมือนจะไม่ใช่คำตอบที่ถูกต้องสำหรับคำถาม
Michael R. Chernick

เป็นที่ยอมรับว่าเป็นการตอบสนองต่อความคิดเห็น KarstenW มากกว่าการตอบคำถามโดยตรง
user3902302
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.