ถ้าคน 900 คนจาก 1,000 คนบอกว่ารถยนต์เป็นสีน้ำเงินความน่าจะเป็นที่จะเป็นสีน้ำเงินคือเท่าไหร่


114

สิ่งนี้เกิดขึ้นจากการเชื่อมโยงงานบางอย่างที่เรากำลังทำกับแบบจำลองเพื่อจำแนกข้อความธรรมชาติ แต่ฉันได้ทำให้มันง่ายขึ้น ... อาจจะมากเกินไป

คุณมีรถสีน้ำเงิน (โดยการวัดทางวิทยาศาสตร์บางอย่าง - เป็นสีน้ำเงิน)

คุณแสดงให้คน 1,000 คนเห็น

900 บอกว่าเป็นสีฟ้า 100 อย่า

คุณให้ข้อมูลนี้กับคนที่ไม่เห็นรถ สิ่งที่พวกเขารู้ก็คือคน 900 คนบอกว่าเป็นสีฟ้าและ 100 คนไม่ได้ คุณไม่รู้อะไรเกี่ยวกับคนเหล่านี้อีก (1,000 คน)

จากสิ่งนี้คุณถามคน ๆ นั้นว่า "ความน่าจะเป็นที่รถสีฟ้าจะเป็นเท่าไหร่"

สิ่งนี้ทำให้เกิดความคิดเห็นที่แตกต่างกันอย่างมากในหมู่ผู้ที่ฉันถาม! คำตอบที่ถูกต้องคืออะไรถ้ามี?


162
ฉันสงสัยว่าคำตอบจะเป็นอย่างไรถ้าคุณเปลี่ยนรถที่จะแต่งตัว
user1717828

13
ดังนั้นคำถามสำหรับคนคืออะไร? "รถเป็นสีฟ้าเหรอ?" หรือ "รถยนต์มีสีอะไร"
kon Psych

13
รถเป็นสีฟ้าหมายความว่าอะไร หากบางคนบอกว่ารถไม่ใช่สีฟ้าก็เป็นไปได้ว่ามันเป็นสีที่บางคนเรียกว่าสีน้ำเงินและคนอื่นเรียกชื่ออื่น นี่ไม่ได้หมายความว่าพวกเขาไม่เห็นด้วยกับสีมันหมายความว่าพวกเขาไม่เห็นด้วยกับชื่อของสี
เบ็น

7
ฉันคิดว่าคำถามจะได้รับการปรับปรุงให้ดีขึ้นมากถ้าคุณให้ความคิดเห็นที่แตกต่างกันที่คุณพบ คำตอบสามารถสำรวจทั้งสนามได้จากทฤษฎีความน่าจะเป็นไปจนถึงทฤษฎีสีหรือแม้แต่ชีววิทยา (ตาบอดสี) อย่างดุเดือดและฉันไม่เห็นว่ามันจะช่วยคุณได้อย่างไร
AnoE

32
มีบางอย่างขาดหายไปในคำอธิบายปัญหา 100 คนปฏิเสธว่ารถยนต์เป็นสีน้ำเงินเมื่อเป็นสีน้ำเงินแน่นอนว่ามีผู้คนจำนวนมากคุณไม่สามารถทิ้งพวกเขาเป็นข้อผิดพลาดแบบสุ่มได้
Aksakal

คำตอบ:


117

TL; DR: ถ้าคุณไม่คิดว่าคนจะมีสีที่ไม่เหมาะสมในการตัดสินสีรถยนต์หรือรถสีฟ้านั้นหายากอย่างไม่มีเหตุผลผู้คนจำนวนมากในตัวอย่างของคุณหมายถึงความน่าจะเป็นที่รถเป็นสีน้ำเงินนั้นโดยทั่วไปแล้ว 100%

Matthew Drury ได้ให้คำตอบที่ถูกต้องแล้ว แต่ฉันอยากจะเพิ่มเข้าไปในนั้นด้วยตัวอย่างตัวเลขเพราะคุณเลือกตัวเลขของคุณเพื่อให้คุณได้คำตอบที่คล้ายกันสำหรับการตั้งค่าพารามิเตอร์ที่แตกต่างกัน ตัวอย่างเช่นสมมติว่าดังที่คุณได้กล่าวไว้ในความคิดเห็นของคุณว่าความน่าจะเป็นที่คนตัดสินสีของรถยนต์อย่างถูกต้องคือ 0.9 นั่นคือ: และ p ( พูดว่าไม่ใช่สีน้ำเงิน|รถเป็นสีน้ำเงิน) = 0.9 = 1 - p ( บอกว่าเป็นสีฟ้า|รถไม่ได้สีฟ้า)

p(say it's blue|car is blue)=0.9=1p(say it isn't blue|car is blue)
p(say it isn't blue|car isn't blue)=0.9=1p(say it is blue|car isn't blue)

สิ่งที่เหลืออยู่ที่เราต้องตัดสินใจคือความน่าจะเป็นก่อนหน้านี้ที่รถเป็นสีน้ำเงินคืออะไร ลองเลือกความน่าจะเป็นที่ต่ำมากเพื่อดูว่าเกิดอะไรขึ้นและบอกว่าหรือเพียง 0.1% ของรถยนต์ทุกคันเป็นสีน้ำเงิน จากนั้นความน่าจะเป็นหลังที่รถเป็นสีน้ำเงินนั้นสามารถคำนวณได้ดังนี้:p(car is blue)=0.001

p(car is blue|answers)=p(answers|car is blue)p(car is blue)p(answers|car is blue)p(car is blue)+p(answers|car isn't blue)p(car isn't blue)=0.9900×0.1100×0.0010.9900×0.1100×0.001+0.1900×0.9100×0.999

ถ้าคุณดูที่ตัวหารมันค่อนข้างชัดเจนว่าเทอมที่สองในผลรวมนั้นจะไม่สำคัญเนื่องจากขนาดสัมพัทธ์ของคำในผลรวมนั้นถูกครอบงำด้วยอัตราส่วนถึงซึ่ง อยู่ในคำสั่งของ{58} และแน่นอนถ้าคุณทำการคำนวณนี้บนคอมพิวเตอร์ (ระวังเพื่อหลีกเลี่ยงปัญหาอันเดอร์โฟลว์ตัวเลข) คุณจะได้รับคำตอบที่เท่ากับ 1 (ภายในความแม่นยำของเครื่อง) 0.1 900 10 580.99000.19001058

เหตุผลที่ความน่าจะเป็นก่อนหน้านี้ไม่สำคัญมากนักที่นี่เพราะคุณมีหลักฐานมากมายสำหรับความเป็นไปได้หนึ่งอย่าง (รถเป็นสีฟ้า) เทียบกับที่อื่น สิ่งนี้สามารถวัดได้โดยอัตราส่วนความน่าจะเป็นซึ่งเราสามารถคำนวณได้เป็น:

p(answers|car is blue)p(answers|car isn't blue)=0.9900×0.11000.1900×0.910010763

ดังนั้นก่อนที่จะพิจารณาความน่าจะเป็นที่ผ่านมาหลักฐานชี้ให้เห็นว่าทางเลือกหนึ่งนั้นมีแนวโน้มทางดาราศาสตร์มากกว่าทางเลือกอื่นและสำหรับก่อนที่จะสร้างความแตกต่างใด ๆ รถยนต์สีน้ำเงินจะต้องไร้เหตุผลและโง่เง่าหายาก พบรถสีฟ้า 0 คันบนโลก)

แล้วถ้าเราเปลี่ยนความถูกต้องของผู้คนในคำอธิบายสีรถ? แน่นอนเราสามารถผลักดันสิ่งนี้ให้สุดขั้วและบอกว่าพวกเขาทำให้ถูกต้องเพียง 50% ของเวลาซึ่งไม่ดีไปกว่าการพลิกเหรียญ ในกรณีนี้ความน่าจะเป็นหลังที่รถเป็นสีน้ำเงินนั้นเท่ากับความน่าจะเป็นก่อนหน้านี้เพราะคำตอบของผู้คนไม่ได้บอกอะไรเรา แต่แน่นอนว่าคนทำอย่างน้อยดีกว่านั้นและแม้ว่าเราจะบอกว่าคนมีความถูกต้องเพียง 51% ของเวลาอัตราส่วนความน่าจะเป็นยังคงทำงานเช่นนั้นประมาณครั้งมีแนวโน้มมากขึ้นสำหรับรถ เป็นสีน้ำเงิน1013

ทั้งหมดนี้เป็นผลมาจากจำนวนที่ค่อนข้างมากที่คุณเลือกในตัวอย่างของคุณ ถ้าเป็น 9/10 คนที่บอกว่ารถเป็นสีฟ้ามันจะเป็นเรื่องที่แตกต่างกันมากถึงแม้ว่าสัดส่วนของคนในค่ายเดียวกันกับที่อื่น ๆ เพราะหลักฐานทางสถิติไม่ได้ขึ้นอยู่กับอัตราส่วนนี้ แต่ขึ้นอยู่กับความแตกต่างของตัวเลขระหว่างกลุ่มฝ่ายตรงข้าม ในความเป็นจริงในอัตราส่วนความน่าจะเป็น (ซึ่งคำนวณปริมาณพยานหลักฐาน) คน 100 คนที่บอกว่ารถไม่ได้เป็นสีน้ำเงินแน่นอนจะถูกยกเลิก 100 จาก 900 คนที่บอกว่ามันเป็นสีน้ำเงินดังนั้นมันเหมือนกับว่าคุณมี 800 คนเห็นด้วยทั้งหมด มันเป็นสีฟ้า และนั่นเป็นหลักฐานที่ชัดเจนว่าชัดเจน

(แก้ไข: ตามที่ Silverfish ชี้ให้เห็นข้อสันนิษฐานที่ฉันทำไว้ที่นี่บอกเป็นนัย ๆ ว่าเมื่อใดก็ตามที่มีคนอธิบายถึงรถที่ไม่ใช่สีน้ำเงินอย่างไม่ถูกต้องพวกเขาจะเริ่มต้นที่จะบอกว่ามันเป็นสีฟ้า และจะบอกว่าสีฟ้ามีเพียงบางครั้งเท่านั้นนี่ไม่ได้สร้างความแตกต่างให้กับข้อสรุปแม้ว่าคนที่มีโอกาสน้อยกว่าจะต้องทำผิดพลาดกับรถที่ไม่ใช่สีฟ้าสำหรับรถสีฟ้า คือถ้ามีอะไรตัวเลขที่ให้ไว้ข้างต้นเป็นเพียงขอบเขตล่างบนหลักฐานโปร - บลู)


11
+1 ในความเป็นจริงจากข้อมูลของ OP การประเมิน MLE ว่าผู้คนมีความถูกต้องแม่นยำเพียงใดคือ 900/1000 = 90%
อะมีบา

5
รับสีรถที่ถูกต้อง 50% ของเวลาไม่เหมือนกับการพลิกเหรียญ หลังจากทั้งหมดมีวิธีมากกว่าสองสีที่มีอยู่ นอกจากนี้บางคนอาจพูดว่า "กองทัพเรือ" หรือ "สีฟ้า" แทน "สีฟ้า"? ที่จริงแล้วคน Mayn จะพูดผิด ๆ ว่า "สีฟ้า" เมื่อคำตอบที่ถูกต้องคือ "สีที่เป็นสิทธิบัตรและเป็นแฟชั่นที่เกือบจะดูเหมือนสีน้ำเงิน"
Hagen von Eitzen

10
ฉันรู้ว่าตัวเลขเหล่านี้เป็นเพียงตัวอย่างเท่านั้น แต่ถ้า "ความน่าจะเป็นที่ผู้คนตัดสินสีรถยนต์ได้อย่างถูกต้องคือ 0.9" ถ้าไม่มีสิ่งพิเศษเกี่ยวกับสีฟ้าฉันไม่คิดว่ามันสมเหตุสมผลที่จะเรียกร้อง p (พูด มันคือสีน้ำเงิน | รถไม่ได้เป็นสีน้ำเงิน) = 0.1 หากเราคิดว่า 90% ของเวลาคนระบุสีที่ถูกต้องแล้ว p (พูดแดง | รถเป็นสีแดง) = p (พูดขาว | รถเป็นสีขาว) = p (พูดสีเขียว | รถเป็นสีเขียว) = 0.9 และอื่น ๆ เปิดสำหรับสีรถที่เป็นไปได้ทั้งหมด แต่ทำไม p (พูดว่าสีน้ำเงิน | รถเป็นสีแดง) = p (พูดว่าสีน้ำเงิน | รถเป็นสีขาว) = p (พูดว่าสีน้ำเงิน | รถเป็นสีเขียว) = 0.1? สิ่งนี้จะแปลว่า p (พูดว่า white | car is red) = 0
Silverfish

2
@PatMolloy: ไม่จำเป็น ขึ้นอยู่กับว่าความน่าจะเป็นแบบสมมาตรหรือไม่: มีคนที่ทำผิดพลาดสีน้ำเงินสำหรับรถยนต์ที่ไม่ใช่สีฟ้าหรือไม่เพราะคนที่ทำผิดพลาดไม่ใช่สีน้ำเงินสำหรับรถยนต์สีน้ำเงิน ถ้าเป็นเช่นนั้นคำตัดสิน 500/500 จะให้ข้อมูลมากเท่ากับการโยนเหรียญ แต่ถ้าผู้คนมีโอกาสน้อยที่จะพูดว่ารถที่ไม่ใช่สีน้ำเงินนั้นเป็นสีน้ำเงินมากกว่าที่พวกเขาบอกว่ารถสีฟ้าไม่ใช่สีน้ำเงินดังนั้นผู้ที่พูดด้วยสีฟ้า 500 คนนั้นยากที่จะอธิบายออกไปมากกว่า 500 คนที่ไม่ใช่สีน้ำเงิน สมมติฐานที่ไม่ใช่สีฟ้า ดังนั้นในกรณีนั้นความสมดุลของหลักฐานจะเอียงไปทางสีน้ำเงิน
Ruben van Bergen

3
การรับรู้สีเป็นสิ่งที่ยุ่งยากหากคนเก้าในสิบคนพูดว่าชุดเป็นสีขาวและสีทองความน่าจะเป็นคือสีน้ำเงินและสีดำ
Glen_b

73

คำตอบที่ถูกต้องขึ้นอยู่กับข้อมูลที่ไม่ได้ระบุในปัญหาคุณจะต้องตั้งสมมติฐานเพิ่มเติมเพื่อให้ได้คำตอบเดียวที่ชัดเจน

  • ความน่าจะเป็นก่อนหน้านี้ของรถคือสีน้ำเงินนั่นคือความเชื่อของคุณที่ว่าเป็นรถสีน้ำเงินเพราะคุณยังไม่ได้ถามใครเลย
  • ความน่าจะเป็นที่มีคนบอกคุณว่ารถเป็นสีน้ำเงินเมื่อจริงแล้วเป็นสีน้ำเงินและความน่าจะเป็นที่พวกเขาบอกคุณว่ารถเป็นสีน้ำเงินเมื่อจริงแล้วไม่ใช่สีน้ำเงิน
  • ความน่าจะเป็นที่รถเป็นสีฟ้าเมื่อมีคนบอกว่ามันเป็นจริงและความน่าจะเป็นที่รถนั้นไม่ใช่สีน้ำเงินเมื่อมีคนบอกว่ามันเป็นสีน้ำเงิน

ด้วยข้อมูลเหล่านี้เราสามารถทำลายทุกสิ่งด้วยสูตรของ Bayes เพื่อรับความน่าจะเป็นหลังที่รถเป็นสีน้ำเงิน ฉันจะมุ่งเน้นไปที่กรณีที่เราถามเพียงคนเดียว แต่เหตุผลเดียวกันสามารถนำไปใช้กับกรณีที่คุณถามคน1000

Ppost(car is blue)=P(car is bluesay is blue)P(say is blue)    +P(car is bluesay is not blue)P(say is not blue)

เราจำเป็นต้องแยกย่อยไปนี่คือที่มาก่อน:P(say is blue)

P(say is blue)= P(say is bluecar is blue)Pprior(car is blue)+P(say is bluecar is not blue)Pprior(car is not blue)

ดังนั้นกฎสองข้อของเบย์ก็มาถึงคุณแล้ว คุณจะต้องกำหนดพารามิเตอร์ที่ไม่ระบุตามข้อมูลที่คุณมีเกี่ยวกับสถานการณ์เฉพาะหรือโดยการตั้งสมมติฐานที่สมเหตุสมผล

มีการผสมผสานอื่น ๆ ของสมมติฐานที่คุณสามารถทำได้โดยยึดตาม:

P(say is bluecar is blue)P(car is blue)=P(car is bluesay is blue)P(say is blue)

ในตอนแรกคุณไม่รู้อะไรเลย ดังนั้นคุณต้องตั้งสมมติฐานที่สมเหตุสมผลเกี่ยวกับสามข้อจากนั้นเลือกข้อสี่จากนั้น


5
มักเป็นเช่นนั้น จากนั้นคุณมีสองตัวเลือกที่แสดงถึงการขาดความรู้โดยรวมโดยสมมติว่าสีน้ำเงินและไม่ใช่สีน้ำเงินนั้นมีโอกาสเท่ากัน ทำแบบสำรวจอย่างรวดเร็วของฟิลด์บางอย่างเช่นนี้สามารถช่วย: en.wikipedia.org/wiki/Car_colour_popularity
Matthew Drury

18
@ ทำให้ปัญหาของ "สีฟ้าและสีฟ้าไม่เท่ากันมีแนวโน้ม" คือมันไม่สอดคล้องกัน หากเราใช้เหตุผลเดียวกันกับสีรถที่เป็นไปได้แต่ละสีเราจะจบลงด้วยการอ้างว่าพวกเขาทั้งหมดมีโอกาส 50% (เป็นไปไม่ได้ที่มีมากกว่าสองสีตามกฎความน่าจะเป็น) และโอกาสน้อยกว่า 50% (เมื่อคุณ มองไปที่สีฟ้าใน "ไม่ขาว" และ "ไม่แดง" ซึ่งยังนำไปสู่ความขัดแย้งตั้งแต่น่าจะเป็นของสีใด ๆ ไม่สามารถใช้ค่าหลาย)
Glen_b

2
มีข้อมูลที่ไม่ระบุมากกว่านี้เพราะคำตอบของผู้คนไม่จำเป็นต้องเป็นอิสระ (อันที่จริงแล้วเราหวังว่าพวกเขาจะมีความสัมพันธ์อย่างยิ่งกับสีของวัตถุประสงค์ซึ่งห่างไกลจากความเป็นอิสระ) เกิดอะไรขึ้นถ้าคำตอบนั้นขึ้นอยู่กับ "มากเกินไป" สมมติว่าเราแค่ถามคนเดินเท้าสุ่มสิบคน แต่ให้ตอบกลับ 100 ครั้งหรือไม่
Hagen von Eitzen

2
@HagenvonEitzen และ MatthewDrury ในความเป็นจริงสิ่งที่คุณยังต้องถือว่าไม่ได้เป็นอิสระ แต่ความเป็นอิสระตามเงื่อนไข กล่าวอีกนัยหนึ่ง{รถเป็นสีฟ้า}) P(Joe and Mary say blue|car is blue)=P(Joe says blue|car is blue)P(Mary says blue|car is blue)
Luca Citi

15
@Glen_b: โลกมีเพียงสองสีคือสีน้ำเงินและไม่ใช่สีน้ำเงิน เป็นที่ยอมรับกันว่ามีหลายเฉดโดยเฉพาะอย่างยิ่งไม่ใช่สีน้ำเงิน
psmears

13

มีข้อสันนิษฐานที่สำคัญที่ความคิดเห็น 1,000 ข้อของคุณไม่ได้มีอคติอย่างเป็นระบบ ซึ่งเป็นข้อสมมติฐานที่สมเหตุสมผลที่นี่ แต่อาจมีความสำคัญในกรณีอื่น ๆ

ตัวอย่างอาจจะ:

  • พวกเขาทั้งหมดมีความคล้ายคลึงกันตาบอดสี (พันธุศาสตร์ในประชากรเช่น)
  • พวกเขาเห็นรถในตอนกลางคืนภายใต้แสงไฟจากถนนโซเดียมสีส้ม
  • พวกเขาทุกคนมีวัฒนธรรมร่วมกันซึ่งสีน้ำเงินนั้นเป็นข้อห้ามหรือเกี่ยวข้องอย่างน่าอัศจรรย์ (ซึ่งมีอคติไม่ว่าพวกเขาจะอธิบายวัตถุใด ๆ ว่าเป็นสีน้ำเงินหรือใช้ถ้อยคำสำนึกทางวัฒนธรรมหรืออะไรก็ตามแทน)
  • พวกเขาได้รับการบอกกล่าว (หรือแบ่งปันความเชื่อร่วมกัน) ว่าหากพวกเขาไม่ตอบคำถามบางอย่างจะมีอะไรดีหรือไม่ดีเกิดขึ้นกับพวกเขา .....

มันไม่น่าเป็นไปได้ในกรณีนี้ แต่เป็นข้อสันนิษฐานนัยสำคัญในกรณีอื่น ๆ ไม่จำเป็นต้องเป็นเรื่องสุดขีดเช่นกัน - ย้ายคำถามของคุณไปยังโดเมนอื่นและนี่จะเป็นปัจจัยที่แท้จริง

ตัวอย่างสำหรับแต่ละที่คำตอบของคุณอาจได้รับผลกระทบจากอคติที่แชร์:

  • ถามว่าแก้วทรงสูงใบหนึ่งมีแก้วอ้วนสั้นกว่าที่เหมือนกันจริงหรือไม่ แต่ผู้ตอบแบบสอบถาม 1,000 คนของคุณเป็นเด็กเล็ก ๆ (เข้าใจผิดร่วมกัน)
  • ถาม 1,000 คนว่าการเดินใต้บันไดนั้นอันตรายหรือไม่ (ความเชื่อทางวัฒนธรรมทั่วไป)
  • ถาม 1,000 คนที่แต่งงานแล้วหากพวกเขารักคู่ของพวกเขา / มีความสัมพันธ์ในสถานการณ์ที่พวกเขาเชื่อว่าคู่ของพวกเขาจะรู้คำตอบของพวกเขา บริบทอาจเป็นรายการทีวีหรือมีคู่ครองเมื่อถูกถาม ฯลฯ (ความเชื่อทั่วไปเกี่ยวกับผลที่ตามมา)

คงไม่ยากเลยที่จะจินตนาการคำถามที่มีโครงสร้างเหมือนกันที่การตอบสนอง 900: 100 เป็นการวัดความเชื่อและความซื่อสัตย์หรืออย่างอื่นและไม่ได้ชี้ไปที่คำตอบที่ถูกต้อง ไม่น่าเป็นไปได้ในกรณีนี้ แต่ในกรณีอื่น ๆ - ใช่


11

เหตุผลหนึ่งที่คุณได้รับคำตอบที่แตกต่างจากคนอื่นคือคำถามนั้นสามารถตีความได้หลายวิธีและยังไม่ชัดเจนว่าคุณหมายถึงอะไรโดย "ความน่าจะเป็น" ที่นี่ วิธีหนึ่งในการทำความเข้าใจกับคำถามคือมอบหมายให้นักบวชและเหตุผลโดยใช้กฎของเบย์เหมือนในคำตอบของมัทธิว

ก่อนที่จะถามถึงความน่าจะเป็นคุณต้องตัดสินใจว่าอะไรที่เป็นแบบสุ่มและอะไรที่ไม่ มันไม่ได้เป็นที่ยอมรับกันโดยทั่วไปว่าควรมีการกำหนดจำนวนนักบวชที่ไม่ทราบ แต่แน่นอน นี่คือการทดลองที่คล้ายกันกับของคุณที่เน้นปัญหากับคำถาม:

สมมติ ,มี IID ตัวแปรสุ่ม Bernoulli ด้วยโอกาสที่จะประสบความสำเร็จ (ค่าเฉลี่ย)0.5 เพื่อความสามารถในการตีความลองคิดว่าเป็นเหรียญพลิก สมมติว่าคุณสังเกต (สถิติเพียงพอ)900 ความน่าจะเป็นที่เหรียญเป็นธรรมคืออะไร? i = 1 , , 1000 p = 0.5 X i 1,000 i = 1 X i = 900Xii=1,,1000p=0.5Xii=11000Xi=900

จากมุมมองของผู้ใช้บ่อย ๆ คำถามนั้นไร้สาระหรือคำตอบก็คือ "หนึ่ง" หากคุณเป็นชาวเบย์คุณอาจต้องการมอบหมายการกระจายก่อนหน้านี้ให้กับซึ่งในกรณีนี้คำถามก็สมเหตุสมผลดี ความแตกต่างพื้นฐานระหว่างตัวอย่างของฉันและคำถามคือไม่เป็นที่รู้จักในคำถามและคำถามที่ปลอมตัวข้อเท็จจริงที่ว่าการสุ่มตัวอย่างที่แท้จริงคือว่าคน (สุ่มตัวอย่างสุ่ม) ตอบว่ารถเป็นสีฟ้าหรือไม่ สีของรถไม่ได้ถูกกำหนดแบบสุ่มและทำให้ไม่น่าสนใจที่จะพูดถึงความน่าจะเป็นที่จะเป็นสีฟ้าจากมุมมองที่พบบ่อยพีpp


1
ดังนั้นถ้าคุณลบสมมติฐานที่ว่ารถเป็นสีฟ้าและที่เหลือก็เหมือนกันคน 900 คนบอกว่าเป็นสีฟ้าและ 100 พูดไม่ได้ในกรณีนั้นความน่าจะเป็นคือ 0.9?
ผู้ใช้

ไม่มันใกล้เคียงกับ 1 มากและไม่น่าเป็นไปได้มากที่ 900 จาก 1,000 คนจะทำให้สีผิด
gnasher729

1
the probability is either one or zero, depending on whether the car is actually blue or not.สิ่งนี้ไม่สอดคล้องกับความเข้าใจของ "ความน่าจะเป็น" ตามที่ฉันคุ้นเคย ดูเหมือนว่า "X สามารถเกิดขึ้นได้หรือไม่สามารถเกิดขึ้นได้ดังนั้นความน่าจะเป็นต้องเป็น 50%" คุณช่วยทำให้ชัดเจนขึ้นหน่อยว่าคุณหมายถึงประโยคนี้หรือไม่?
AnoE

2
@AnoE ความแตกต่างนั้นคล้ายคลึงกับระหว่างพารามิเตอร์และตัวแปรสุ่ม มันให้ไว้ในการตั้งค่าของคำถามที่ว่ารถเป็นสีฟ้าจริงมันเป็นสีไม่ได้เป็นผลมาจากการทดลองแบบสุ่ม มันคือการตีความโวลต์แบบเบย์บ่อยครั้ง หากคุณพลิกเหรียญ 1,000 ครั้งและสังเกตหัว 900 ดังนั้นความน่าจะเป็นที่เหรียญจะเป็นเท่าไหร่? มันอาจเป็นหนึ่งหรือศูนย์ก็ได้หากคุณเป็นประจำ (หรือไร้สาระ); เราไม่ได้กำหนดความน่าจะเป็นให้พารามิเตอร์
ekvall

@ ผู้ใช้ไม่ฉันได้อัปเดตคำตอบแล้วเพื่อให้ประเด็นของฉันชัดเจนยิ่งขึ้น
ekvall

7

คำตอบที่ใช้งานง่าย:

ความน่าจะเป็นอยู่ในช่วงตั้งแต่ 0% ถึง 100% ขึ้นอยู่กับสมมติฐานของคุณ

แม้ว่าฉันจะชอบคำตอบที่มีอยู่จริงๆในทางปฏิบัติแล้วโดยทั่วไปแล้วมันจะทำให้สถานการณ์ง่าย ๆ สองอย่างนี้:

สถานการณ์ที่ 1: ผู้คนจะถือว่าดีมากที่รู้จักสีน้ำเงินเมื่อเป็นสีน้ำเงิน ... 0%

ในกรณีนี้มีคนมากมายที่ระบุว่ารถไม่ได้เป็นสีน้ำเงินและไม่น่าเป็นไปได้มากที่รถจะเป็นสีน้ำเงินจริง ๆ น่าจะเป็น 0%

สถานการณ์ที่ 2: ผู้คนจะถือว่าดีมากในการรับรู้ไม่ใช่ฟ้าเมื่อมันไม่ใช่น้ำเงิน ... 100%

ในกรณีนี้มีคนจำนวนมากที่ระบุว่ารถเป็นสีน้ำเงินซึ่งมีแนวโน้มว่ามันจะเป็นสีน้ำเงินอย่างแน่นอน ดังนั้นความน่าจะเป็นเข้าใกล้ 100%


แน่นอนว่ามาจากมุมมองทางคณิตศาสตร์คุณจะเริ่มด้วยบางสิ่งที่คล้ายกันแบบทั่วไป 'ให้เราสมมติว่าความน่าจะเป็นที่เกี่ยวข้องคือ ... ' ซึ่งค่อนข้างไร้ความหมาย ดังนั้นฉันจึงสนับสนุนให้ดูสุดขั้วเพื่อที่จะเข้าใจความคิดที่ว่าเปอร์เซ็นต์ทั้งสองนั้นสามารถพิสูจน์ได้ด้วยสมมติฐานที่ง่ายและสมจริงและดังนั้นจึงไม่มีคำตอบที่มีความหมายเดียว


2
หาก "ผู้คนถือว่าดีมากในการรู้จักสีน้ำเงิน" ทำไมพวกเขาถึงประมาณว่าเป็นสีน้ำเงินเมื่อไม่ได้อยู่ในสถานการณ์ที่ 1 คุณอาจต้องการแสดงสถานการณ์ของคุณในแง่ของความผิดพลาดเชิงบวกและเชิงลบเท็จ
hyde

@hyde ให้รางวัลภาพจำลองเพื่อลบความกำกวม
Dennis Jaheruddin


5

คุณต้องพัฒนากรอบการประมาณ บางคำถามที่คุณอาจถามคือ

  1. มีกี่สี? พวกเรากำลังพูดสองสีหรือไม่? หรือทุกสีรุ้ง?

  2. สีต่างกันอย่างไร? พวกเรากำลังพูดถึงสีฟ้าและสีส้ม? หรือน้ำเงินฟ้าและฟ้าคราม

  3. สีน้ำเงินหมายถึงอะไร? สีฟ้าและสีเขียวขุ่นหรือไม่? หรือเพียงแค่สีน้ำเงินเอง

  4. คนเหล่านี้ดีแค่ไหนในการประมาณค่าสี พวกเขาเป็นนักออกแบบกราฟิกทั้งหมดหรือไม่ หรือว่าพวกเขาตาบอดสี?

จากมุมมองทางสถิติล้วนๆเราสามารถคาดเดาได้บ้างถึงสิ่งสุดท้าย ก่อนอื่นเรารู้ว่าคนอย่างน้อย 10% กำลังเลือกคำตอบที่ไม่ถูกต้อง หากมีเพียงสองสี (จากคำถามแรก) จากนั้นเราอาจพูดได้ว่ามี

Probability says blue and is blue = 90% say is blue * 90% correct = 81%
Probability says blue and is not = 90% * 10% incorrect = 9%
Probability says not but is blue = 10% * 90% incorrect = 9%
Probability says not and is not = 10% * 10% = 1%

ตรวจสอบอย่างรวดเร็วหากเรารวมเข้าด้วยกันเราจะได้ 100% คุณสามารถดูสัญกรณ์คณิตศาสตร์มากกว่านี้ที่คำตอบ @MatthewDrury

เราจะได้ 90% ในครั้งที่สามได้อย่างไร มันมีกี่คนที่พูดว่าสีน้ำเงิน แต่ผิดถ้าไม่ใช่ เนื่องจากมีเพียงสองสีจึงมีความสมมาตร หากมีมากกว่าสองสีโอกาสในการเลือกที่ผิดจะเป็นสีฟ้าเมื่อพวกเขาพูดอย่างอื่นจะลดลง

อย่างไรก็ตามวิธีการประมาณค่านี้ทำให้เรามีสีน้ำเงิน 90% ซึ่งรวมถึงโอกาส 81% ของคนที่พูดว่าสีน้ำเงินเมื่อเป็นและ 9% โอกาสของคนที่พูดว่าไม่เป็นเมื่อไหร่ นี่อาจเป็นสิ่งที่ใกล้เคียงที่สุดที่เราสามารถตอบคำถามต้นฉบับได้และเราต้องการให้เราใช้ข้อมูลเพื่อประเมินสองสิ่งที่แตกต่างกัน และสมมติว่าโอกาสของการถูกเลือกสีน้ำเงินนั้นเหมือนกับโอกาสของการสีน้ำเงินที่ถูกต้อง

หากมีมากกว่าสองสีตรรกะจะเปลี่ยนไปเล็กน้อย สองบรรทัดแรกยังคงเหมือนเดิม แต่เราสูญเสียความสมมาตรในสองบรรทัดสุดท้าย ในกรณีนี้เราต้องการข้อมูลเพิ่มเติม เราอาจประมาณโอกาสที่จะพูดสีน้ำเงินอย่างถูกต้องเป็น 81% อีกครั้ง แต่เราไม่รู้ว่าโอกาสที่จะเป็นสีฟ้านั้นคืออะไรเมื่อมีคนบอกว่ามันไม่ใช่

เราสามารถปรับปรุงได้แม้กระทั่งการประมาณค่าสีทั้งสอง ด้วยจำนวนรถยนต์ที่มีนัยสำคัญทางสถิติของแต่ละสีเราอาจมีจำนวนผู้ชมที่มีนัยสำคัญทางสถิติและจัดหมวดหมู่พวกเขา จากนั้นเราสามารถนับได้ว่าผู้คนมักจะถูกต้องเมื่อพวกเขาเลือกแต่ละสีและความถี่ที่พวกเขาเลือกสำหรับแต่ละสีที่เลือก จากนั้นเราสามารถประมาณได้แม่นยำยิ่งขึ้นเนื่องจากตัวเลือกที่แท้จริงของผู้คน

คุณอาจถามว่า 90% อาจผิด ลองพิจารณาสิ่งที่เกิดขึ้นหากมีสามสี ได้แก่ สีฟ้าสีฟ้าและไพลิน บางคนอาจคิดว่าทั้งสามอย่างนี้มีสีน้ำเงินพอสมควร แต่เราต้องการมากกว่านี้ เราต้องการสีที่แน่นอน แต่ใครจะจำชื่อของเฉดสีอื่นได้บ้าง หลายคนอาจเดาว่าสีน้ำเงินเพราะเป็นสีเดียวที่พวกเขารู้ และยังคงผิดเมื่อมันกลายเป็นสีฟ้า


ดังที่ได้กล่าวไว้ในความคิดเห็นก่อนหน้านี้แน่นอนว่ามีเพียงสองสีที่เกี่ยวข้องเท่านั้นคือ 'สีน้ำเงิน' และ 'ไม่ใช่สีน้ำเงิน' ดังนั้นจึงไม่จำเป็นต้องมีส่วนเกี่ยวกับหลายสี
Dennis Jaheruddin

4

ความน่าจะเป็นที่แน่นอนคณิตศาสตร์และจริงไม่สามารถคำนวณได้ด้วยข้อมูลที่คุณให้

อย่างไรก็ตามในชีวิตจริงข้อมูลดังกล่าวไม่สามารถใช้ได้อย่างแน่นอน ดังนั้นการใช้สัญชาตญาณของเรา (และเงินทั้งหมดของฉันจะไปที่ไหนถ้าเราพนัน) รถเป็นสีฟ้าแน่นอน (บางคนเชื่อว่านี่ไม่ใช่สถิติอีกต่อไป แต่มุมมองวิทยาศาสตร์สีดำ / ขาวนั้นไม่ค่อยมีประโยชน์)

เหตุผลง่าย ๆ สมมติว่ารถไม่ได้เป็นสีน้ำเงิน จากนั้น 90% ของคน (!) ผิด พวกเขาอาจจะผิดเพราะรายการของปัญหารวมถึง:

  • ตาบอดสี
  • การโกหกทางพยาธิวิทยา
  • อยู่ภายใต้อิทธิพลของสารต่าง ๆ เช่นแอลกอฮอล์ LCD ฯลฯ
  • ไม่เข้าใจคำถาม
  • รูปแบบอื่น ๆ ของความผิดปกติทางจิต
  • การรวมกันของข้างต้น

เนื่องจากข้างต้นไม่น่าจะส่งผลกระทบต่อ 90% ของประชากรสุ่มโดยเฉลี่ย (เช่นตาบอดสีมีผลต่อรอบ 8% ของเพศชายและ 0.6% ของเพศหญิงนั่นคือ 43 คนจาก 1,000) มันจำเป็นต้องเป็นกรณีที่รถเป็น สีน้ำเงิน. (นั่นคือเงินทั้งหมดของฉันจะไปต่อไป)


นี่ดูเหมือนจะเหมาะสมกับฉัน ฉันคิดว่าการวิพากษ์วิจารณ์คำถามดั้งเดิมนั้นไม่ได้ให้ข้อมูลที่เพียงพอและต้องมีการตั้งสมมติฐานบางอย่างขึ้นมา .. ก็ไม่ได้เป็นเช่นนั้นในโลกแห่งความเป็นจริง
Pat Molloy

@PatMolloy มันไม่ได้ให้ข้อมูลเพียงพอที่จะให้คำตอบทางคณิตศาสตร์ที่ถูก / ผิดที่ซับซ้อน (ซึ่งแน่นอนว่าสิ่งที่คำถามมากมายมุ่งหวังที่จะได้รับจากเว็บไซต์นี้) อย่างไรก็ตามจากข้อมูลที่ลดลงที่คุณให้เมื่อมันเกี่ยวกับการเดิมพันเงินนี่คือคำตอบ (100%) ที่ผู้คนจะเลือก
luchonacho

1
ฉันคิดว่าคุณล้มเหลวในการครอบคลุมตัวเลือกที่น่าเชื่อถือที่สุด - ซึ่งเป็นสิ่งที่ควรทำให้คุณแก้ไขข้อสรุปของคุณ เหล่านี้รวมถึง (a) คนไม่สามารถรับรู้สีน้ำเงิน (b) ไม่มีความเข้าใจร่วมกันของ "สีฟ้า" ระหว่างผู้ถามและผู้ตอบแบบสอบถาม; (c) ความหมาย "วิทยาศาสตร์" ของ "สีฟ้า" แตกต่างจากสิ่งที่คนทั่วไปเข้าใจว่าเป็น "สีฟ้า" สำคัญเนื่องจากคุณไม่สามารถหาจำนวนตัวเลือกใด ๆเหล่านี้หรือรายการส่วนใหญ่ที่คุณทำคุณจะปรับความน่าจะเป็นของคำตอบได้อย่างไร นั่นไม่ใช่สถิติ!
whuber

"เนื่องจากข้อมูลข้างต้นไม่ชัดเจนที่จะส่งผลกระทบต่อ 90% ของประชากรสุ่มโดยเฉลี่ย" อย่ามั่นใจในเรื่องนั้น จำไว้ว่าโดยทั่วไปเราจะพูดถึงเรื่องค่าเฉลี่ยเมื่อพูดถึงมนุษย์ แน่นอนว่ามีเพียงไม่กี่เปอร์เซ็นต์เท่านั้นที่มีอาการตาบอดสี (เทียบกับค่าเฉลี่ย) แต่อาจมีบางส่วนที่มีวิสัยทัศน์ที่เหนือกว่าเช่น tetrachromats
NPSF3000

2
ฉันมักจะอยู่ภายใต้อิทธิพลของจอแอลซีดี
อเล็กซ์

2

ฉันจะไม่กินอุจจาระเพราะความจริงที่ว่าแมลงวันนับพันตัวไม่สามารถผิดได้ อาจมีสาเหตุอื่นอีกหลายสิบเหตุผลที่คน 900 คนจาก 1,000 คนอาจถูกโกงคิดว่ารถยนต์เป็นสีน้ำเงิน ท้ายที่สุดนั่นคือฐานของกลวิธีเวทมนต์ล่อลวงคนให้คิดบางสิ่งบางอย่างที่ถูกลบออกจากความเป็นจริง หาก 900 คนจาก 1,000 คนเห็นนักมายากลที่แทงผู้ช่วยของเขา / เธอพวกเขาจะตอบผู้ช่วยที่ถูกแทงทันทีว่าการฆาตกรรมเกิดขึ้นได้อย่างไรบนเวที แสงสีฟ้าบนสีรถที่สะท้อนแสง


2

ผู้ถามรู้น้อยมากเกี่ยวกับวิธีการสำรวจความคิดเห็นเพื่อตอบคำถามได้อย่างถูกต้อง เท่าที่เขากังวลการสำรวจความคิดเห็นสามารถประสบปัญหาหลายประการ:

ผู้คนที่ทำโพลนั้นอาจมีอคติ:

  1. รถมองฟ้าเพราะภาพลวงตา

  2. สีของรถมีเหตุผลบางอย่างที่ยากต่อการสังเกตและผู้คนด้วยเหตุผลบางอย่างได้แสดงรถสีฟ้าจำนวนมากก่อนหน้านี้ซึ่งทำให้พวกเขาส่วนใหญ่เชื่อว่ารถคันนี้อาจเป็นสีน้ำเงินเช่นกัน

  3. คุณจ่ายให้พวกเขาเพื่อบอกว่ารถเป็นสีฟ้า

  4. คุณมีคนสะกดจิตพวกเขาทั้งหมดให้เชื่อว่ารถเป็นสีฟ้า

  5. พวกเขาทำสนธิสัญญาเพื่อโกหกและก่อวินาศกรรมในแบบสำรวจความคิดเห็น

อาจมีความสัมพันธ์กันในหมู่คนที่ทำการสำรวจความคิดเห็นเนื่องจากวิธีการเลือกหรือเพราะพวกเขาส่งผลกระทบต่อกัน:

  1. คุณตั้งใจทำโพลในการประชุมจำนวนมากสำหรับคนที่มีอาการตาบอดสีแบบเดียวกัน

  2. คุณทำแบบสำรวจความคิดเห็นที่โรงเรียนอนุบาล; เด็กผู้หญิงไม่สนใจรถและเด็กชายส่วนใหญ่มีสีฟ้าเป็นสีโปรดของพวกเขาทำให้พวกเขาจินตนาการว่ารถเป็นสีฟ้า

  3. คนแรกที่แสดงให้เห็นว่ารถเมาและคิดว่ามันดูเป็นสีฟ้าตะโกนว่า "มันคือสีฟ้า" ทำให้คนอื่น ๆ คิดว่ารถนั้นเป็นสีฟ้า

ดังนั้นในขณะที่ความเป็นไปได้ที่รถจะเป็นสีน้ำเงินถ้าการสำรวจความคิดเห็นนั้นดำเนินการอย่างถูกต้องสมบูรณ์จะสูงมาก (ดังที่อธิบายไว้ในคำตอบของ Ruben van Bergen) ความน่าเชื่อถือของการสำรวจความคิดเห็นอาจถูกประนีประนอมซึ่งทำให้โอกาส จิ๊บจ๊อย ผู้ถูกถามประมาณว่าโอกาสนี้ในท้ายที่สุดจะขึ้นอยู่กับการประเมินของเขาว่ามีโอกาสมากน้อยเพียงใดที่สถานการณ์นั้นเกิดขึ้นกับการสำรวจความคิดเห็นและความดีของคุณในการทำโพล (และเขาคิดว่าคุณเป็นคนเลว)


2

คำจำกัดความของ "สีน้ำเงิน" คืออะไร

วัฒนธรรมและภาษาที่ต่างกันมีแนวคิดเกี่ยวกับสีน้ำเงินที่แตกต่างกัน IIRC บางวัฒนธรรมมีสีเขียวในความคิดเรื่องสีน้ำเงิน!

เช่นเดียวกับคำภาษาธรรมชาติใด ๆ คุณสามารถสันนิษฐานได้ว่ามีการประชุมทางวัฒนธรรมเกี่ยวกับเมื่อ (และเมื่อไม่) เรียกสิ่งที่ "สีน้ำเงิน"

โดยรวมแล้วสีในภาษาเป็นอัตนัยอย่างน่าประหลาดใจ (ลิงค์จากความคิดเห็นด้านล่างขอบคุณ @Count Ibilis)

ป้อนคำอธิบายรูปภาพที่นี่


7
ในบริบทของคำถามฉันเชื่อว่าสิ่งนี้เป็นเรื่องที่ไม่เกี่ยวข้องเลย - ฉันคิดว่า OP เลือกคำว่า "สีน้ำเงิน" เป็นคำทั่วไปและไม่ใช่สิ่งที่ "Azure", "torqouise" ฯลฯ ซึ่งผู้คนอาจไม่แน่ใจ นอกจากนี้รถยนต์มักจะใช้จานสีที่ จำกัด ของสีที่เป็นไปได้ / ปกติ ในที่สุดคำถามไม่ได้ "ทำไมคน 100 คนถึงพูดว่าไม่ใช่สีฟ้า" แต่ "ความน่าจะเป็นที่รถคันนั้นเป็นสีฟ้า"
AnoE


คำจำกัดความที่แม่นยำจะ "ฉายแสงส่วนใหญ่ที่มีความยาวคลื่น 475nm บวกลบ 10 ~ 10nm ในสภาพแวดล้อมปัจจุบัน" โดยทั่วไปยอมรับว่าเป็นสีน้ำเงิน
rackandboneman

ใช่ แต่มีกี่คนที่ถือเครื่องมือในการวัดความยาวคลื่นที่โดดเด่น? คุณลืมที่จะยกเว้นความยาวคลื่นที่มองไม่เห็น
Anony-Mousse

1
คำถามที่ดูเหมือนว่าจะเกี่ยวกับการใช้ในกลุ่มของคนที่ไม่รู้จักการสอบเทียบสถิติเป็นเมตรความยาวคลื่น :)
rackandboneman

1

ความเป็นไปได้ที่จะขึ้นอยู่กับปัจจัยพื้นฐานที่กลั่นกรองมาแล้วนั้นขึ้นอยู่กับหลาย ๆ ค่า แต่ 99.995% เป็นสิ่งที่สมเหตุสมผลที่สุดสำหรับฉัน

เรารู้แล้วว่ารถเป็นสีฟ้า (นั่นคือ 100%) แต่ก็ไม่ได้ระบุอย่างชัดเจนว่าสิ่งนี้หมายถึงอะไรจริง ๆ ฉันจะถือว่าสิ่งที่เป็นสีฟ้าในความรู้สึกของที่สามารถมองเห็นได้เป็นสีฟ้า

เรายังรู้อีกว่า 90% ของผู้ทดสอบรายงานว่าเป็นสีฟ้า

เราไม่ทราบว่าสิ่งที่ถูกถามหรือวิธีการประเมินผลได้ทำและสภาพแสงที่รถกำลังถูกขอให้ตั้งชื่อสีบางวิชาอาจเช่นพูดว่า "สีเขียวสีฟ้า" เนื่องจากสภาพแสงและผู้ประเมินอาจ ไม่นับว่าเป็น "สีน้ำเงิน" คนเดียวกันอาจตอบว่า "ใช่" ถ้าคำถามนั้นเป็น "สีน้ำเงินนี้หรือไม่" ฉันจะสมมติว่าคุณไม่ได้ตั้งใจจะหลอกลวงผู้ทดสอบ

เรารู้ว่าอุบัติการณ์ของ tritanopy อยู่ที่ประมาณ 0,005% ซึ่งหมายความว่าถ้ารถสามารถมองเห็นเป็นสีน้ำเงินได้จริงแล้ว 99.995% ของผู้ทดสอบจะเห็นสีเป็นสีน้ำเงิน อย่างไรก็ตามนั่นหมายความว่า 9.995% ของกลุ่มทดสอบไม่ได้รายงานสีน้ำเงินเมื่อพวกเขาเห็นสีน้ำเงินอย่างชัดเจน พวกเขาโกหกเกี่ยวกับสิ่งที่เห็น สิ่งนี้อยู่ใกล้กับสิ่งที่ประสบการณ์ชีวิตของคุณบอกคุณเช่นกัน: ผู้คนมักจะไม่ซื่อสัตย์ (แต่ถ้าไม่มีแรงจูงใจพวกเขามักจะเป็น)

ดังนั้นผู้ที่ไม่ได้สังเกตก็สามารถสันนิษฐานได้ว่ารถคันนั้นเป็นสีน้ำเงิน นั่นจะเป็น 100%

ยกเว้น ... ยกเว้นถ้าคนที่ไม่ได้สังเกตตัวเองต้องทนทุกข์ทรมานจาก tritanopy ซึ่งในกรณีนี้เธอจะไม่เห็นรถเป็นสีฟ้าแม้ว่าคนอื่น ๆ (หรือมากกว่านั้น 90% ของพวกเขา) พูดอย่างนั้น ที่นี่จะได้รับปรัชญาอีกครั้ง: ถ้าทุกคนอื่นได้ยินต้นไม้ล้ม แต่ฉันไม่ทำมันจะตกหรือไม่

ฉัน daresay ว่าคำตอบที่สมเหตุสมผลและปฏิบัติได้จริงที่สุดคือถ้าบุคคลที่ไม่ได้สังเกตเห็นนั้นเป็น trianope (มีโอกาส 0.005%) จากนั้นตรวจสอบว่าสีที่ถูกทำนายและสีจริงเท่าที่เห็นจะเหมือนกันหรือไม่ ดังนั้นโอกาสที่จะเป็น 99.995% มากกว่า 100%

ยิ่งกว่านั้นเป็นโบนัสเนื่องจากเราพบว่าวิชาทดสอบ 9.995% เป็นคนโกหกและเป็นที่รู้กันว่าCretans ทั้งหมดเป็นคนโกหกเราสามารถสรุปได้ว่าเราไม่ได้อยู่ในครีต!


1

คุณมีรถสีน้ำเงิน (โดยการวัดทางวิทยาศาสตร์บางอย่าง - เป็นสีน้ำเงิน)

...

"ความน่าจะเป็นที่รถคันนั้นเป็นสีน้ำเงินคืออะไร"

มันเป็นสีฟ้า 100%

สิ่งที่พวกเขารู้ก็คือคน 900 คนบอกว่าเป็นสีฟ้าและ 100 คนไม่ได้ คุณไม่รู้อะไรเกี่ยวกับคนเหล่านี้อีก (1,000 คน)

ใช้ตัวเลขเหล่านี้ (ไม่มีบริบทใด ๆ ) เป็นเรื่องไร้สาระอย่างเต็มที่ มันเดือดลงไปทุกส่วนบุคคลการตีความของคำถาม เราไม่ควรลงไปในเส้นทางนี้และใช้ของ Wittgenstein: "Wovon man nicht sprechen kann, darüber muss schweigen man"


ลองนึกภาพคำถามต่อไปนี้สำหรับการเปรียบเทียบ:

All they know is that 0 people said it was blue, and 0 did not. 
You know nothing more about these people (the 0).

นี่เป็นปัญหาเดียวกัน (ข้อมูลน้อยลง) แต่มันชัดเจนมากขึ้นว่าสิ่งที่เราคิดว่าสีของรถส่วนใหญ่จะเป็นสถานการณ์ (ถ้าไม่สมบูรณ์)


ในระยะยาวเมื่อเราได้รับคำถามที่เกี่ยวข้องหลายคำถามจากนั้นเราสามารถเริ่มเดาคำตอบสำหรับคำถามที่ไม่สมบูรณ์ดังกล่าว นี้เป็นเหมือนกันสำหรับขั้นตอนวิธีหัวนมสำหรับทททที่ไม่ทำงานสำหรับกรณีเดียวแต่มันก็ไม่ทำงานในระยะยาว ในความรู้สึกเดียวกัน Wittgenstein กลับมาจากการทำงานก่อนหน้านี้เขามาพร้อมกับเขาสืบสวนหลัก เราสามารถตอบคำถามเหล่านี้ได้ แต่เราต้องการข้อมูลเพิ่มเติม / การทดลอง / คำถาม มันเป็นกระบวนการ


0

ถ้าเราสมมติว่ารถเป็นสีน้ำเงินแล้ว 100 จาก 1,000 บอกว่าไม่ใช่สีฟ้าแสดงถึงอคติตัวอย่างมากบางชนิด บางทีคุณอาจจะสุ่มตัวอย่างเฉพาะคนตาบอดสี ถ้าเราคิดว่ารถไม่ได้เป็นสีฟ้าแสดงว่าตัวอย่างนั้นมีอคติยิ่งแย่ลง ดังนั้นทั้งหมดที่เราสามารถสรุปได้จากข้อมูลที่ให้คือตัวอย่างนั้นมีความเอนเอียงมากและเนื่องจากเราไม่รู้ว่ามันลำเอียงอย่างไรเราจึงไม่สามารถสรุปอะไรเกี่ยวกับสีของรถได้


อืมแน่นอนความจริงที่ว่า 900 คนพูดว่ามันเป็นสีฟ้าดีสำหรับบางสิ่ง? เราไม่สามารถสรุปได้ว่ามันมีแนวโน้มที่จะเป็นสีน้ำเงินมากกว่าหรือไม่? โปรดจำไว้ว่าผู้ตอบรู้เพียงตัวเลข 900 และ 100 ดังนั้นพวกเขาสามารถพูดอะไรเกี่ยวกับอคติ
Pat Molloy

0

มีบางคำตอบ ฉันไม่เคยเป็นกูรูด้านคณิตศาสตร์ แต่ก็ใช่นี่คือของฉัน

มีความเป็นไปได้ 4 อย่างเท่านั้น:

case 1) Persons says car is blue and is correct
case 2) Person says car is blue and is incorrect
case 3) Person says car is not blue and is correct
case 4) Person says car is not blue and is incorrect

จากคำถามคุณรู้ว่าผลรวมของกรณีที่ 1 และกรณีที่ 4 คือ 900 คน (90%) และผลรวมของกรณีที่ 2 และกรณีที่ 3 คือ 100 คน (10%) อย่างไรก็ตามนี่คือสิ่งที่จับได้: สิ่งที่คุณไม่รู้คือการกระจายภายใน 2 กรณีคู่นี้ บางทีผลรวมของกรณีที่ 1 และ 4 ถูกสร้างขึ้นโดยรวมของกรณีที่ 1 (ซึ่งหมายถึงรถยนต์เป็นสีน้ำเงิน) หรือบางทีอาจจะเป็นผลรวมของกรณีที่ 4 (ซึ่งหมายความว่ารถไม่ใช่สีน้ำเงิน) กันไปสำหรับผลรวมของกรณี 2 + 3 ดังนั้น ... สิ่งที่คุณต้องการคือหาวิธีทำนายการกระจายตัวในผลรวมของเคส ไม่มีข้อบ่งชี้อื่น ๆ ในคำถาม (ไม่มีที่ไหนเลยที่บอกว่าผู้คนมั่นใจ 80% ที่จะรู้สีของพวกเขาหรืออะไรทำนองนั้น) ไม่มีทางที่คุณจะได้คำตอบที่ชัดเจนและแน่นอน

ต้องบอกว่านี้ ... ฉันสงสัยว่าคำตอบที่คาดหวังคือบางสิ่งตามแนวของ:

P(Blue) = (case 1 + case 4) * 900 / 1000 = (1/4  + 1/4) * 900 / 1000 = 45 %
P(non-Blue) = (case 2 + case  3) * 100 / 1000 = (1/4 + 1/4) * 100 / 1000 = 5%

ที่เหลือ 50% ไม่เป็นที่รู้จักเพียงแค่เรียกมันว่าระยะขอบข้อผิดพลาด


0

X,Y1,Y2,,Y1000{0,1}1p(x)pxYi|X=1p1Yi|X=0p0θ=(px,p0,p1)

p(θ,x|y1:1000)p(θ)p(x|θ)i=11000p(yi|x)

{xi}{yi|x}


-3

คนที่ไม่สามารถมองเห็นรถไม่ทราบว่ามันได้รับการพิสูจน์ทางวิทยาศาสตร์แล้วว่าเป็นสีน้ำเงิน ความน่าจะเป็นของเขา / เธอที่เป็นสีน้ำเงินคือ 50/50 (เป็นสีน้ำเงินหรือไม่ใช่) การสำรวจความคิดเห็นของคนอื่นอาจมีอิทธิพลต่อความคิดเห็นของบุคคลนี้ แต่ไม่เปลี่ยนความน่าจะเป็นที่รถที่มองไม่เห็นเป็นสีน้ำเงินหรือไม่

คณิตศาสตร์ข้างต้นทั้งหมดกำหนดความน่าจะเป็นที่ชุดตัวอย่างของคุณสามารถตรวจสอบว่าเป็นสีฟ้าหรือไม่


ฉันไม่แน่ใจว่าเป็นจริงหรือไม่ที่ความน่าจะเป็นที่เป็นสีน้ำเงินคือ 50/50 ในความเป็นจริงมันเป็นวิธีที่น้อยกว่า 50 เนื่องจากอาจเป็นสีแดงสีขาวสีเหลือง ฯลฯ ความน่าจะเป็นที่รถที่สุ่มเลือกเป็นสีน้ำเงินนั้นมีค่าน้อยกว่า 50%
ผู้ใช้
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.