ทำไมการสร้างบิตสุ่ม 8 ชุดใน (0, 255)


35

ฉันกำลังสร้างบิตสุ่ม 8 บิต (ทั้ง 0 หรือ 1) และต่อกันเข้าด้วยกันเพื่อสร้างหมายเลข 8 บิต การจำลองแบบหลามอย่างง่ายทำให้ได้การแจกแจงแบบสม่ำเสมอบนชุดแยก [0, 255]

ฉันพยายามหาเหตุผลว่าทำไมเรื่องนี้ถึงสมเหตุสมผลในหัวของฉัน ถ้าฉันเปรียบเทียบสิ่งนี้กับการโยนเหรียญ 8 เหรียญค่าที่คาดหวังจะไม่อยู่ที่ประมาณ 4 หัว / 4 ก้อยหรือไม่ ดังนั้นสำหรับฉันแล้วมันก็สมเหตุสมผลแล้วที่ผลลัพธ์ของฉันควรสะท้อนถึงจุดที่อยู่ตรงกลางของช่วง กล่าวอีกนัยหนึ่งเหตุใดลำดับของเลขศูนย์ 8 หรือ 8 อันดูเหมือนจะเท่ากันอย่างน่าจะเป็นลำดับที่ 4 และ 4 หรือ 5 และ 3 เป็นต้น สิ่งที่ฉันหายไปที่นี่?


17
ค่าที่คาดหวังของการแจกแจงของบิตในการสุ่มสม่ำเสมอช่วง [0,255] นั้นก็อยู่ที่ประมาณ 4 1's / 4 0
user253751

2
เพียงเพราะคุณให้น้ำหนักที่เท่ากันสำหรับแต่ละหมายเลข 0 ถึง 255 ไม่ได้หมายความว่าผลลัพธ์ของฟังก์ชั่น "ความแตกต่างระหว่างจำนวน 1s และ 0s" จะเกิดขึ้นเพียงครั้งเดียว ฉันสามารถให้น้ำหนักที่เท่ากันกับทุกคนในองค์กรของฉัน ไม่ได้หมายความว่าอายุของพวกเขาจะมีน้ำหนักเท่ากัน บางช่วงอายุอาจพบได้บ่อยกว่าคนอื่น ๆ แต่คน ๆ หนึ่งไม่ได้เป็นคนธรรมดากว่าคนอื่น
แบรดโทมัส

2
ลองคิดดูสิ ... บิตสุ่มอันแรกของคุณจะเป็นตัวกำหนดค่าบิต 7, 1 มีค่า 128 และ 0 เป็น 0 0 จาก 256 หมายเลขคุณมีโอกาส 50% ของจำนวนที่เป็น 0-127 ถ้า บิตคือ 0 และ 128-255 ถ้าบิตเป็น 1 สมมุติว่าเป็น 0 จากนั้นบิตถัดไปจะกำหนดว่าผลลัพธ์จะเป็น 0-63 หรือ 64-127 8 บิตทั้งหมดจำเป็นต้องใช้เพื่อสร้างหนึ่งใน 256 ผลลัพธ์ที่เท่ากัน คุณกำลังคิดที่จะเพิ่มผลรวมเช่นเดียวกับที่คุณทำกับลูกเต๋า อัตราต่อรองของการได้รับ 4 1 และ 4 0 นั้นสูงกว่าการได้รับ 8 1s แต่มีหลายวิธีที่พวกเขาสามารถจัดเรียงเพื่อให้ผลลัพธ์ที่แตกต่าง
Jason Goemaat

2
สมมติว่าคุณหมุนแม่พิมพ์ 256- ด้านที่มีป้ายหมายเลข 0 ถึง 255 คุณคาดหวังว่าจะมีการแจกแจงแบบเดียวกัน ทีนี้สมมติว่าคุณติดฉลากคนตายเพื่อให้ด้านหนึ่งบอกว่า 0, 8 ด้านพูด 1, 28 ด้านพูด 2, และอื่น ๆ ; แต่ละด้านตอนนี้มีป้ายกำกับด้วยจำนวนบิตในจำนวนที่เคยเป็นที่ด้านข้าง คุณกลิ้งตายอีกครั้ง ทำไมคุณถึงคาดหวังว่าจะได้การแจกแจงตัวเลขที่สม่ำเสมอจาก 0 ถึง 8
Eric Lippert

ถ้าการกระจายตัวเป็นแบบนี้ฉันก็สามารถทำเงินเดิมพันรูเล็ตได้มากหลังจากที่มี 7 สีแดงติดกัน 7 และ 1 มีโอกาสมากกว่า 8 และ 0 มากกว่า 8 เท่า! (ไม่สนใจ 0 แต่การเอียงนี้มีค่ามากกว่า 0 และ 00 เอียง)
Cruncher

คำตอบ:


61

TL; DR: ความคมชัดที่คมชัดระหว่างบิตและเหรียญคือในกรณีของเหรียญคุณไม่สนใจลำดับของผลลัพธ์ HHHHTTTT นั้นเหมือนกับ TTTTHHHH (ทั้งคู่มี 4 หัวและ 4 ก้อย) แต่ในหน่วยบิตคุณสนใจคำสั่ง (เพราะคุณต้องให้ "น้ำหนัก" กับตำแหน่งบิตเพื่อให้ได้ผลลัพธ์ 256 ผลลัพธ์) ดังนั้น 11110000 จึงแตกต่างจาก 00001111


คำอธิบายอีกต่อไป: แนวคิดเหล่านี้สามารถรวมเป็นหนึ่งได้อย่างแม่นยำมากขึ้นหากเราเป็นทางการมากขึ้นในการกำหนดกรอบปัญหา พิจารณาการทดลองที่จะเรียงลำดับของการทดลองแปดครั้งที่มีผลลัพธ์แบบแบ่งขั้วและความน่าจะเป็นของ "ความสำเร็จ" 0.5 และ "ความล้มเหลว" 0.5 และการทดลองนั้นเป็นอิสระ โดยทั่วไปแล้วผมจะโทรหานี้สำเร็จการทดลองทั้งหมดและความล้มเหลวและความน่าจะเป็นของความสำเร็จคือพีn n - k pknnkp

  • ในตัวอย่างเหรียญผล " heads, tails" ไม่สนใจลำดับของการทดลอง (4 หัวคือ 4 หัวไม่ว่าจะเกิดขึ้นตามลำดับ) และสิ่งนี้ทำให้คุณสังเกตเห็นว่า 4 หัวมีแนวโน้มมากกว่า 0 หรือ 8 หัว สี่หัวเป็นเรื่องธรรมดามากขึ้นเพราะมีหลายวิธีที่จะสร้างสี่หัว (TTHHTTHH หรือ HHTTHHTT ฯลฯ ) กว่ามีหมายเลขอื่น ๆ (8 หัวมีเพียงหนึ่งลำดับ) ทฤษฎีบททวินามให้หลายวิธีในการสร้างการกำหนดค่าที่แตกต่างกันเหล่านี้n - kknk

  • ในทางตรงกันข้ามคำสั่งนั้นมีความสำคัญต่อบิตเนื่องจากแต่ละสถานที่มี "น้ำหนัก" หรือ "ค่าสถานที่" ที่เกี่ยวข้อง หนึ่งในคุณสมบัติของค่าสัมประสิทธิ์ทวินามคือนั่นคือถ้าเรานับขึ้นแตกต่างกันทั้งหมดที่สั่งซื้อลำดับที่เราได้รับ2นี้เชื่อมต่อโดยตรงกับความคิดของวิธีการหลายวิธีที่แตกต่างกันมีเพื่อให้หัวทดลองทวินามไปยังหมายเลขของลำดับไบต์ที่แตกต่างกัน2n=k=0n(nk)k n28=256kn

  • นอกจากนี้เราสามารถแสดงให้เห็นว่าผลลัพธ์ 256 รายการมีแนวโน้มที่เท่าเทียมกันโดยคุณสมบัติของความเป็นอิสระ การทดลองก่อนหน้านี้ไม่มีผลต่อการทดลองครั้งต่อไปดังนั้นความน่าจะเป็นของการสั่งซื้อโดยเฉพาะคือโดยทั่วไปแล้ว (เนื่องจากความน่าจะเป็นร่วมของกิจกรรมอิสระเป็นผลมาจากความน่าจะเป็น) เนื่องจากการทดลองมีความยุติธรรมการแสดงออกนี้จะลดลงเหลือ{256} เนื่องจากการเรียงลำดับทั้งหมดมีความน่าจะเป็นแบบเดียวกันเราจึงมีการแจกแจงแบบสม่ำเสมอเหนือผลลัพธ์เหล่านี้ (ซึ่งการเข้ารหัสแบบไบนารีสามารถแสดงเป็นจำนวนเต็มใน ) P ( สำเร็จ) = P ( ล้มเหลว) = p = 0.5 P ( ลำดับใด ๆ) = 0.5 8 = 1pk(1p)nkP(success)=P(fail)=p=0.5 [0,255]P(any ordering)=0.58=1256[0,255]

  • ในที่สุดเราสามารถนำวงกลมนี้กลับไปที่การโยนเหรียญและการแจกแจงทวินาม เรารู้ว่าการเกิดขึ้นของ 0 หัวไม่มีความน่าจะเป็นเช่นเดียวกับ 4 หัวและนั่นเป็นเพราะมีวิธีที่แตกต่างกันในการสั่งซื้อการเกิดขึ้นของ 4 หัวและจำนวนของการเรียงลำดับดังกล่าวจะได้รับจากทฤษฎีบททวินาม ดังนั้นจะต้องมีการถ่วงน้ำหนักอย่างใดโดยเฉพาะมันจะต้องมีการถ่วงน้ำหนักโดยค่าสัมประสิทธิ์ทวินาม ดังนั้นนี้จะช่วยให้เรา PMF ของการกระจายทวินามที่{} อาจเป็นเรื่องที่น่าแปลกใจที่นิพจน์นี้เป็น PMF โดยเฉพาะเนื่องจากไม่ชัดเจนว่าเป็นผลรวม 1 หากต้องการตรวจสอบเราต้องตรวจสอบว่าP ( k  สำเร็จ) = ( nP(4 heads) n k = 0 ( nP(k successes)=(nk)pk(1p)nkk=0n(nk)pk(1p)nk=1อย่างไรก็ตามนี่เป็นเพียงปัญหาของสัมประสิทธิ์ทวินาม:{}1=1n=(p+1p)n=k=0n(nk)pk(1p)nk


มันสมเหตุสมผลแล้ว แต่เราจะไม่คาดหวังว่า 15, 30, 60, 120 และ 240 จะมีการกระจายน้ำหนักที่สูงกว่า 0 หรือ 255?
glassy

1
ฉันคิดว่าฉันเข้าใจแล้ว ฉันจะยอมรับคำตอบนี้เพราะฉันคิดว่ากุญแจที่นี่คือคำสั่งที่คุณเรียกความสนใจ ขอบคุณ
glassy

หมายเหตุอีกข้อหนึ่ง - เพื่อใช้ตัวอย่างเหรียญของฉันนี่คือการโยนเหรียญ 8 เหรียญในเวลาเดียวกันเมื่อเทียบกับการทดลองเหรียญที่พลิกเหรียญ 8 ครั้ง ในนั้นโกหกความสับสนของฉัน
glassy

2
แนวคิดของ "ค่าสถานที่" จาก "คณิตศาสตร์ระดับประถมศึกษา" มีผลบังคับใช้โดยเฉพาะที่นี่ เพื่อใช้การเปรียบเทียบทศนิยมหนึ่งพิจารณา10001000และ10000001เป็นตัวเลขที่แตกต่างกันมาก
JM ไม่ใช่นักสถิติเมื่อ

17

เหตุใดลำดับของ 8 ศูนย์หรือ 8 อันดูเหมือนจะเท่ากันอย่างน่าจะเป็นลำดับของ 4 และ 4 หรือ 5 และ 3 เป็นต้น

aparent Paradox สามารถสรุปได้ในข้อเสนอสองข้อซึ่งอาจดูขัดแย้งกัน:

  1. ลำดับ (เลขศูนย์แปดตัว) มีความเป็นไปได้พอ ๆ กันกับลำดับ (ศูนย์สี่ศูนย์สี่อัน) (โดยทั่วไป: ลำดับมีความน่าจะเป็นเหมือนกันโดยไม่คำนึงถึงจำนวนเลขศูนย์ / คนที่มี)s 2 : 01010101s1:00000000s2:0101010128

  2. เหตุการณ์ " : ลำดับมีสี่ศูนย์ " เป็นไปได้มากขึ้น (แน่นอนมากขึ้นเท่า) กว่าเหตุการณ์ " : ลำดับมีแปดศูนย์ " 70 e 2e170e2

ข้อเสนอเหล่านี้เป็นจริงทั้งคู่ เนื่องจากเหตุการณ์มีหลายลำดับe1


8

ทั้งหมดของลำดับมีความน่าจะเป็นเหมือนกัน 1/ = 1/256 มันเป็นความผิดที่จะคิดว่าลำดับที่มีความใกล้ชิดกับจำนวนที่เท่ากันของ 0s และ 1s มากขึ้นน่าจะเป็นคำถามที่ถูกตีความ .. มันควรจะเป็นที่ชัดเจนว่าเรามาถึงที่ 1/256 เพราะเราถือว่าเป็นอิสระจากการทดลองไปทดลองใช้ นั่นคือเหตุผลที่เราคูณความน่าจะเป็นและผลลัพธ์ของการทดลองครั้งเดียวไม่มีผลต่อการทดลองครั้งถัดไป2 82828


2
นี่คงจะโอเคถ้าสั้นตอบ ... ถ้าคำถามไม่ได้รวมคำว่า "ทำไม" ตามที่เป็นอยู่คุณเพียงแค่ย้ำหนึ่งใน givens ในคำถามโดยไม่มีคำอธิบาย
Tin Man

1
ที่จริง ... คำตอบนี้ผิดจริงโปรดดูคำตอบของ leonbloy สำหรับสาเหตุ
Tin Man

3
@ จะไม่ถูกต้อง ความฉลาดของภาษา ลำดับที่กำหนดไม่น่าจะเป็นเพราะมีความไม่สมดุลระหว่าง 0 ถึง 1 มีเพียงมีลำดับดังกล่าวมากขึ้น
ฮอบส์

4
มีใครเห็นด้วยกับฉันบ้างไหม ถ้ามีความน่าจะเป็น 0 1/2 และ 1 มีความน่าจะเป็น 1/2 และระยะหนึ่งในลำดับที่มีความเป็นอิสระของการต่อไปน่าจะเป็นของการให้ลำดับของความยาว 8 มีความน่าจะเป็น1/2และลำดับอื่น ๆ ของ 81/28=1/256
Michael Chernick

4
@Michael ฉันเห็นด้วยอย่างเต็มที่และยินดีที่ได้เห็น - ในที่สุด! - การอุทธรณ์อย่างชัดเจนต่อหัวใจของเรื่อง: ความเป็นอิสระ ฉันยินดีที่จะยกเลิกคำตอบของคุณหากคุณต้องการรวมความคิดเห็นนั้นไว้ด้วย
whuber

7

ตัวอย่างที่มี 3 บิต (มักเป็นตัวอย่างที่แสดงให้เห็นมากกว่า)

ฉันจะเขียนตัวเลขธรรมชาติ 0 ถึง 7 เป็น:

  • ตัวเลขในฐาน 10
  • ตัวเลขในฐาน 2 (เช่นลำดับของบิต)
  • ชุดของเหรียญพลิกโดยนัยโดยการเป็นตัวแทนฐาน 2 (1 หมายถึงการพลิกของหัวและ 0 หมายถึงการพลิกของหาง)

Base 10Base 2 (with 3 bits)Implied Coin Flip SeriesHeadsTails0000TTT031001TTH122010THT123011THH214100HTT125101HTH216110HHT217111HHH30

การเลือกจำนวนธรรมชาติตั้งแต่ 0 ถึง 7 ที่มีความน่าจะเป็นเท่ากับจะเท่ากับการเลือกหนึ่งในซีรีย์การโยนเหรียญทางด้านขวาด้วยความน่าจะเป็นที่เท่ากัน

ดังนั้นถ้าคุณเลือกตัวเลขจากการแจกแจงเครื่องแบบเหนือเลขจำนวนเต็ม 0-7 คุณมีโอกาสในการเลือก 3 หัวโอกาสในการเลือก 2 หัวโอกาสในการเลือก 1 หัวและโอกาสในการเลือก 0 หัว18383818


3

คำตอบของ Sycorax นั้นถูกต้อง แต่ดูเหมือนว่าคุณยังไม่ชัดเจนว่าทำไม เมื่อคุณพลิก 8 เหรียญหรือสร้าง 8 บิตสุ่มโดยคำนึงถึงผลลัพธ์ของคุณจะเป็นหนึ่งใน 256 โอกาสที่เท่าเทียมกัน ในกรณีของคุณผลลัพธ์ที่เป็นไปได้ 256 รายการเหล่านี้จะจับคู่กับจำนวนเต็มโดยไม่ซ้ำกันดังนั้นคุณจะได้ผลการแจกแจงแบบเดียวกัน

หากคุณไม่คำนึงถึงคำสั่งซื้อเช่นพิจารณาจำนวนหัวหรือก้อยที่คุณได้รับมีผลลัพธ์ที่เป็นไปได้เพียง 9 ข้อเท่านั้น (0 หัว / 8 ก้อย - 8 หัว / 0 ก้อย) และพวกมันจะไม่เท่ากัน . เหตุผลนี้เป็นเพราะผลลัพธ์ 256 รายการที่เป็นไปได้มีการรวมกันของการโยน 1 ครั้งที่ให้ 8 หัว / 0 ก้อย (HHHHHHHHH) และ 8 การรวมกันที่ให้ 7 หัว / 1 ก้อย (ก้อยในแต่ละตำแหน่ง 8 ใน คำสั่ง) แต่ 8C4 = 70 วิธีในการมี 4 หัวและ 4 ก้อย ในกรณีการโยนเหรียญชุดค่าผสมทั้ง 70 ชุดจับคู่กับ 4 หัว / 4 ก้อย แต่ในปัญหาเลขฐานสองแต่ละชุดผลลัพธ์ 70 ชุดจะจับคู่กับเลขจำนวนเต็มเฉพาะ


2

ปัญหาที่ได้รับการปรับปรุงใหม่คือ: ทำไมจำนวนของการรวมกันของเลขฐานสองแบบสุ่ม 8 หลักที่นำมาเป็น 0 ถึง 8 หลักที่เลือก (เช่น 1 ของ) ในเวลาที่แตกต่างจากจำนวนของพีชคณิตของเลขฐานสองแบบสุ่ม 8 หลัก ในบริบทนี้การเลือกแบบสุ่มของ 0 และ 1 หมายถึงแต่ละหลักมีความเป็นอิสระจากกันดังนั้นตัวเลขจะไม่เกี่ยวข้องและ ; .p(0)=p(1)=12

คำตอบคือ: มีการเข้ารหัสสองแบบที่แตกต่างกัน 1) การเข้ารหัส lossless ของการเรียงสับเปลี่ยนและ 2) การเข้ารหัส lossy ของการรวมกัน

โฆษณา 1) เพื่อเข้ารหัสแบบไม่สูญเสียตัวเลขเพื่อให้แต่ละลำดับไม่ซ้ำกันเราสามารถดูหมายเลขนั้นว่าเป็นเลขจำนวนเต็มไบนารีโดยที่อยู่ทางซ้าย ไปทางขวาจิตในลำดับเลขฐานสองของการสุ่ม 0 และ 1 สิ่งที่ทำให้การเปลี่ยนรูปแต่ละครั้งไม่ซ้ำกันเนื่องจากแต่ละหลักสุ่มจะถูกเข้ารหัสตำแหน่ง และจำนวนพีชคณิตทั้งหมดเท่ากับi=182i1XiXiith28=256. จากนั้นหนึ่งสามารถแปลเลขฐานสองเหล่านั้นเป็นฐาน 10 หมายเลข 0 ถึง 255 โดยไม่สูญเสียความเป็นเอกลักษณ์หรือสำหรับเรื่องนั้นสามารถเขียนหมายเลขนั้นโดยใช้การเข้ารหัสแบบไม่สูญเสียอื่น ๆ (เช่นข้อมูลที่บีบอัดแบบไม่สูญเสีย Hex, Octal) อย่างไรก็ตามคำถามตัวเองเป็นเลขฐานสอง การเปลี่ยนแปลงแต่ละครั้งนั้นมีความเป็นไปได้อย่างเท่าเทียมกันเนื่องจากมีเพียงวิธีเดียวเท่านั้นที่แต่ละลำดับการเข้ารหัสที่ไม่ซ้ำกันสามารถสร้างขึ้นได้และเราได้สันนิษฐานว่าการปรากฏตัวของ 1 หรือ 0 นั้นมีโอกาสเท่ากันทุกที่ภายในสตริงนั้น

โฆษณา 2) เมื่อการเข้ารหัสแบบไม่สูญเสียถูกยกเลิกโดยพิจารณาจากชุดค่าผสมเท่านั้นเราจึงมีการเข้ารหัสแบบสูญเสียซึ่งจะรวมผลลัพธ์และข้อมูลสูญหาย จากนั้นเราจะดูชุดตัวเลข, wlog เป็นจำนวนของ 1; ซึ่งจะลดลงเหลือจำนวนการรวมกันของวัตถุ 8 รายการที่รวม ในเวลาและสำหรับปัญหาที่แตกต่างกันความน่าจะเป็นที่แน่นอนของ 4 1 คือ 70 (การได้รับ 8 1 เนื่องจากมี 70 มีโอกาสเท่ากัน พีชคณิตที่สามารถผลิต 4 1 ของ C ( 8 , 8 i = 1 X i ) 8 i = 1 X i C ( 8 , 4 )i=1820XiC(8,i=18Xi)i=18XiC(8,4)

หมายเหตุ: ณ เวลาปัจจุบันคำตอบข้างต้นเป็นคำตอบเดียวที่มีการเปรียบเทียบการคำนวณอย่างชัดเจนของการเข้ารหัสทั้งสองและคำตอบเดียวที่กล่าวถึงแนวคิดของการเข้ารหัส ใช้เวลาสักครู่จึงทำให้ถูกต้องซึ่งเป็นเหตุผลว่าทำไมคำตอบนี้จึงถูกลดระดับลง หากมีข้อร้องเรียนที่โดดเด่นใด ๆ แสดงความคิดเห็น

อัปเดต: ตั้งแต่การอัปเดตครั้งล่าสุดฉันรู้สึกยินดีที่เห็นว่าแนวคิดของการเข้ารหัสเริ่มขึ้นแล้วในคำตอบอื่น ๆ เพื่อแสดงสิ่งนี้อย่างชัดเจนสำหรับปัญหาปัจจุบันฉันได้แนบจำนวนวิธีเรียงสับเปลี่ยนที่เข้ารหัสสูญหายในแต่ละชุดป้อนคำอธิบายรูปภาพที่นี่

โปรดทราบว่าจำนวนไบต์ของข้อมูลที่สูญหายระหว่างการเข้ารหัส combinatorial แต่ละครั้งจะเท่ากับจำนวนการเปลี่ยนลำดับของชุดค่านั้นลบหนึ่ง [โดยที่คือจำนวน 1 ของ] เช่นสำหรับปัญหานี้ จากถึงต่อชุดค่าผสมหรือโดยรวมn 0 69 256 - 9 = 247C(8,n)1n0692569=247


2
การใช้วิธีการทั่วไปในการตั้งชื่อหมายเลข - โดยไม่ต้องอ้างอิงทั้งหมดกับศูนย์ก่อนหน้านี้ - อาจทำให้สับสนคำอธิบายนี้ คุณไม่คิดว่าสถานการณ์จะกลายเป็นที่ชัดเจนมากขึ้นโดยการเขียนเป็น, (ซึ่งคุณมองข้ามโดยไม่ได้ตั้งใจ) เป็น, และอื่น ๆ ? 1000000000100000001
whuber

16
ตรงไปตรงมานี้เป็นข้อมูลที่ถูกต้องเท่าที่มันจะไป แต่ก็ไม่ได้อยู่ที่คำถาม คุณทำหน้าที่ได้ดีในการแสดงว่าบิตที่สั่งซื้อแปดบิตสามารถแสดงตัวเลขในช่วงได้อย่างไร แต่ยังไม่ได้อธิบายว่าทำไมการเลือกบิตเหล่านั้นโดยการสุ่มให้การกระจายแบบสม่ำเสมอ (สิ่งที่ยอมรับได้ง่ายมากที่อธิบายได้อย่างชัดเจน) ความละเอียดอ่อน)
dmckee

9
มันจะง่ายกว่าหรือที่จะบอกว่าบิตสุ่ม (อิสระ) 8 บิตมีการกระจายอย่างสม่ำเสมอใน [00000000, 11111111] ด้วยเหตุผลเดียวกับที่มีการสุ่มตัวเลข 3 หลักใน [000, 999] ด้านพูดจาโผงผางเกี่ยวกับวิธี / ทำไมคอมพิวเตอร์ใช้ไบนารีและฐานเศษส่วนไม่จำเป็นโดยสิ้นเชิงและไม่เกี่ยวข้อง ฉันหมายถึงความจริงที่ว่าไบนารีใช้เพียงสัญลักษณ์ 0 และ 1 เป็นเพียงคุณสมบัติโดยธรรมชาติของฐาน 2 ... ไม่จำเป็นต้องอธิบาย หากคุณต้องการเก็บคำอธิบายไว้ในนั้นอาจเป็นประโยชน์มากกว่าที่จะอธิบายว่าฐานทำงานโดยทั่วไปอย่างไร แต่ก็ยังคงอยู่ด้านข้าง
Blackhawk

3
ฉันดีใจที่ได้เห็นว่าคำตอบนี้พัฒนาขึ้นเท่าใด อย่างไรก็ตามฉันมีปัญหาในการดูว่าตัวแทน 10 ฐานจะทำอย่างไรกับคำถามนี้ (จะไม่ทำงานที่ฐาน 3 หรือฐาน 17 ได้เช่นกัน?) และฉันไม่สามารถเห็นสิ่งที่อาจเป็นพิเศษเกี่ยวกับ 8 บิตที่ไม่ได้ พูดคุยกับจำนวน จำกัด บิตใด ๆ นั่นเป็นการชี้ให้เห็นว่าสิ่งที่ต้องพิจารณาในคำตอบนี้ส่วนใหญ่จะเป็นแบบสัมผัสหรือไม่เกี่ยวข้อง
whuber

3
และฉันขอขอบคุณสำหรับการแสดงลักษณะที่สับสนของความสับสนที่แสดงออกในคำถาม: การเข้ารหัส "lossy" และ "lossless" มันน่าจดจำแตกต่างจากมุมมองอื่น ๆ ลึกซึ้งและอาจทำให้สับสนได้อย่างรวดเร็ว
whuber

1

ฉันต้องการขยายแนวคิดเรื่องการพึ่งพาคำสั่งกับความเป็นอิสระ

ในปัญหาของการคำนวณจำนวนที่คาดหวังจากการพลิก 8 เหรียญเราจะรวมค่าจากการแจกแจงที่เหมือนกัน 8 แบบซึ่งแต่ละอันคือการแจกแจงเบอร์นูลี่[; B(1, 0.5) ;](กล่าวอีกนัยหนึ่งคือโอกาส 50% ของ 0, โอกาส 50% ของ 1) การกระจายตัวของผลรวมคือการกระจายแบบทวินาม[; B(8, 0.5) ;]ซึ่งมีรูปร่างโคกที่คุ้นเคยซึ่งมีความน่าจะเป็นส่วนใหญ่อยู่ที่ประมาณ 4

ในปัญหาของการคำนวณค่าที่คาดหวังของไบต์ที่ทำจาก 8 บิตสุ่มแต่ละบิตมีค่าแตกต่างกันที่มันก่อให้เกิดไบต์ดังนั้นเราจึงรวมค่าจาก 8 การกระจายที่แตกต่างกัน ครั้งแรกเป็น[; B(1, 0.5) ;]ที่สองคือ[; 2 B(1, 0.5) ;]ที่สามคือเพื่อให้ได้ถึงแปดซึ่งเป็น[; 4 B(1, 0.5) ;] [; 128 B(1, 0.5) ;]การกระจายตัวของนี้รวมเป็นความเข้าใจค่อนข้างแตกต่างจากคนแรก

ถ้าคุณต้องการพิสูจน์ว่าการกระจายตัวหลังนี้เหมือนกันฉันคิดว่าคุณสามารถทำได้โดยการเหนี่ยวนำ - การกระจายตัวของบิตที่ต่ำที่สุดคือสม่ำเสมอด้วยช่วง 1 โดยสมมติฐานดังนั้นคุณต้องการแสดงให้เห็นว่าหากการกระจายของ[; n ;]บิตที่ต่ำที่สุดเป็นชุดที่มีช่วงจาก[; 2^n - 1} ;]นั้นการเพิ่มของ[; n+1 ;]st bit ทำให้การกระจายของ[; n + 1 ;]บิตที่ต่ำที่สุดสม่ำเสมอด้วยช่วงของ[; 2^{n+1} - 1 ;]การบรรลุการพิสูจน์สำหรับการบวกทั้งหมด[; n ;]. แต่วิธีที่ใช้งานง่ายน่าจะเป็นสิ่งที่ตรงกันข้าม หากคุณเริ่มต้นที่บิตสูงและเลือกค่าทีละครั้งลงไปที่บิตต่ำแต่ละบิตจะแบ่งพื้นที่ของผลลัพธ์ที่เป็นไปได้ครึ่งหนึ่งและแต่ละครึ่งจะถูกเลือกด้วยความน่าจะเป็นที่เท่ากันดังนั้นเมื่อถึงเวลา ด้านล่างค่าแต่ละค่าจะต้องมีความน่าจะเป็นที่จะเลือกเหมือนกัน


มันไม่ได้เป็นเครื่องแบบอย่างต่อเนื่อง บิตเป็นทั้ง 0 หรือ 1 และไม่มีอะไรในระหว่าง
Michael Chernick

@Michael แน่นอนว่าเราจัดการกับการแจกแจงแบบแยกเท่านั้นที่นี่
ฮอบส์

OP กล่าวว่าบิตเป็นเพียง 1 หรือ 0 และไม่มีอะไรอยู่ระหว่างนั้น
Michael Chernick

1
@MichaelChernick ถูกต้อง
ฮอบส์

1

หากคุณทำการค้นหาแบบไบนารีเปรียบเทียบแต่ละบิตคุณต้องมีจำนวนขั้นตอนเท่ากันสำหรับแต่ละ 8 บิตจาก 0000 0000 ถึง 1111 1111 พวกเขาทั้งสองมีความยาว 8 บิต ในแต่ละขั้นตอนในการค้นหาแบบไบนารีทั้งสองฝ่ายมีโอกาส 50/50 ที่จะเกิดขึ้นดังนั้นในท้ายที่สุดเพราะทุกหมายเลขมีความลึกเท่ากันและความน่าจะเป็นที่เหมือนกันโดยไม่มีทางเลือกจริง ๆ แต่ละหมายเลขจะต้องมีน้ำหนักเท่ากัน ดังนั้นการกระจายจะต้องเหมือนกันแม้ว่าแต่ละบิตจะถูกกำหนดโดยการโยนเหรียญ

อย่างไรก็ตามตัวเลขของตัวเลขไม่เหมือนกันและจะเท่ากันในการกระจายการโยน 8 เหรียญ


1

มีเพียงลำดับเดียวที่มีเลขศูนย์แปดตัว มีเจ็ดสิบลำดับด้วยสี่ศูนย์และสี่คน

ดังนั้นในขณะที่ 0 มีความน่าจะเป็น 0.39% และ 15 [00001111] ยังมีความน่าจะเป็นที่ 0.39% และ 23 [00010111] มีความน่าจะเป็น 0.39% ฯลฯ หากคุณรวมความน่าจะเป็นทั้งหมด 0.39% ทั้งหมดเจ็ดสิบ คุณได้ 27.3% ซึ่งเป็นความน่าจะเป็นที่มีสี่อัน ความน่าจะเป็นของผลลัพธ์สี่และสี่ของแต่ละบุคคลไม่จำเป็นต้องสูงกว่า 0.39% สำหรับการทำงาน


สิ่งนี้ไม่เปลี่ยนความจริงที่ว่า 256 ลำดับทั้งหมดน่าจะเท่ากัน
Michael Chernick

@MichaelChernick ฉันไม่ได้พูดแบบนั้นฉันบอกอย่างชัดเจนว่าพวกเขาทุกคนมีความน่าจะเป็น 0.39% ฉันกำลังพูดถึงสมมติฐานของ OP
Random832

คุณพูดถูก เป็นอีกวิธีหนึ่งในการพูดสิ่งที่ฉันพูดในคำตอบของฉัน คำตอบอื่น ๆ บางอย่างผิดไป
Michael Chernick

1

พิจารณาลูกเต๋า

ลองนึกถึงการโยนลูกเต๋าสองสามตัวอย่างทั่วไปของการแจกแบบไม่สม่ำเสมอ เพื่อประโยชน์ของคณิตศาสตร์ที่คิดลูกเต๋าที่มีเลข 0-5 แทน 1 ถึง 6 เหตุผลแบบการกระจายไม่สม่ำเสมอคือการที่คุณกำลังมองหาที่ผลรวมของม้วนลูกเต๋าที่อยู่รวมกันหลายคนสามารถให้ผลผลิต ผลรวมเดียวกันเช่น {5, 0}, {0, 5}, {4, 1} และอื่น ๆ ทั้งหมดสร้าง 5

อย่างไรก็ตามหากคุณต้องตีความการทอยลูกเต๋าเป็นตัวเลขสุ่ม 2 หลักในฐาน 6 การรวมลูกเต๋าที่เป็นไปได้แต่ละครั้งจะไม่ซ้ำกัน {5, 0} จะเป็น 50 (ฐาน 6) ซึ่งจะเป็น 5 * ( ) + 0 * ( ) = 30 (ฐาน 10) {0, 5} จะเป็น 5 (ฐาน 6) ซึ่งจะเป็น 5 * ( ) = 5 (ฐาน 10) ดังนั้นคุณจะเห็นได้ว่ามีการแมป 1 ถึง 1 ของการทอยลูกเต๋าที่เป็นไปได้ตีความว่าเป็นตัวเลขในฐาน 6 เทียบกับการทำแผนที่หลายต่อ 1 สำหรับผลรวมของลูกเต๋าสองลูกต่อม้วน6 0 6 0616060

ในฐานะที่เป็นทั้ง @Sycorax และ @Blacksteel ชี้ให้เห็นถึงความแตกต่างนี้ทำให้เกิดคำถามตามลำดับ


0

แต่ละบิตที่คุณเลือกนั้นเป็นอิสระจากกันและกัน หากคุณพิจารณาบิตแรกจะมี

  • ความน่าจะเป็น 50% จะเป็น 1

และ

  • ความน่าจะเป็น 50% จะเป็น 0

สิ่งนี้ยังใช้กับบิตที่สองบิตที่สามและอื่น ๆ เพื่อที่คุณจะได้จบดังนั้นสำหรับแต่ละชุดที่เป็นไปได้ของบิตที่จะทำให้ไบต์ของคุณคุณมี =โอกาสจำนวนเต็ม 8 บิตที่ไม่ซ้ำกันเกิดขึ้น1(12)81256


ข้อความทั้งหมดนี้เป็นจริง แต่ไม่ได้ระบุว่าทำไมการโยนเหรียญซึ่งเป็นธรรมและเป็นอิสระมีเพียง 9 ผลลัพธ์ที่แตกต่างเมื่อผลลัพธ์ถูกกำหนดเป็นจำนวนของหัวและก้อย
Reinstate Monica

นั่นเป็นเพียงผลลัพธ์ของการวางผลลัพธ์ลงในระบบสั่งซื้อหลังจากเลือกพวกเขา การแจกแจงแบบเดียวกันจะเกิดขึ้นได้แม้ว่าบิตสุ่มจะถูกวางลงในตำแหน่งสุ่มบนไบต์ นอกจากนี้คุณยังจะได้รับการแจกจ่ายแบบเดียวกันกับการโยนเหรียญโดยวิธีที่คุณวางกรอบคำถามเพื่อค้นหาโอกาสที่จะได้รับชุดหัวและก้อยเช่น HHTHTTTH คุณจะมีโอกาส 1/256 ในการรับลำดับการโยนเหรียญที่แน่นอนสำหรับการโยนเหรียญ 8 ครั้งในแต่ละครั้ง
Ahemone

นี่คือข้อมูลที่ดีทั้งหมดที่จะรวมไว้ในคำตอบของตัวเอง ความคิดเห็นของฉันไม่ได้มีปัญหากับสิ่งที่คุณพูดมากเท่าการละเว้นที่อยู่โดยตรงของแหล่งที่มาของความสับสนของ OP: ความสัมพันธ์ระหว่างบิตและเหรียญพลิก
Reinstate Monica

ฉันควรจะพูดด้วยเพื่อให้ได้ค่าที่คาดหวังของ OP เท่ากับ 4 พวกเขากำลังพยายามหาความน่าจะเป็นที่ n หรือ 1 ของจำนวนมากในจำนวนไบต์ที่กำหนด การวางกรอบคำถามนี้จะให้การแจกแจงแบบทวินามที่พวกเขาคาดหวังไว้ในใจมากกว่าการกระจายแบบสม่ำเสมอในการค้นหาความน่าจะเป็นที่จะได้รับค่าบางอย่างจากบิตสุ่มเหล่านั้น
Ahemone
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.