วิทยาศาสตร์คอมพิวเตอร์ information-theory

8

รหัสมอร์สที่ไม่มีช่องว่างสามารถถอดรหัสได้หรือไม่

สตริงรหัสมอร์สทั้งหมดสามารถถอดรหัสได้โดยไม่ซ้ำกันหรือไม่? ไม่มีช่องว่าง ......-...-..---.-----.-..-..-.. อาจเป็นได้Hello Worldแต่บางทีตัวอักษรตัวแรกคือ5- ในความเป็นจริงมันดูไม่น่าจะเป็นไปได้มากตามลำดับจุดและขีดคั่นควรมีการแปลที่เป็นเอกลักษณ์ อาจเป็นไปได้ว่าอาจใช้อสมการคราฟท์แต่ใช้กับรหัสนำหน้าเท่านั้น รหัสมอร์สที่มีช่องว่างเป็นรหัสนำหน้าซึ่งข้อความสามารถถอดรหัสได้ไม่ซ้ำกัน เมื่อเราลบช่องว่างออกแล้วสิ่งนี้จะไม่เป็นจริงอีกต่อไป ในกรณีที่ฉันถูกและข้อความรหัสมอร์สทั้งหมดไม่สามารถถอดรหัสได้โดยไม่ซ้ำมีวิธีการแสดงข้อความที่เป็นไปได้ทั้งหมดหรือไม่ นี่คือแบบฝึกหัดที่เกี่ยวข้องที่ฉันพบใน codegolf.SE https://codegolf.stackexchange.com/questions/36735/morse-decode-golf https://codegolf.stackexchange.com/questions/131/morse-code-translator

54 information-theory coding-theory

7

PRNG สามารถใช้ในการบีบอัดข้อมูลได้หรือไม่?

ความคิดนี้เกิดขึ้นกับฉันในขณะที่เด็กเรียนรู้ที่จะเขียนโปรแกรมและพบกับ PRNG เป็นครั้งแรก ฉันยังไม่รู้ว่ามันสมจริงแค่ไหน แต่ตอนนี้มีการแลกเปลี่ยนกองซ้อน นี่คือโครงร่างของอายุ 14 ปีสำหรับอัลกอริทึมการบีบอัดที่น่าทึ่ง: ใช้ PRNG และ seed ด้วย seed sเพื่อให้ได้ลำดับไบต์แบบสุ่มหลอกยาว ในการส่งลำดับนั้นไปยังบุคคลอื่นคุณต้องสื่อสารเพียงคำอธิบายของ PRNG เมล็ดที่เหมาะสมและความยาวของข้อความ สำหรับลำดับที่ยาวพอคำอธิบายนั้นจะสั้นกว่ามาก ตอนนี้สมมติว่าฉันสามารถกลับกระบวนการได้ เนื่องจากมีเวลาและทรัพยากรในการคำนวณเพียงพอฉันสามารถทำการค้นหาที่ดุร้ายและค้นหาเมล็ดพันธุ์ (และ PRNG หรือกล่าวอีกนัยหนึ่งว่า: โปรแกรม) ที่สร้างลำดับที่ฉันต้องการ (สมมติว่ารูปแมวน่ารักกำลังซุกซน) PRNG ทำซ้ำหลังจากสร้างบิตจำนวนมากพอ แต่เมื่อเทียบกับรอบ "ปกติ" ข้อความของฉันค่อนข้างสั้นดังนั้น dos นี้ดูเหมือนจะไม่เป็นปัญหามากนัก Voila วิธีบีบอัดข้อมูล ดังนั้นสมมติว่า: ลำดับที่ฉันต้องการบีบอัดมี จำกัด และทราบล่วงหน้า ฉันไม่สั้นเรื่องเงินสดหรือเวลา (แค่ต้องการจำนวน จำกัด ของทั้งสองอย่าง) ฉันอยากรู้: มีข้อบกพร่องพื้นฐานในการให้เหตุผลเบื้องหลังโครงการหรือไม่ วิธีมาตรฐานในการวิเคราะห์การทดลองทางความคิดเหล่านี้คืออะไร สรุป บ่อยครั้งที่คำตอบที่ดีไม่เพียง แต่ชัดเจนคำตอบเท่านั้น …

38 information-theory randomness data-compression pseudo-random-generators entropy

6

อัลกอริธึมการบีบอัดแบบ lossless ลดเอนโทรปีหรือไม่?

ตามที่Wikipedia : เอนโทรปีของแชนนอนวัดข้อมูลที่มีอยู่ในข้อความซึ่งตรงข้ามกับส่วนของข้อความที่ถูกกำหนด (หรือคาดเดาได้) ตัวอย่างหลัง ได้แก่ ความซ้ำซ้อนในโครงสร้างภาษาหรือคุณสมบัติทางสถิติที่เกี่ยวข้องกับความถี่ที่เกิดขึ้นของตัวอักษรคู่หรือคำคู่สามเท่าเป็นต้น ดังนั้นเอนโทรปีคือการวัดปริมาณข้อมูลที่มีอยู่ในข้อความ เอนโทรปี coders ถูกใช้เพื่อ losslessy บีบอัดข้อความเช่นนี้ไปยังจำนวนบิตขั้นต่ำที่จำเป็นในการแสดงมัน (เอนโทรปี) สำหรับฉันแล้วดูเหมือนว่าเอนโค้ดปีที่สมบูรณ์แบบจะเป็นสิ่งที่จำเป็นสำหรับการบีบอัดข้อความแบบไม่สูญเสียให้มากที่สุดเท่าที่จะทำได้ อัลกอริธึมการบีบอัดจำนวนมากใช้ขั้นตอนก่อนที่จะทำการเข้ารหัสเอนโทรปีเพื่อลดการส่งข้อความ ตามที่วิกิพีเดียภาษาเยอรมัน Entropiekodierer werden häufig mit anderen Kodierern kombiniert. คลิกที่นี่เพื่อดูข้อมูลเพิ่มเติมเกี่ยวกับ Verfahren dazu, Entropie der Daten zu verringern เป็นภาษาอังกฤษ: เอนโทรปีโคเดอร์มักจะถูกรวมเข้ากับเอนโค้ดเดอร์อื่น ๆ ขั้นตอนก่อนหน้านี้ทำหน้าที่ลดปริมาณข้อมูลของเอนโทรปี ie bzip2 ใช้ Burrows-Wheeler-Transform แล้วตามด้วย Move-to-Front-Transform ก่อนที่จะใช้การเข้ารหัสแบบเอนโทรปี (Huffman การเข้ารหัสในกรณีนี้) ขั้นตอนเหล่านี้ลดความเป็นเอนโทรปีของข้อความซึ่งจะลดปริมาณข้อมูลที่มีอยู่ในข้อความหรือไม่ ดูเหมือนจะขัดแย้งกับฉันเพราะนั่นหมายความว่าข้อมูลสูญหายระหว่างการบีบอัดป้องกันการบีบอัดแบบไม่สูญเสีย หรือพวกเขาเพียงแปลงข้อความเพื่อปรับปรุงประสิทธิภาพของอัลกอริทึมการเข้ารหัสเอนโทรปี? หรือเอนโทรปีไม่สอดคล้องกับปริมาณข้อมูลในข้อความโดยตรงหรือไม่?

35 information-theory data-compression entropy

2

จำลองความน่าจะเป็น 1 จาก 2 ^ N โดยมีบิตสุ่มน้อยกว่า N

บอกว่าฉันต้องจำลองการกระจายแบบไม่ต่อเนื่องดังนี้ P(X=k)={12N,1−12N,if k=1if k=0P(X=k)={12N,if k=11−12N,if k=0 P(X = k) = \begin{cases} \frac{1}{2^N}, & \text{if $k = 1$} \\ 1 - \frac{1}{2^N}, & \text{if $k = 0$} \end{cases} วิธีที่ชัดเจนที่สุดคือการวาดบิตสุ่มและตรวจสอบว่าทั้งหมดนั้นเท่ากับ (หรือ ) อย่างไรก็ตามทฤษฎีสารสนเทศกล่าวNNN000111 S=−∑iPilogPi=−12Nlog12N−(1−12N)log(1−12N)=12Nlog2N+(1−12N)log2N2N−1→0S=−∑iPilog⁡Pi=−12Nlog⁡12N−(1−12N)log⁡(1−12N)=12Nlog⁡2N+(1−12N)log⁡2N2N−1→0 \begin{align} S & = - \sum_{i} P_i \log{P_i} \\ & = - \frac{1}{2^N} \log{\frac{1}{2^N}} - \left(1 - \frac{1}{2^N}\right) …

31 algorithms information-theory randomness pseudo-random-generators entropy

6

การบีบอัดข้อมูลไบนารีอย่างง่าย

ฉันมีไฟล์ที่มีเลขฐานสองเรียงจากถึง2 n - 1 :0002n−12n−12^n - 1 0000000000 0000000001 0000000010 0000000011 0000000100 ... 1111111111 7zไม่บีบอัดไฟล์นี้อย่างมีประสิทธิภาพมาก (สำหรับ n = 20, 22 MB ถูกบีบอัดเป็น 300 kB) มีอัลกอริทึมที่สามารถรับรู้โครงสร้างข้อมูลที่ง่ายมากและบีบอัดไฟล์เป็นหลายไบต์หรือไม่? นอกจากนี้ฉันต้องการทราบว่าสาขาใดของ CS หรือทฤษฎีสารสนเทศศึกษาอัลกอริทึมอัจฉริยะเช่นนั้น "AI" กว้างเกินไปโปรดแนะนำคำหลักที่เป็นรูปธรรมมากขึ้น แนวคิดเรื่องความสมมาตรควรมีบทบาทพื้นฐานในการบีบอัดข้อมูล แต่เคียวรีค้นหา "สมมาตรในการบีบอัดข้อมูล" และ "ทฤษฎีกลุ่มในการบีบอัดข้อมูล" กลับมาอย่างน่าประหลาดใจแทบไม่มีอะไรเกี่ยวข้องเลย

27 information-theory data-compression

4

รหัสมอร์สเป็นไบนารีประกอบไปด้วยหรือ quinary?

ฉันกำลังอ่านหนังสือ: " รหัส: ภาษาที่ซ่อนอยู่ของฮาร์ดแวร์คอมพิวเตอร์และซอฟต์แวร์ " และในบทที่ 2 ผู้เขียนบอกว่า: รหัสมอร์สกล่าวกันว่าเป็นรหัสไบนารี่ (หมายถึงตัวอักษรสองต่อสอง) เพราะส่วนประกอบของรหัสประกอบด้วยเพียงสองสิ่ง - จุดและเส้นประ Wikipediaกล่าวว่า: พูดอย่างเคร่งครัดไม่ใช่ไบนารีเนื่องจากมีห้าองค์ประกอบพื้นฐาน (ดู quinary) อย่างไรก็ตามนี่ไม่ได้หมายความว่ารหัสมอร์สไม่สามารถแสดงเป็นรหัสไบนารี่ได้ ในแง่นามธรรมนี่คือฟังก์ชั่นที่ตัวดำเนินการโทรเลขดำเนินการเมื่อส่งข้อความ (ดูที่ quinary) แต่แล้วอีกครั้งหน้า Wikipedia อีกอันก็มีรหัสมอร์สใน 'รายชื่อรหัสไบนารี' ฉันสับสนมากเพราะฉันคิดว่ารหัสมอร์สเป็นจริงประกอบไปด้วย คุณมี 'ความเป็นไปได้ 3 ประเภทที่แตกต่างกัน: ความเงียบเสียงบี๊ปสั้นหรือเสียงบี๊บยาว เป็นไปไม่ได้ที่จะเป็นตัวแทนของรหัสมอร์สใน 'stirct binary' ใช่ไหม? โดย 'binary ที่เข้มงวด' ฉันหมายถึงคิดถึงกระแสของไบนารี: 1010111101010 .. ฉันควรจะเป็นตัวแทนของความเงียบเสียงบี๊ปสั้นและ / หรือเสียงบี๊บยาวอย่างไร วิธีเดียวที่ฉันคิดได้ก็คือ 'ขนาดของคำ' ที่คอมพิวเตอร์ใช้ ถ้าฉัน (และ CPU …

27 information-theory coding-theory encoding-scheme

5

การบีบอัดข้อมูลโดยใช้ตัวเลขเฉพาะ

ฉันเพิ่งพบบทความที่น่าสนใจต่อไปนี้ซึ่งอ้างว่าบีบอัดชุดข้อมูลแบบสุ่มได้อย่างมีประสิทธิภาพมากกว่า 50% เสมอโดยไม่คำนึงถึงประเภทและรูปแบบของข้อมูล โดยทั่วไปจะใช้หมายเลขเฉพาะเพื่อสร้างการแทนค่าของ data data ขนาด 4 ไบต์ซึ่งง่ายต่อการแตกไฟล์เนื่องจากทุกหมายเลขเป็นผลิตภัณฑ์เฉพาะของ primes เพื่อเชื่อมโยงลำดับเหล่านี้กับช่วงเวลาที่มันใช้พจนานุกรม คำถามของฉันคือ: เป็นไปได้จริง ๆ ตามที่ผู้เขียนแนะนำหรือไม่ ตามกระดาษที่ผลของพวกเขามีประสิทธิภาพมากและเสมอข้อมูลบีบอัดให้มีขนาดเล็ก ขนาดพจนานุกรมจะใหญ่หรือไม่ สิ่งนี้ไม่สามารถใช้ในการบีบอัดข้อมูลที่ถูกบีบอัดซ้ำโดยใช้อัลกอริทึมเดียวกันซ้ำได้หรือไม่ เป็นที่ชัดเจนและได้รับการพิสูจน์แล้วว่าเทคนิคดังกล่าว (ซึ่งข้อมูลที่ถูกบีบอัดถูกบีบอัดซ้ำหลาย ๆ ครั้งที่เป็นไปได้ลดขนาดไฟล์ลงอย่างมาก) เป็นไปไม่ได้ จริง ๆ แล้วจะไม่มี bijection ระหว่างชุดของข้อมูลสุ่มทั้งหมดและข้อมูลที่บีบอัด เหตุใดจึงรู้สึกเช่นนี้เป็นไปได้ แม้ว่าเทคนิคจะยังไม่สมบูรณ์แบบ แต่ก็สามารถปรับให้เหมาะสมและปรับปรุงให้ดีขึ้นอย่างเห็นได้ชัด ทำไมสิ่งนี้จึงไม่เป็นที่รู้จัก / ศึกษาอย่างกว้างขวางมากขึ้น? หากการอ้างสิทธิ์และผลการทดลองเหล่านี้เป็นจริงการคำนวณแบบใหม่นี้ไม่สามารถนำมาคำนวณได้หรือไม่

22 information-theory data-compression primes

4

การบีบอัดจำนวนเต็มสองจำนวนโดยไม่สนใจคำสั่ง

การเปรียบเทียบคู่ที่สั่ง (x, y) กับคู่ที่ไม่ได้เรียงลำดับ {x, y} (ชุด) จากนั้นข้อมูลตามหลักเหตุผลความแตกต่างเป็นเพียงหนึ่งบิตราวกับว่า x มาก่อนหรือ y ต้องการบิตเพียงเล็กน้อยในการเป็นตัวแทน ดังนั้นถ้าเราได้ชุด {x, y} โดยที่ x, y เป็นจำนวนเต็ม 32- บิตที่แตกต่างกันสองชุดเราสามารถแพ็คมันเป็น 63 บิต (แทนที่จะเป็น 64) ได้ไหม? คุณควรกู้คืนจำนวนเต็ม 32 บิตต้นฉบับจากผลลัพธ์ 63 บิต แต่ไม่สามารถกู้คืนคำสั่งซื้อได้

20 information-theory data-compression

5

ทำไมการเข้ารหัสด้วยแผ่นแบบครั้งเดียวเหมือนกันไม่ดี?

การเข้ารหัสข้อความมีเพียงครั้งแป้นkคุณทำ E n ค( ม. 1 , k ) = ม. 1 ⊕ kม.1ม.1m_1kkkEn c ( m1, k ) = m1⊕ kEnค(ม.1,k)=ม.1⊕kEnc(m_1,k) = m_1 \oplus k หากคุณใช้เดียวกันในการเข้ารหัสข้อความที่แตกต่างm 2คุณจะได้รับ E n c ( m 2 , k ) = m 2 ⊕ kและถ้าคุณทำ Xor ของ crypttext ทั้งสองคุณจะได้รับ ( m 1 ⊕ …

20 cryptography information-theory encryption

2

มีอะไรที่ยากกว่า: การสับสำรับที่เรียงแล้วหรือการเรียงสับแบบสับ

คุณมีอาร์เรย์ขององค์ประกอบที่แตกต่างกันคุณสามารถเข้าถึงตัวเปรียบเทียบ (ฟังก์ชันกล่องดำที่รับสององค์ประกอบaและbและคืนค่าจริง iff a < b ) และแหล่งบิตสุ่มอย่างแท้จริง (ฟังก์ชันกล่องดำไม่มีอาร์กิวเมนต์และคืนบิตสุ่มแบบสุ่มอย่างสม่ำเสมอ) พิจารณางานสองอย่างต่อไปนี้:nnnaaabbba<ba<ba < b อาร์เรย์ถูกเรียงในขณะนี้ ผลิตการเรียงสับเปลี่ยนที่เลือกแบบสุ่ม (หรือโดยประมาณอย่างสม่ำเสมอ) อาร์เรย์ประกอบด้วยการเรียงสับเปลี่ยนที่เลือกอย่างสม่ำเสมอโดยการสุ่มโดยธรรมชาติ สร้างอาร์เรย์ที่เรียงลำดับ คำถามของฉันคือ งานใดที่ต้องใช้พลังงานมากขึ้น ฉันไม่สามารถนิยามคำถามได้อย่างแม่นยำมากขึ้นเพราะฉันไม่รู้เกี่ยวกับการเชื่อมต่อระหว่างทฤษฎีสารสนเทศอุณหพลศาสตร์หรืออะไรก็ตามที่จำเป็นในการตอบคำถามนี้ อย่างไรก็ตามฉันคิดว่าคำถามสามารถสร้างได้อย่างชัดเจน (และหวังว่าจะมีคนช่วยฉันด้วยคำตอบนี้!) ตอนนี้อัลกอริทึมปรีชาของฉันคือพวกมันเท่ากัน ขอให้สังเกตว่าการเรียงลำดับทั้งหมดเป็นการสลับกลับกันและในทางกลับกัน การเรียงลำดับต้องใช้รถในขณะที่สับเพราะมันหยิบเปลี่ยนแปลงสุ่มจากn ! ตัวเลือกต้องใช้log n ! ≈ n log nบิตแบบสุ่ม ทั้งการสับและการเรียงต้องใช้n swapslogn!≈nlognlog⁡n!≈nlog⁡n\log n! \approx n \log nn!n!n!logn!≈nlognlog⁡n!≈nlog⁡n\log n! \approx n \log nnnn อย่างไรก็ตามฉันรู้สึกว่าควรมีคำตอบที่ใช้หลักการของ Landauerซึ่งบอกว่าต้องใช้พลังงานในการ "ลบ" เล็กน้อย ฉันคิดว่านี่หมายถึงการเรียงลำดับอาร์เรย์นั้นยากกว่าเพราะต้องใช้ …

18 algorithms algorithm-analysis information-theory permutations entropy

4

สามารถบีบอัดข้อมูลให้มีขนาดเล็กกว่าขีด จำกัด การบีบอัดข้อมูลของแชนนอนได้หรือไม่?

ฉันอ่านเกี่ยวกับอัลกอริธึมการบีบอัดข้อมูลและขีด จำกัด ทางทฤษฎีสำหรับการบีบอัดข้อมูล เมื่อเร็ว ๆ นี้ฉันพบวิธีการบีบอัดที่เรียกว่า "Combinatorial Entropy Encoding" แนวคิดหลักของวิธีนี้คือการเข้ารหัสไฟล์เป็นอักขระที่แสดงในไฟล์ความถี่และดัชนีของการเปลี่ยนแปลงอักขระของไฟล์เหล่านี้ เอกสารเหล่านี้อาจช่วยอธิบายวิธีการนี้: https://arxiv.org/pdf/1703.08127 http://www-video.eecs.berkeley.edu/papers/vdai/dcc2003.pdf https://www.thinkmind.org/download.php?articleid=ctrq_2014_2_10_70019 อย่างไรก็ตามในเอกสารแรกฉันได้อ่านว่าโดยใช้วิธีนี้พวกเขาสามารถบีบอัดข้อความบางส่วนให้น้อยกว่าขีด จำกัด แชนนอน (พวกเขาไม่ได้พิจารณาพื้นที่ที่จำเป็นในการบันทึกความถี่ของตัวละครและพื้นที่ที่จำเป็นในการบันทึกเมตาดาต้า ข้อมูลของไฟล์) ฉันคิดเกี่ยวกับมันและฉันพบว่าวิธีนี้จะไม่มีประสิทธิภาพมากสำหรับไฟล์ที่มีขนาดเล็กมาก แต่ในทางกลับกันมันอาจทำงานได้ดีกับไฟล์ขนาดใหญ่ ที่จริงฉันไม่เข้าใจอัลกอริธึมนี้หรือขีด จำกัด แชนนอนดีมากฉันแค่รู้ว่ามันคือผลรวมของความน่าจะเป็นของตัวละครแต่ละตัวคูณด้วยของความน่าจะเป็นแบบกลับกันlog2log2log_2 ดังนั้นฉันมีคำถาม: วิธีการบีบอัดนี้บีบอัดไฟล์ให้เล็กกว่าขีด จำกัด ของแชนนอนจริงๆหรือไม่? มีอัลกอริทึมการบีบอัดใด ๆ ที่บีบอัดไฟล์ให้น้อยกว่าขีด จำกัด แชนนอนหรือไม่ (คำตอบของคำถามนี้เท่าที่ฉันรู้คือไม่มี) วิธีการบีบอัดที่บีบอัดไฟล์ให้เล็กกว่าขีด จำกัด Shannon เคยมีอยู่หรือไม่? หากการเข้ารหัส combinatorial บีบอัดไฟล์เกินขีด จำกัด ของแชนนอนจริงๆแล้วมันเป็นไปไม่ได้ที่จะบีบอัดไฟล์ซ้ำแล้วซ้ำอีกจนกว่าจะถึงขนาดที่เราต้องการ?

17 information-theory data-compression

3

ความแตกต่างระหว่าง“ ข้อมูล” และ“ ข้อมูลที่เป็นประโยชน์” ในทฤษฎีข้อมูลอัลกอริทึม

ตามที่Wikipedia : อย่างไม่เป็นทางการจากมุมมองของทฤษฎีข้อมูลอัลกอริทึมเนื้อหาข้อมูลของสตริงนั้นเทียบเท่ากับความยาวของการแสดงตัวเองที่สั้นที่สุดที่เป็นไปได้ของสตริงนั้น คำจำกัดความที่ไม่เป็นทางการของ "ข้อมูลที่เป็นประโยชน์" คืออะไร? เหตุใด "ข้อมูลที่เป็นประโยชน์" จึงไม่ถือเป็นแนวคิดที่เป็นธรรมชาติหรือพื้นฐานมากขึ้น ไร้เดียงสาดูเหมือนว่าสตริงสุ่มล้วนๆต้องมีข้อมูลเป็นศูนย์ดังนั้นฉันจึงพยายามที่จะเข้าใจความจริงที่ว่ามันถูกพิจารณาว่ามีข้อมูลสูงสุดตามคำจำกัดความมาตรฐาน

16 information-theory terminology kolmogorov-complexity

1

การเข้ารหัสปริศนาซูโดกุที่มีประสิทธิภาพ

การระบุกริด 9x9 ใด ๆ จำเป็นต้องให้ตำแหน่งและค่าของแต่ละช่อง การเข้ารหัสnaïveสำหรับสิ่งนี้อาจให้ 81 (x, y, ค่า) triplets ต้องใช้ 4 บิตสำหรับแต่ละ x, y และค่า (1-9 = 9 ค่า = 4 บิต) รวมเป็น 81x4x3 = 972 บิต ด้วยการกำหนดหมายเลขแต่ละช่องสี่เหลี่ยมเราสามารถลดข้อมูลตำแหน่งเป็น 7 บิตปล่อยบิตสำหรับแต่ละตารางและรวม 891 บิต โดยการระบุคำสั่งที่กำหนดไว้ล่วงหน้าหนึ่งสามารถลดลงอย่างมากนี้เป็นเพียง 4 บิตสำหรับแต่ละค่ารวม 324 บิต อย่างไรก็ตามซูโดกุอาจมีตัวเลขที่ขาดหายไป นี่เป็นโอกาสที่จะลดจำนวนตัวเลขที่ต้องระบุ แต่อาจต้องใช้บิตเพิ่มเติมเพื่อระบุตำแหน่ง การใช้การเข้ารหัส 11 บิตของเรา (ตำแหน่งค่า) เราสามารถระบุตัวต่อด้วยเบาะแสกับ11nnn Nปริศนา)11n11n11nบิตเช่นตัวต่อน้อยที่สุด (17) ตัวต้องใช้ …

16 combinatorics modelling information-theory sudoku

3

แชนนอนเอนโทรปีของ 0.922, 3 ค่าที่แตกต่าง

กำหนดสตริงของค่าB C , นอนส์เอนโทรปีในฐานล็อก 2มาถึง0.922 จากสิ่งที่ฉันเข้าใจในฐาน 2 Shannon Entropy ได้ปัดเศษขึ้นเป็นจำนวนบิตขั้นต่ำในไบนารีเพื่อแสดงค่าเดียวAAAAAAAABCAAAAAAAABCAAAAAAAABC2220.9220.9220.922222 นำมาจากการแนะนำในหน้าวิกิพีเดียนี้: https://en.wikipedia.org/wiki/Entropy_%28information_theory%29 ดังนั้นค่าสามค่าสามารถแทนด้วยหนึ่งบิตได้อย่างไร AAA อาจเท่ากับ 111 , BBB อาจเป็น 000 ; แต่คุณจะเป็นตัวแทนของ CCCอย่างไร? ขอบคุณล่วงหน้า.

14 information-theory mathematical-foundations entropy binary

4

PRNG สำหรับสร้างตัวเลขด้วย n บิตตั้งค่า

ฉันกำลังเขียนโค้ดบางส่วนเพื่อสร้างข้อมูลไบนารี ฉันต้องการสร้างหมายเลข 64 บิตด้วยจำนวนบิตที่กำหนดโดยเฉพาะ แม่นยำยิ่งขึ้นขั้นตอนควรใช้เวลาและส่งกลับตัวเลข 64 บิตหลอกเทียมด้วยบิตตั้งค่าเป็นและส่วนที่เหลือตั้งค่าเป็น 00<n<640<n<640 < n < 64nnn111 แนวทางปัจจุบันของฉันเกี่ยวข้องกับสิ่งนี้: สร้าง pseudorandom 64 บิตจำนวนkkkk นับบิตในจัดเก็บผลในขkkkbbb ถ้า , เอาต์พุต ; มิฉะนั้นไปที่ 1b=nb=nb = nkkk ใช้งานได้ แต่ดูเหมือนไม่เหมาะสม มีอัลกอริธึม PRNG บางประเภทที่สามารถสร้างตัวเลขด้วยบิตเซตยิ่งกว่านี้หรือไม่?nnn

12 algorithms information-theory coding-theory pseudo-random-generators

คำถามติดแท็ก information-theory