รหัสมอร์สเป็นไบนารีประกอบไปด้วยหรือ quinary?


27

ฉันกำลังอ่านหนังสือ: " รหัส: ภาษาที่ซ่อนอยู่ของฮาร์ดแวร์คอมพิวเตอร์และซอฟต์แวร์ " และในบทที่ 2 ผู้เขียนบอกว่า:

รหัสมอร์สกล่าวกันว่าเป็นรหัสไบนารี่ (หมายถึงตัวอักษรสองต่อสอง) เพราะส่วนประกอบของรหัสประกอบด้วยเพียงสองสิ่ง - จุดและเส้นประ

Wikipediaกล่าวว่า:

พูดอย่างเคร่งครัดไม่ใช่ไบนารีเนื่องจากมีห้าองค์ประกอบพื้นฐาน (ดู quinary) อย่างไรก็ตามนี่ไม่ได้หมายความว่ารหัสมอร์สไม่สามารถแสดงเป็นรหัสไบนารี่ได้ ในแง่นามธรรมนี่คือฟังก์ชั่นที่ตัวดำเนินการโทรเลขดำเนินการเมื่อส่งข้อความ (ดูที่ quinary)

แต่แล้วอีกครั้งหน้า Wikipedia อีกอันก็มีรหัสมอร์สใน 'รายชื่อรหัสไบนารี'

ฉันสับสนมากเพราะฉันคิดว่ารหัสมอร์สเป็นจริงประกอบไปด้วย คุณมี 'ความเป็นไปได้ 3 ประเภทที่แตกต่างกัน: ความเงียบเสียงบี๊ปสั้นหรือเสียงบี๊บยาว

เป็นไปไม่ได้ที่จะเป็นตัวแทนของรหัสมอร์สใน 'stirct binary' ใช่ไหม?

โดย 'binary ที่เข้มงวด' ฉันหมายถึงคิดถึงกระแสของไบนารี: 1010111101010 .. ฉันควรจะเป็นตัวแทนของความเงียบเสียงบี๊ปสั้นและ / หรือเสียงบี๊บยาวอย่างไร

วิธีเดียวที่ฉันคิดได้ก็คือ 'ขนาดของคำ' ที่คอมพิวเตอร์ใช้ ถ้าฉัน (และ CPU / ล่ามของรหัส) รู้ว่ามันจะอ่าน 8 บิตทุกครั้งจากนั้นฉันสามารถเป็นตัวแทนรหัสมอร์ส ฉันสามารถแสดงเสียงบี๊ปสั้น ๆ ด้วย 1 หรือเสียงบี๊บยาวที่มี 0 และความเงียบจะถูกแทนด้วยความยาวของคำโดยปริยาย (สมมติว่า 8 บิต .. ) ดังนั้นอีกครั้งฉันมีตัวแปรที่ 3 / สินทรัพย์ที่ 3 ใน มือของฉัน: ขนาดของคำ

ความคิดของฉันเป็นแบบนี้: ฉันสามารถจอง 3 บิตแรกสำหรับจำนวนบิตที่จะอ่านและ 5 บิตสุดท้ายสำหรับรหัสมอร์สในคำ 8 บิต เช่น 00110000 จะหมายถึง 'A' และฉันยังอยู่ใน 'ไบนารี' แต่ฉันต้องการขนาดของคำที่ทำให้มันเป็นไตรภาคหรือไม่ 3 บิตแรกพูดว่า: อ่านเพียง 1 บิตจาก 5 บิตต่อไปนี้

แทนไบนารีถ้าเราใช้ trinary เราสามารถแสดงรหัสมอร์สเช่น: 101021110102110222 ฯลฯ โดยที่ 1 คือ: dit 0 คือ: dah และ 2 คือความเงียบ ด้วยการใช้ 222 เราสามารถเขียนรหัสความเงียบที่ยาวนานดังนั้นหากคุณมีสัญญาณเช่น * - * --- * - คุณสามารถแสดงมันได้เช่น: 102100022210 แต่มันเป็นไปไม่ได้โดยตรงที่จะใช้เพียงแค่ 1 และ 0 คุณจะเกิดขึ้น บางอย่างเช่นขนาดคำที่ 'คงที่' ตามที่ฉันพูดถึง แต่นี่เป็นการตีความไม่ใช่การบันทึกรหัสมอร์สเนื่องจากมันอยู่ในรูปแบบไบนารี ลองนึกภาพบางอย่างเช่นเปียโนคุณมีเพียงปุ่มเปียโน คุณต้องการฝากข้อความในรหัสมอร์สสำหรับใครบางคนและคุณสามารถทาสีปุ่มให้เป็นสีดำ ไม่มีทางที่คุณจะฝากข้อความที่ชัดเจนไม่ใช่เหรอ? คุณต้องการสีเพิ่มอีกอย่างน้อยหนึ่งสีเพื่อให้คุณสามารถใส่เสียงเงียบ (สีที่อยู่ระหว่างตัวละครและคำศัพท์นี่คือสิ่งที่ฉันหมายถึงโดยความสมบูรณ์แบบ

ฉันไม่ได้ถามว่าคุณสามารถเป็นตัวแทนของรหัสมอร์สใน 57-ary หรืออะไรอย่างอื่น

ฉันได้ส่งอีเมลถึงผู้แต่ง (Charles Petzold) เกี่ยวกับเรื่องนี้; เขาบอกว่าเขาแสดงให้เห็นในบทที่ 9 ของ "รหัส" ที่รหัสมอร์สสามารถตีความได้ว่าเป็นรหัสไบนารี

ฉันผิดกับความคิดของฉันอยู่ที่ไหน ฉันกำลังอ่านอะไรอยู่ในหนังสือเล่มนี้ว่ารหัสมอร์สเป็นไบนารีจริงหรือไม่? มันเป็นที่ถกเถียงกันอย่างใด? ทำไมรหัสมอร์สบอกว่าจะ quinary ในหน้าวิกิพีเดียหนึ่งและก็ยังระบุไว้ในรายการของไบนารีรหัสหน้า?

แก้ไข: ฉันได้ส่งอีเมลถึงผู้เขียนและได้รับคำตอบ:

-----ข้อความต้นฉบับ-----

จาก: Koray Tugay [mailto: koray@tugay.biz]

ส่ง: วันอังคารที่ 3 มีนาคม 2558 3:16 PM

ถึง: cp@charlespetzold.com

Subject: รหัสมอร์สเป็นเลขฐานสองจริง ๆ หรือไม่

ท่านช่วยลองดูคำถามของฉันที่นี่: รหัสมอร์สเป็นเลขฐานสองแบบสามส่วนหรือสามส่วนหรือไม่? คำถาม

ขอแสดงความนับถือ Koray Tugay

จาก: "Charles Petzold"

ถึง: "'Koray Tugay'"

Subject: RE: รหัสมอร์สเป็นเลขฐานสองจริง ๆ หรือไม่ วันที่: 3

มี.ค. 2558 23:04:35 EET

ในตอนท้ายของบทที่ 9 ใน "รหัส" ฉันแสดงให้เห็นว่ารหัสมอร์สสามารถตีความได้ว่าเป็นรหัสไบนารี

-----ข้อความต้นฉบับ-----

จาก: Koray Tugay [mailto: koray@tugay.biz]

ส่ง: วันอังคารที่ 3 มีนาคม 2558 3:16 PM

ถึง: cp@charlespetzold.com

Subject: รหัสมอร์สเป็นเลขฐานสองจริง ๆ หรือไม่

ท่านช่วยลองดูคำถามของฉันที่นี่: รหัสมอร์สเป็นเลขฐานสองแบบสามส่วนหรือสามส่วนหรือไม่? คำถาม

ขอแสดงความนับถือ Koray Tugay

ฉันไม่ได้ซ่อนอีเมลของเขาเพราะหาได้ง่ายจากเว็บ


โปรดย้ายการสนทนาเพิ่มเติมใด ๆ ไปยังchat.stackexchange.com/rooms/21638/…
Wandering Logic

ความคิดเห็นไม่ได้มีไว้สำหรับการอภิปรายเพิ่มเติม การสนทนานี้ได้รับการย้ายไปแชท
Raphael

ฉันแก้ไขลิงก์ที่ฉันลบโดยไม่ตั้งใจ (อ๊ะ); โปรดหลีกเลี่ยงการย้อนกลับไปสู่การแก้ไขที่เลวร้ายยิ่งขึ้น
Raphael

1
@WanderingLogic วิธีที่ถูกต้องมีประสิทธิภาพมากที่สุดและปราศจากเสียงรบกวนคือการตั้งค่าสถานะคำถามสำหรับการล้างความคิดเห็นและแนะนำความคิดเห็นให้ย้ายไปแชทในธงไม่ใช่เพื่อแสดงความคิดเห็นต่อสาธารณะและพยายามสร้างห้องสนทนาเพื่อรวมความคิดเห็นทั้งหมดบน คำตอบทั้งหมดโดยไม่มีบริบท ลิงก์ของคุณก็สับสนเช่นกันเนื่องจาก Raphael โพสต์ลิงก์ที่ถูกต้องแล้ว
เจสันซี

1
@ J.-E.Pin ดีฉันไม่ได้ให้ความหมายอย่างเป็นทางการเพราะฉันยอมรับว่าคนที่ตอบคำถามจะได้รู้ว่าและฉันมีการอ้างอิงหรือสองวิกิพีเดียเพื่อกำหนดบริบท แม้ว่าวิกิพีเดียจะห่างไกลจากความสมบูรณ์แบบสิ่งนี้ควรจะสามารถรับบทบาทของคำจำกัดความได้บ่อยครั้งที่นี่ ฉันใช้เวลาสักครู่เพื่อตระหนักว่ามันเป็นปัญหา ฉันเป็นตัวฉันเองในกระบวนการของการเขียนใหม่ทั้งหมดที่มีคำจำกัดความคำพูดการอ้างอิงและคำอธิบายอย่างเป็นทางการด้วย homomorphisms แบบฉีด ฉันควรจบไหม
babou

คำตอบ:


19

รหัสมอร์สเป็นรหัส ternary ของคำนำหน้า (สำหรับการเข้ารหัส 58 ตัวอักษร) ที่ด้านบนของรหัสไบนารี่คำนำหน้าการเข้ารหัสสามสัญลักษณ์

นี่เป็นคำตอบที่สั้นกว่ามากเมื่อยอมรับ อย่างไรก็ตามเมื่อพิจารณาถึงความเข้าใจผิดระหว่างผู้ใช้และจากการร้องขอจาก OP ฉันได้เขียนคำตอบที่ยาวกว่านี้มาก ส่วน "สั้น" ครั้งแรกช่วยให้คุณมีส่วนสำคัญของมัน

สารบัญ

โดยสังเขป (ใหญ่)

เมื่อถามว่า "รหัสมอร์สคือเลขฐานสองแบบสามส่วนหรือสามส่วน" ไม่มีการเปรียบเทียบคำตอบที่เป็นไปได้เว้นแต่จะมีการแก้ไขเกณฑ์บางอย่างสำหรับคำตอบที่ยอมรับได้ อันที่จริงหากไม่มีเกณฑ์ที่เหมาะสมเราสามารถอธิบายคำอธิบายสำหรับโครงสร้างเกือบทุกชนิด เกณฑ์ที่ฉันเลือกมีดังต่อไปนี้:

  • มันควรจะสะท้อนให้เห็นถึงคำอธิบายสามชั้นของรหัสมอร์สกับการเป็นตัวแทนจุด / ประในชั้นที่สอง;

  • ควรเหมาะสมกับการนำเสนอและเครื่องมือทางคณิตศาสตร์ที่พัฒนาขึ้นสำหรับการวิเคราะห์เชิงทฤษฎีของรหัสมากที่สุด

  • ควรง่ายที่สุด

  • มันควรทำให้ชัดเจนคุณสมบัติของรหัสมอร์ส

สิ่งนี้มีจุดประสงค์เพื่อป้องกันการแฮ็กโดยพลการซึ่งไม่สนใจแนวคิดพื้นฐานของทฤษฎีรหัสว่าเป็นการศึกษาทางวิทยาศาสตร์และอาจมีการอุทธรณ์โดยให้ภาพลวงตาของการวิเคราะห์อย่างเป็นระบบแม้ว่าจะได้ข้อสรุปที่ไม่เป็นทางการ เว็บไซต์นี้ควรเกี่ยวกับ วิทยาศาสตร์คอมพิวเตอร์ไม่ใช่การเขียนโปรแกรม เราควรใช้วิทยาศาสตร์ขั้นต่ำที่จัดตั้งขึ้นและแนวคิดที่เป็นที่ยอมรับเพื่อตอบคำถามทางเทคนิค

การวิเคราะห์อย่างรวดเร็วของมาตรฐานแสดงให้เห็นว่าสัญลักษณ์ทั้งหมดที่ใช้ในรหัสมอร์สในที่สุดได้รับการเข้ารหัสในไบนารีเพราะมันถูกส่งเป็นสตริงของหน่วยความยาวเท่ากันซึ่งมีสัญญาณที่สามารถเปิดหรือปิดสำหรับแต่ละหน่วย นี้แสดงให้เห็นว่าข้อความที่มอร์สจะเขียนในท้ายที่สุดตัวอักษรตรรกะ }Σ1={0,1}

แต่นั่นไม่ได้กล่าวถึงโครงสร้างภายในของโค้ดเลย ข้อมูลที่จะเข้ารหัสเป็นสตริงบนตัวอักษร 58 สัญลักษณ์ (ตามมาตรฐาน) รวมถึง 57 ตัวอักษรและช่องว่าง สิ่งนี้สอดคล้องกับตัวอักษร symbl สุดท้ายเป็นพื้นที่Σ3={A,B,,Z,0,1,,9,?,=,,×,@,[]}

อย่างไรก็ตามมาตรฐานระบุว่ามีตัวอักษรกลาง ขึ้นอยู่กับและและสัญลักษณ์อื่น ๆ มันค่อนข้างชัดเจนΣ2dotdash

  • สตริงนั้นในจะถูกเข้ารหัสเป็นสตริงในและ Σ 2Σ3* * * *Σ2* * * *

  • สตริงนั้นในจะถูกเข้ารหัสเป็นสตริงใน Σ 1Σ2* * * *Σ1* * * *

ดังนั้นเนื่องจากไม่มีทางเลือกสำหรับและคำถามจะต้องเข้าใจว่า: " เราควรพิจารณาสัญลักษณ์อะไรจำนวนมากในตัวอักษรกลางเพื่อให้ axplain โครงสร้างและคุณสมบัติของทั้งมอร์สดีที่สุด รหัส "ซึ่งยังหมายถึงการระบุการเข้ารหัสทั้งสองระหว่างสามระดับΣ 3 Σ 2Σ1Σ3Σ2

ให้ความจริงที่ว่ารหัสมอร์สเป็นคำนำหน้า homomorphic (ความยาวตัวแปร) รหัสที่ติ๊ความเคลือบแคลงใด ๆ เมื่อถอดรหัสสัญญาณเราสามารถอธิบายเพียงแค่นี้คุณสมบัติที่สำคัญกับternary อักษร { , , } และสองการเข้ารหัสโครงการจาก ถึงและจากถึงซึ่งทั้ง homomorphic และคำนำหน้าดังนั้นทั้งสองรหัสชัดเจนและสามารถที่จะประกอบด้วยคำนำหน้าชัดเจน การเข้ารหัสสัญลักษณ์ 58 เป็นไบนารี่C 3 2 Σ 3 Σ 2 C 2 1 Σ 2 Σ 1Σ2=dotdashsepC32Σ3Σ2C21Σ2Σ1

ดังนั้นรหัสมอร์สประกอบด้วยคำนำหน้าประกอบไปด้วยรหัสที่แสดงอยู่ในตัวอักษร , ,กับทั้งสามสัญลักษณ์ตัวเองเข้ารหัสในไบนารีกับ codewords ต่อไปนี้:}{ dotdashsep }

dot 1110 0010 ,และdash 1110sep 00

โปรดทราบว่าสิ่งที่เรียกว่าช่องว่างระหว่างต่อเนื่องdotหรือdashรวมอยู่ในการเป็นตัวแทนของจริงdotและdashเพราะนี่คือการแสดงทางคณิตศาสตร์ปกติสำหรับรหัสประเภทดังกล่าวซึ่งมักจะกำหนดเป็นสตริงโฮโมมอร์ฟิซึมจากสัญลักษณ์ต้นทางไปยัง codewords แสดงด้วยสัญลักษณ์เป้าหมาย อย่างที่ฉันทำ

สิ่งนี้แยกออกเล็กน้อยจากงานนำเสนอบางส่วนที่ได้รับในมาตรฐานซึ่งมีจุดมุ่งหมายเพิ่มเติมในการระบุรหัสโดยสังเขปสำหรับผู้ใช้แทนที่จะวิเคราะห์จากคุณสมบัติเชิงโครงสร้างของมัน แต่การเข้ารหัสเหมือนกันในทั้งสองกรณี

แม้จะไม่มีการกำหนดเวลามาตรฐานที่แม่นยำตัวถอดรหัสสัญญาณอนาล็อกก็ยังสามารถแปลเป็นตัวอักษรประกอบไปด้วยที่เราแนะนำเพื่อให้ความเข้าใจด้านบนของรหัสที่สามยังคงใช้ได้

รหัส: จุดพื้นฐาน

คำตอบนี้เป็นไปตามมาตรฐาน ITU-R M.1677-1ลงวันที่ตุลาคม 2552 (ขอบคุณ Jason C สำหรับการอ้างอิง) ฉันจะใช้คำศัพท์dotและdashมากกว่าditและdahเนื่องจากเป็นคำศัพท์ที่ใช้โดยมาตรฐานนี้

ก่อนที่เราจะเริ่มพูดคุยถึงรหัสมอร์สเราต้องยอมรับว่ารหัสนั้นคืออะไร การสนทนาที่ยากในคำถามนี้ต้องชัดเจน

พื้นฐานข้อมูลจะต้องมีการแสดงเพื่อที่จะส่งหรือดำเนินการเป็นอย่างอื่น รหัสเป็นระบบในการแปลข้อมูลจากระบบใดระบบหนึ่งของการเป็นตัวแทนเข้าไปอีก นี่คือคำจำกัดความทั่วไปมาก เราจะต้องระมัดระวังไม่ให้เกิดความสับสนแนวคิดของการเป็นตัวแทนและของรหัสจากการเป็นตัวแทนหนึ่ง ( แหล่งที่มา ) ไปยังอีก ( เป้าหมาย )

การเป็นตัวแทนสามารถมีได้หลายรูปแบบเช่นตัวแปรแรงดันไฟฟ้า, จุดสีบนกระดาษ, สตริงของตัวอักษร, ตัวเลข, สตริงไบนารี่ของ 0 และ 1 ฯลฯ มันเป็นสิ่งสำคัญที่จะต้องแยกแยะความแตกต่างระหว่างการเป็นตัวแทนแบบอะนาล็อกและทางการ .

การเป็นตัวแทนแบบอะนาล็อก / กายภาพคือรูปวาดระดับแรงดันไฟฟ้าที่แตกต่างกันรูปร่าง (สำหรับตัวอักษร)

การเป็นตัวแทนเชิงตรรกะ / เป็นทางการ / นามธรรมเป็นตัวแทนทางคณิตศาสตร์ที่มีกราฟนามธรรมสตริงของสัญลักษณ์หรือหน่วยงานทางคณิตศาสตร์อื่น ๆ

แม้ว่าในตอนแรกข้อมูลบางอย่างอาจเป็นแบบอะนาล็อกเรามักจะแปลงเป็นรูปแบบตรรกะเพื่อให้สามารถกำหนดกระบวนการได้อย่างแม่นยำโดยใช้วิธีการทางคณิตศาสตร์หรือโดยคน

ในทางกลับกันเราจัดการกับการเป็นตัวแทนเชิงตรรกะโดยใช้อุปกรณ์ทางกายภาพเช่นคอมพิวเตอร์หรือเครื่องส่งสัญญาณเราจำเป็นต้องให้แบบอะนาล็อกกับการเป็นตัวแทนเชิงตรรกะ

สำหรับวัตถุประสงค์ของการวิเคราะห์นี้รูปแบบอะนาล็อกที่เราพิจารณาคือใช้สำหรับการส่งสัญญาณตามที่อธิบายไว้ในมาตรฐาน แต่ถึงอย่างนั้นเราก็จะพิจารณาว่าขั้นตอนแรกคือการตีความการเป็นตัวแทนอะนาล็อกนี้เป็นการดำเนินการโดยตรงของการเป็นตัวแทนเชิงตรรกะที่มีโครงสร้างเหมือนกันซึ่งเราสร้างการวิเคราะห์ของเราว่ารหัสมอร์สคืออะไร ทฤษฎีรหัสเป็นองค์ความรู้ทางคณิตศาสตร์ที่อยู่บนพื้นฐานการวิเคราะห์การเป็นตัวแทนเชิงตรรกะ

อย่างไรก็ตามเราจะกลับมาที่การเปลี่ยนแปลงแบบอะนาล็อก / ตรรกะในการสนทนาในตอนท้าย

รหัส: คำจำกัดความ

มุมมองเชิงตรรกะของเราคือว่ารหัสที่ใช้ในการแปลแหล่งสตริงในแหล่งอักษรไปยังตัวอักษรเป้าหมายTมันมักจะเป็นกรณีที่ตัวอักษรทั้งสองเหมือนกันมักเป็นเลขฐานสองเมื่อวัตถุประสงค์คือการเพิ่มคุณสมบัติพิเศษบางอย่างให้กับการแสดงข้อมูลเช่นทำให้ทนทานต่อข้อผิดพลาดมากขึ้น (การตรวจจับและแก้ไขข้อผิดพลาด) หรือทำให้การแสดงน้อยลง การลบความซ้ำซ้อน (การบีบอัดรหัสแบบไม่สูญเสียข้อมูล) และอาจมีการสูญเสียข้อมูลบางส่วนอย่างระมัดระวัง (การบีบอัดแบบสูญเสีย)TST

อย่างไรก็ตามจุดประสงค์ของรหัสมอร์สคือการให้วิธีการที่จะเป็นตัวแทนของสตริงบนตัวอักษรขนาดใหญ่เป็นสตริงที่ขึ้นอยู่กับตัวอักษรขนาดเล็กมาก (จริง ๆ ไบนารี) โดยใช้ตัวอักษรกลางเกือบไบนารี (จุดและขีดกลาง) การรับรู้และความสามารถในการบิดเบือน สิ่งนี้สามารถทำได้โดยสิ่งที่เรียกว่า รหัสความยาวผันแปร :

การใช้คำศัพท์จากทฤษฎีภาษาทางการคำจำกัดความทางคณิตศาสตร์ที่แม่นยำมีดังต่อไปนี้: ให้และเป็นเซต จำกัด สองชุดซึ่งเรียกว่าตัวอักษรต้นทางและเป้าหมายตามลำดับ รหัสเป็นฟังก์ชั่นการแมปแต่ละสัญลักษณ์จากถึงลำดับของสัญลักษณ์เหนือและการขยายไปสู่ ​​homomorphism ของ เป็นซึ่งแผนที่แต่ละลำดับของ สัญลักษณ์แหล่งที่มากับลำดับของสัญลักษณ์เป้าหมายถูกอ้างถึงเป็นส่วนขยายT C : S T S T C S T STC:ST* * * *STCS* * * *T* * * *

เราเรียกcodewordภาพของสัญลักษณ์SC(s)T* * * *sS

ตัวแปรที่มีความยาวรหัสคืออ่านได้โดยไม่ซ้ำกันถ้า homomorphism ที่สอดคล้องกันของเข้าเป็นหนึง นั่นหมายความว่าสตริงใด ๆ ในสามารถเป็นภาพของสตริงมากที่สุดคนหนึ่งใน * นอกจากนี้เรายังบอกว่ารหัสนั้นไม่คลุมเครือซึ่งหมายความว่าสตริงใด ๆ สามารถถอดรหัสได้อย่างไม่น่าสงสัยถ้าหากทั้งหมดCS* * * *T* * * *T* * * *S* * * *

รหัสความยาวผันแปรได้เป็นรหัสนำหน้าหากไม่มี codeword เป็นคำนำหน้าของรหัสอื่น นอกจากนี้ยัง alled รหัสทันทีหรือรหัสบริบทฟรี เหตุผลสำหรับชื่อเหล่านี้คือเมื่อคุณอ่านสตริงเป้าหมายที่เริ่มต้นด้วยรหัสประจำตัวของรหัสคำนำหน้าคุณรับรู้ถึงจุดสิ้นสุดของ codeword ทันทีที่คุณอ่านสัญลักษณ์สุดท้ายโดยไม่ต้องรู้ / อ่านสัญลักษณ์ถัดไป เป็นผลให้รหัสคำนำหน้ามีความชัดเจนและง่ายต่อการถอดรหัสอย่างรวดเร็วW

มันแสดงให้เห็นได้อย่างง่ายดายว่าความสามารถในการถอดรหัสที่เป็นเอกลักษณ์และคุณสมบัติคำนำหน้าถูกปิดภายใต้องค์ประกอบของรหัส

โปรดสังเกตว่าคำนิยามในฐานะโฮโมมอร์ฟิซึมหมายถึงว่าไม่มีการแบ่งแยกพิเศษระหว่าง codewords มันเป็นโครงสร้างของพวกเขาเช่นคุณสมบัติคำนำหน้าซึ่งช่วยให้ระบุได้อย่างไม่น่าสงสัย

แน่นอนถ้ามีสัญลักษณ์แยกดังกล่าวพวกเขาจะต้องเป็นส่วนหนึ่งของตัวอักษรเป้าหมายเพราะพวกเขาจะต้องถอดรหัสสตริงจากตัวอักษรเป้าหมาย จากนั้นจะเป็นการง่ายที่จะเปลี่ยนกลับไปใช้แบบจำลองเชิงทฤษฎีของรหัสความยาวผันแปรได้โดยการเพิ่มตัวคั่นไปยังคำรหัสก่อนหน้า หากเป็นการยกระดับความยากลำบากทางบริบท (เนื่องจากมีตัวคั่นหลายตัว) นั่นจะเป็นเพียงคำใบ้ว่ารหัสนั้นซับซ้อนกว่าชัดเจน นี่เป็นเหตุผลที่ดีที่จะยึดตามแบบจำลองเชิงทฤษฎีที่อธิบายไว้ข้างต้น

รหัสมอร์ส

รหัสมอร์สอธิบายไว้ในมาตรฐานในสามระดับ:

  • 3. มันมีวัตถุประสงค์เพื่อให้การเข้ารหัสของข้อความภาษาธรรมชาติโดยใช้ 57 ตัวอักษร (27 ตัวอักษร, 10 หลัก, 20 synbols และ ponctuations) และพื้นที่ว่างระหว่างคำเพื่อตัดสตริงอักขระเป็นคำ การเว้นวรรคระหว่างคำถูกใช้เหมือนตัวละครพิเศษที่สามารถนำไปผสมกับสิ่งอื่น ๆ ได้ซึ่งฉันจะสังเกตSEPเห็น

  • 2. อักขระเหล่านี้ทั้งหมดจะถูกเข้ารหัสเป็นตัวต่อเนื่องdash และdotโดยใช้ช่องว่างระหว่างตัวอักษรซึ่งฉันจะต้องทราบsepเพื่อแยกdashและdotจดหมายฉบับหนึ่งออกจากจดหมายฉบับถัดไป

  • 1. dashและdotเช่นเดียวกับการsepจะได้รับการเข้ารหัสเป็นสัญญาณหรือไม่มีสัญญาณ (เรียกว่าเว้นวรรค) ที่มีความยาวกำหนดไว้อย่างแม่นยำในแง่ของหน่วยได้รับการยอมรับบางส่วน โดยเฉพาะอย่างยิ่งdashและการเข้ารหัสตัวอักษรจะต้องแยกออกจากพื้นที่ระหว่างองค์ประกอบที่ฉันจะทราบdot σ

สิ่งนี้เรียกร้องให้มีข้อสรุปเล็กน้อย

ข้อความที่จะส่งและรับในรูปแบบอะนาล็อกคือความต่อเนื่องของหน่วยความยาว (ความยาวของพื้นที่หรือความยาวของเวลา) ซึ่งสัญญาณจะเปิดปิดตลอดระยะเวลาทั้งหมดของแต่ละหน่วยตามที่ระบุในภาคผนวก 1 ส่วนที่ 1 ส่วน 2 มาตรฐาน :

2   Spacing and length of the signals
2.1 A dash is equal to three dots.
2.2 The space between the signals forming the same letter is equal to one dot.
2.3 The space between two letters is equal to three dots.
2.4 The space between two words is equal to seven dots.

นี้ชัดเจนการเข้ารหัสแบบอะนาล็อกในสิ่งที่เป็นที่รู้จักกันเป็นกระแสบิตซึ่งสามารถแสดงเหตุผลในสัญกรณ์ไบนารีด้วยสตริงของ0ans 1ยืนสำหรับอนาล็อกปิดและบน

เพื่อที่จะออกไปประเด็นที่เป็นนามธรรมที่เกี่ยวข้องกับการแสดงแบบอะนาล็อกเราจึงสามารถพิจารณาว่าข้อความรหัสมอร์สจะถูกส่งเป็นสตริงบิตว่าเราจะทราบด้วยและ01

ดังนั้นข้อความที่ตัดตอนมาจากมาตรฐานข้างต้นสามารถแสดงเหตุผลได้ดังนี้:

  • 0. เป็นตัวแทนจากdot1
  • 1. เป็นตัวแทนจากdash111
  • 2. พื้นที่ระหว่างองค์ประกอบเป็นตัวแทนจากσ0
  • 3. พื้นที่ระหว่างตัวอักษรเป็นตัวแทนจากsep000
  • 4. พื้นที่ระหว่างคำว่าเป็นตัวแทนจากSEP0000000

ดังนั้นเราจึงเห็นรหัสมอร์สว่าใช้คำ 5 รหัสในรูปแบบไบนารี่เพื่อเข้ารหัสสัญลักษณ์ 5 ตัวนี้ ยกเว้นความจริงที่ว่านี่ไม่ใช่วิธีการอธิบายระบบมีบางอย่างมากกว่านั้นและมันก็ไม่ใช่วิธีที่สะดวกที่สุดที่จะนึกถึงจากมุมมองที่ไร้เดียงสาหรือมุมมองทางคณิตศาสตร์

โปรดทราบว่าคำอธิบายนี้มีไว้สำหรับคนธรรมดาไม่ใช่ผู้เชี่ยวชาญด้านทฤษฎีรหัส ด้วยเหตุนี้จึงอธิบายลักษณะที่ปรากฏที่มองเห็นได้มากกว่าโครงสร้างภายในที่ปรับให้เหมาะสม มันไม่มีเหตุผลที่จะห้ามคำอธิบายอื่น ๆ ที่เข้ากันได้กับสิ่งนี้แม้ว่าจะมีโครงสร้างทางคณิตศาสตร์มากขึ้นเพื่อเน้นคุณสมบัติของรหัส

แต่ก่อนอื่นเราควรทราบว่าคำอธิบายที่สมบูรณ์ของรหัสเกี่ยวข้องกับการแสดง 3 ระดับซึ่งจำได้ทันที:

  • 3. SEPข้อความที่ประกอบด้วยสายอักขระรวมทั้ง
  • 2. การเข้ารหัสของสตริงตัวอักษรเป็นสตริงของdot, และdashsep
  • 1. การเข้ารหัสสตริงระดับ 2 ของทั้งสามนี้symbolsเป็นสตริงไบนารี

เราอาจจะพูดถึงสัญลักษณ์ที่เข้ารหัสในสิ่งที่ แต่มันเป็นสิ่งสำคัญของรหัสมอร์สว่ามันมีสามระดับของการเป็นตัวแทนกับตัวละครที่ด้านบน, dots และdashes ที่อยู่ตรงกลางและบิต0และ1ที่ด้านล่าง .

นี่หมายความว่ามีสองรหัสจำเป็นหนึ่งจากระดับ 3 ถึงระดับ 2 และอื่น ๆ จากระดับ 2 ถึงระดับ 1

การวิเคราะห์การเป็นตัวแทนสามระดับ

เพื่อให้มีการวิเคราะห์ที่สอดคล้องกันของระบบการเข้ารหัส 3 ระดับนี้อันดับแรกเราควรวิเคราะห์ว่าข้อมูลประเภทใดที่เกี่ยวข้องในแต่ละระดับ

  • 1. สตริงบิตโดยความหมายและความจำเป็นของการเป็นตัวแทนแอนะล็อก, ประกอบด้วยเฉพาะของและ01

  • 3. ในระดับข้อความที่เราต้องการและตัวอักษร 58 สัญลักษณ์รวมทั้ง 57 SEPตัวอักษรและพื้นที่ระหว่างคำว่า ทั้งหมด 58 คนต้องมีการเข้ารหัสแบบไบนารีในท้ายที่สุด แต่ถึงแม้ว่ารหัสมาตรฐานมอร์สจะระบุตัวอักษร 57 + 1 เหล่านี้ แต่ก็ไม่ได้ระบุว่าควรใช้การเข้ารหัสข้อมูลอย่างไร นั่นคือบทบาทของภาษาอังกฤษและภาษาธรรมชาติอื่น ๆ รหัสมอร์สให้ระบบอื่นที่มีตัวอักษร 58 สัญลักษณ์ซึ่งพวกเขาสามารถสร้างรหัส 58 รหัสได้ แต่รหัสมอร์สไม่ใช่รหัส 58 ตัว

  • 2. ที่dotและdashระดับสิ่งที่เราต้องการคือสัญลักษณ์สองตัวนี้เพื่อให้รหัส 57 ตัวอักษรคือให้ codeword สำหรับแต่ละตัวเป็นสตริงของdotและdashพร้อมกับตัวคั่นบางตัวsepเพื่อทำเครื่องหมายเมื่อตัวอักษรตัวหนึ่งเสร็จสิ้นและอีกจุดเริ่มต้น SEPเรายังต้องใช้วิธีการเข้ารหัสพื้นที่ระหว่างบางคำ เราอาจพยายามที่จะให้มันโดยตรงที่ leavel 1 แต่สิ่งนี้จะทำให้องค์กรที่มีโครงสร้างของรหัสไม่เป็นระเบียบ

ที่จริงคำอธิบายของมาตรฐานอาจถูกวิจารณ์อย่างถูกต้องสำหรับการทำเช่นนั้น แต่ผู้เขียนอาจคิดว่าการนำเสนอของพวกเขาจะง่ายกว่าสำหรับผู้ใช้ทั่วไป นอกจากนี้ยังเป็นไปตามคำอธิบายดั้งเดิมของรหัสมอร์สซึ่งมีมาก่อนการวิเคราะห์ทางคณิตศาสตร์ประเภทนี้

สิ่งนี้เรียกข้อสังเกตหลายประการ:

  • ที่ระดับ 3 ระดับตัวอักษรช่องว่างระหว่างตัวอักษรsepไม่มีความหมายอีกต่อไป นี่เป็นเรื่องปกติเนื่องจากไม่มีความหมายในจักรวาลของตัวอักษรมากกว่าช่องว่างที่แยกอักขระที่เขียนสองตัวบนกระดาษ มีความจำเป็นที่ระดับ 2 เพื่อรับรู้รหัสที่เป็นตัวแทนของตัวอักษร แต่นั่นคือทั้งหมด

  • ในทำนองเดียวกันที่ระดับ 2 พื้นที่ระหว่างองค์ประกอบσจะไม่มีความหมายอีกต่อไป มันไม่มีความหมายในโลกของdotและdashแต่เป็นสิ่งจำเป็นเท่านั้นที่ระดับ 1 เพื่อแจ้งคำรหัสไบนารีตัวแทน,dot dashแต่ในระดับที่ 1 0ก็ไม่ได้แตกต่างจากบิต

ดังนั้นพื้นที่ว่างระหว่างองค์ประกอบσจึงไม่มีอะไรพิเศษอีกต่อไป 0มันเป็นเพียงหนึ่งในการใช้งานของ

อย่างไรก็ตามตามที่อธิบายไว้ก่อนหน้านี้หากจะต้องวิเคราะห์รหัสโดยใช้ความรู้เกี่ยวกับความยาวของรหัสตัวแปรตัวคั่นควรผนวกเข้ากับ codewords ที่พวกเขาทำตามเพื่อกำหนดรหัสเป็นสตริงธรรมดา homomorphismΣ2* * * *Σ1* * * *

นี่หมายถึงข้อกำหนดบางส่วนของรหัสต่อไปนี้: และdot→การ10dash1110

ตัวอักษรระดับ 2ต้องการสัญลักษณ์อื่นอย่างน้อยหนึ่งตัวซึ่งมีการเว้นวรรคระหว่างตัวอักษรซึ่งควรเป็นไปตามตัวอักษรของมาตรฐาน แต่ความหมายของรหัสที่ยาวตัวแปรเป็น homomorphism ที่จำเป็นต้องมีการผนวกพื้นที่ระหว่างองค์ประกอบ แต่ละ codeword สำหรับและ ดังนั้นเราจะต้องมีเพียงcodeword สำหรับเท่านั้นดังนั้นเมื่อสิ้นสุดด้วยการมาจาก preceeding หรือมันทำให้ 3 ตามที่กำหนดโดยมาตรฐาน สิ่งนี้ใช้ได้เสมอเนื่องจากไม่มีข้อกำหนดในมาตรฐานสำหรับการมีตัวคั่นระหว่างตัวอักษรสองตัวที่ติดตามกันΣ2sep0000dotdash00sep0dotdash0

นี้ก็เพียงพอที่จะเข้ารหัสตัวอักษร { , , } กับ homomorphic รหัสกำหนดไว้ดังนี้Σ2=dotdashsepC21:Σ2Σ1* * * *

  • dot10

  • dash1110

  • sep00

และเรามีความประหลาดใจที่ดีในการค้นพบว่าไม่มี codeword เป็นคำนำหน้าของอีก ดังนั้นเราจึงมีรหัสคำนำหน้าซึ่งไม่มีความชัดเจนและง่ายต่อการถอดรหัส

ตอนนี้เราสามารถดำเนินการในทำนองเดียวกันในการกำหนดรหัส *C32:Σ3Σ2* * * *

การใช้มาตรฐานสายdotและdashเป็น codewords สำหรับตัวละครในในทางที่ได้รับจากตารางของมาตรฐานเช่นการเป็นตัวแทนของตัวอักษร ฉΣ3dot dot dash dot

อีกครั้ง codewords เหล่านี้จะถูกคั่นด้วยช่องว่างระหว่างตัวอักษร เพื่อกำหนดรหัสเป็นโฮโมมอร์ฟิซึมเราต้องรวมตัวคั่นใน codewords เพื่อให้คำจำกัดความของโฮโมมอร์ฟิซึมกลายเป็นค่อนข้าง: dot dot dash dot sep

นี้ใช้กับแต่ละ 57 ตัวอักษรในตัวอักษร\แต่อีกครั้งเราก็ต้องแยกคำซึ่งเป็นไปตามมาตรฐานที่เป็น เราทราบก่อนว่ารหัส 3 บิตนั้นได้รับการจัดเตรียมไว้แล้ว 2 ตัวต่อจากนั้นจะลงท้ายด้วยตัวอักษรสุดท้ายของคำและ 1 โดยบิตที่จะสิ้นสุดการเข้ารหัสสุดท้ายหรือการเข้ารหัสของจดหมายฉบับสุดท้าย ดังนั้นต้องในท้ายที่สุดจะเขียนเป็นส่วนที่เหลือΣ3SEP00000000sep0dotdashSEP0000

แต่การที่จะเคารพวิธีฉัตรSEPควรได้รับการเข้ารหัสใน codeword จาก * เนื่องจากเป็นรหัสที่เข้ารหัสแบบไบนารีจึงเป็นไปตามที่สามารถเข้ารหัสได้Σ2* * * *sep00SEPsep sep

ดังนั้นเราสามารถเข้ารหัสตัวอักษร , ด้วยรหัส homomorphic กำหนดไว้ดังนี้:Σ3={A,B,...,Z,0,1,...,9,?,=,...,×,แอท, SEP}C32:Σ3Σ2* * * *

  • A dot dash se p

  • B dash do t dot dot sep ...

  • Z dash dash dot dot sep ...

  • 7 dash dash dot dot dot sep ...
  • SEP sep sep (สำหรับตัวคั่นคำ)

และเรามีความประหลาดใจเพิ่มเติมที่จะเห็นว่าไม่มี codeword เป็นคำนำหน้าของอีก ดังนั้นรหัสจึงเป็นรหัสนำหน้าด้วยC32

เนื่องจากคุณสมบัติคำนำหน้าปิดอยู่ภายใต้องค์ประกอบของรหัสรหัสมอร์สเป็นรหัสนำหน้าCMโอRsอี=C21C32

เราจึงสามารถสรุปได้ว่ารหัสมอร์สสามารถเข้าใจได้อย่างง่ายดายและวิเคราะห์เป็นองค์ประกอบของคำนำหน้าไบนารีการเข้ารหัสของตัวอักษรสัญลักษณ์ 3 { dot, dash, sep} เป็นตัวอักษรไบนารีและคำนำหน้าการเข้ารหัสของตัวอักษร 58 สัญลักษณ์ (57 ตัวอักษร และหนึ่งช่องว่าง) เป็น 3 ตัวอักษรตัวอักษร

การเรียบเรียงเองนั้นเป็นการเข้ารหัสคำนำหน้าของสัญลักษณ์ 58 ตัวเพื่อเป็นตัวแทนไบนารี

ข้อสังเกตในการวิเคราะห์นี้

เป็นการยากที่จะพิสูจน์ว่าการนำเสนอโครงสร้างเป็นสิ่งที่ดีที่สุดที่จะเกิดขึ้น อย่างไรก็ตามดูเหมือนว่าการวิเคราะห์ข้างต้นตรงตามเกณฑ์ที่กำหนดไว้ที่จุดเริ่มต้นของคำตอบนี้: ความใกล้ชิดกับคำจำกัดความ 3 ชั้นนำเสนออย่างเป็นทางการตามทฤษฎีการเข้ารหัสปัจจุบันความเรียบง่ายและหลักฐานคุณสมบัติหลักของรหัส

โปรดทราบว่ามีจุดเล็กน้อยในการค้นหาคุณสมบัติการแก้ไขข้อผิดพลาด รหัสมอร์สอาจไม่ได้ตรวจสอบความผิดพลาดบิตเดียวมันก็อาจมีการเปลี่ยนแปลงทั้งสองเป็นหนึ่งdot dashอย่างไรก็ตามมันทำให้เกิดข้อผิดพลาดในท้องถิ่นเท่านั้น

เกี่ยวกับการบีบอัดการเข้ารหัส ternary ถูกออกแบบมาเพื่อประมาณลดจำนวนของจุดและขีดกลางในชนิดของ approximative Huffman การเข้ารหัส แต่รหัสที่ประกอบขึ้นสองชุดนั้นสามารถทำให้หนาแน่นขึ้นได้อย่างง่ายดาย

เกี่ยวกับขนาดของตัวอักษรไม่มีตัวเลือกสำหรับไบนารีและตัวอักษรสัญลักษณ์ 58 ตัวอักษรกลางอาจมีสัญลักษณ์มากกว่า แต่จะมีจุดประสงค์อะไร?

อย่างไรก็ตามบางคนอาจมีแนวโน้มที่จะรับรู้ช่องว่างDETที่ระดับ 2 ดังนั้นจึงทำให้ตัวอักษรquaternaryแล้วใช้มันโดยตรงที่ระดับ 3 เข้ารหัสเหมือนตัวเองในระดับ 2

นี้จะตอบสนองความคมชัดมาตรฐานสำหรับการเข้ารหัสในไบนารีDET 0000แต่มันจะป้องกันการวิเคราะห์ของการเข้ารหัสไบนารี เป็นรหัสคำนำหน้าทำให้ยากที่จะแสดงให้เห็นว่า เป็นรหัสนำหน้าจึงไม่มีความชัดเจน C M o r s eC21CMโอRsอี

อันที่จริงทางเลือกดังกล่าวจะทำให้สตริงไบนารี0000คลุมเครืออ่านได้เป็นอย่างใดอย่างหนึ่งหรือเป็นSEP sep sepความคลุมเครือจะต้องได้รับการแก้ไขด้วยกฎตามบริบทที่sepไม่สามารถทำตามได้เองทำให้การทำให้เป็นทางการซับซ้อนขึ้น

ความสำคัญของการแปลงสัญญาณอนาล็อกเป็นโลจิคัล

การวิเคราะห์นี้อาศัยความจริงที่ว่าการสลายตัวของสัญญาณเปิด / ปิดเป็นหน่วยที่มีความยาวเท่ากันบ่งชี้อย่างชัดเจนว่าการแทนแบบอะนาล็อกของสตริงไบนารี นอกจากนี้ความยาวในหน่วยที่ถูกต้องสำหรับการวิเคราะห์ข้างต้นซึ่งดูเหมือนว่าไม่น่าจะเกิดขึ้นโดยบังเอิญ (แม้ว่ามันจะเป็นไปได้)

อย่างไรก็ตามจาก (ดูคร่าวๆ) ดูสิทธิบัตรดั้งเดิม 1647ดูเหมือนว่าจะไม่ถูกต้องแม่นยำโดยมีประโยคเช่น (ด้านบนของหน้า 2):

สัญลักษณ์ของตัวเลขที่แตกต่างกันหรือของตัวเลขเชิงผสมเมื่อใช้ในประโยคคำหรือตัวเลขประกอบด้วยระยะทางหรือช่องว่างของการแยกระหว่างตัวละครในระดับที่สูงกว่าระยะทางที่ใช้ในการแยกอักขระที่ประกอบด้วยความแตกต่างใด ๆ หรือสารประกอบตัวเลข

คนที่ถูกส่งด้วยมือหรือรับโดยหูในภายหลังก็ไม่น่าจะแม่นยำเช่นกัน ที่จริงแล้วกำปั้นของพวกเขาเช่นเวลาของพวกเขามักจะเป็นที่รู้จัก มุมมองนี้ยังได้รับการสนับสนุนจากข้อเท็จจริงที่ว่าความยาวของระยะห่างนั้นไม่ได้รับการเคารพเสมอไปโดยเฉพาะเมื่อเรียนรู้รหัสมอร์ส

สถานการณ์เหล่านี้สอดคล้องกับมุมมองแบบแอนะล็อกของรหัสเป็นสัญญาณสั้น (จุด) สัญญาณกลาง (เส้นประ) และหยุดชั่วคราวสั้นกลางและยาว การเคลื่อนย้ายโดยตรงไปยังตัวอักษรเชิงตรรกะจะให้ตัวอักษรแบบ quinaryโดยที่ 58 สัญลักษณ์จะต้องถูกเข้ารหัส แน่นอนว่านี่ไม่ใช่การนำเสนอรหัสมอร์ส 3 ชั้นอีกต่อไป

อย่างไรก็ตามเพื่อให้เกิดความเข้าใจ (และอาจหลีกเลี่ยงความคลุมเครือ) ตัวอักษรนี้ควรใช้กับข้อ จำกัด ที่สัญลักษณ์สัญญาณสอง ( dotหรือdash) ไม่สามารถตามซึ่งกันและกันและสัญลักษณ์หยุดชั่วคราวไม่สามารถทำตามซึ่งกันและกัน การวิเคราะห์รหัสและคุณสมบัติของมันจะมีความซับซ้อนมากขึ้นและวิธีธรรมชาติในการทำให้มันง่ายขึ้นก็คือการทำสิ่งที่ทำ: แนะนำการกำหนดเวลาที่เหมาะสมเพื่อเปลี่ยนเป็นองค์ประกอบของสองรหัสซึ่งนำไปสู่การวิเคราะห์ที่ค่อนข้างง่าย จำไว้ว่ามันรวมถึงการแสดงรหัสเป็นคำนำหน้า)

นอกจากนี้ไม่จำเป็นอย่างเคร่งครัดที่จะต้องปฏิบัติตามการกำหนดเวลาที่แน่นอนในการเป็นตัวแทนแบบอะนาล็อก เนื่องจากตัวถอดรหัสของการแปลแบบอะนาล็อกสามารถแยกความแตกต่างของการหยุดสั้นกลางและยาวไม่ว่าจะด้วยวิธีใดก็ตามมันก็ควรเลียนแบบสิ่งที่ทำในกรณีไบนารี ดังนั้นในระยะสั้นและสัญญาณกลาง (ตามจำเป็นโดยหยุด) จะรับรู้เป็นตรรกะหรือdot dashหยุดสั้นจะลืมเป็นเพียงการให้บริการในการทำเครื่องหมายจุดสิ้นสุดของหรือdot dashหยุดกลางจะรับรู้เป็นsepและหยุดยาวได้รับการยอมรับว่าเป็นสองsepในการทดแทน ดังนั้นสัญญาณอะนาล็อกจะถูกแสดงในตัวอักษรประกอบไปด้วยซึ่งสามารถใช้เป็นก่อนที่จะเข้ารหัส 58 ตัวอักษรสัญลักษณ์ การวิเคราะห์เบื้องต้นของเราสามารถใช้งานได้แม้ว่าจะไม่ได้รับการกำหนดเวลาอย่างเคร่งครัด

ผลัดกันสัญญาณ - หยุดชั่วคราวสามารถนำมาใช้เพื่อเปลี่ยนอักษร quinary นี้เป็นหนึ่งในสามประกอบไปด้วยเพียงสามช่วงเวลาที่เป็นสัญลักษณ์ของตัวอักษรและใช้การวิเคราะห์บริบทเพื่อตรวจสอบว่าระยะเวลาที่กำหนดเป็นสัญญาณหรือหยุดชั่วคราว แต่นี่เป็นการวิเคราะห์ที่ซับซ้อนอีกเล็กน้อย

นี่เป็นเพียงการแสดงให้เห็นว่ามีหลายวิธีในการมองสิ่งต่าง ๆ แต่พวกเขาไม่สะดวกและอาจไม่ได้ยืมทั้งหมดเพื่อวิเคราะห์ด้วยเครื่องมือทางคณิตศาสตร์ที่พัฒนาขึ้นเพื่อวิเคราะห์รหัส

เพิ่มเติมการอ้างอิงถึงการจดสิทธิบัตรสามารถพบได้บนอินเทอร์เน็ต

ข้อสรุป

จากการกำหนดเวลามาตรฐานที่แม่นยำคำตอบที่ดีน่าจะพิจารณารหัสมอร์สว่าเป็นองค์ประกอบของการเข้ารหัสคำนำหน้าไตรภาค (จาก 58 ตัวอักษร) เป็น 3 สัญลักษณ์ตัวอักษรประกอบด้วยการเข้ารหัสคำนำหน้าไบนารีของสัญลักษณ์สามตัวนี้

หากไม่มีการกำหนดเวลามาตรฐานที่แม่นยำจะไม่สามารถพิจารณาระดับไบนารีได้อีกต่อไป จากนั้นอนาล็อกเพื่อถอดรหัสตรรกะตามธรรมชาติที่เกิดขึ้นในระดับของตัวอักษรกลางของและdot dashอย่างไรก็ตามตัวถอดรหัสแบบแอนะล็อกกับแบบลอจิคัลสามารถ stil ถอดรหัสเป็นตัวอักษรสัญลักษณ์ 3 ตัวก่อนหน้าดังนั้นจึงรักษาการบังคับใช้การวิเคราะห์ของเรา


1
โปรดย้ายการสนทนาเพิ่มเติมใด ๆ ไปยังchat.stackexchange.com/rooms/21638/…
Wandering Logic

1
ความคิดเห็นไม่ได้มีไว้สำหรับการอภิปรายเพิ่มเติม การสนทนานี้ได้รับการย้ายไปแชท
Raphael

คำถาม: ในอาร์กิวเมนต์ที่ประกอบไปด้วยคุณเริ่มต้นด้วยตัวอักษร {0,1} จากนี้คุณสร้างสี่สัญลักษณ์ {dot = 10, dash = 1110, sep1 = 00, sep2 = 000000} จากนี้คุณสร้างชุดคำที่ประกอบไปด้วยรหัส โดยการอนุญาตให้sep2 = sep1 sep1 sep1 ชุดคำรหัสถูกเลือกเพราะมันผูกสัญลักษณ์โดยนัยกับการเข้ารหัสซึ่งสะดวกและ OP กำลังถามเกี่ยวกับที่เก็บข้อมูลไบนารี อย่างไรก็ตามทำไมคุณไม่สามารถใช้ชุดคำรหัส {rest = 0, on = 1} แทนพูดว่า "dot = on", "dash = on on on", sep0 = "off", sep1 = "off off off" , sep2 = "off off off off off off off" (โดยที่ sep0 เป็นส่วนที่เหลือระหว่างจุด)
Jason C

^ ในกรณีนี้อาร์กิวเมนต์สำหรับคำรหัสไบนารี่ที่ตั้งอยู่เหนือคำที่ประกอบไปด้วยสามส่วน แต่ใช้อาร์กิวเมนต์ที่คล้ายกันและมีความเข้มพอ ๆ กันกับคำที่ประกอบไปด้วยที่นี่ นั่นคือการเลือกที่จะให้ความหมายพิเศษกับตัวคั่นหลายตัวในแถว แต่ไม่ได้ให้ความหมายพิเศษกับสิ่งใด ๆ หลายอย่างในแถวนั้นเป็นพื้นฐานของการโต้แย้งแบบไตรภาค แต่ก็ดูเหมือนว่าโดยพลการ
Jason C

1
ขอให้เรายังคงอภิปรายนี้ในการแชท
babou

28

คำตอบนี้ไม่นานเท่าที่ดู; ไซต์นี้มีระยะห่างระหว่างรายการมาก! อัปเดต: จริงๆแล้วมันใช้เวลาค่อนข้างนาน ...

รหัสมอร์สไม่ได้เป็นแบบ "เป็นทางการ" เลขฐานสอง, สามส่วน, สี่, สี่หรือสี่หรือแม้กระทั่ง 57-ary (ถ้านับอย่างถูกต้อง) การโต้เถียงเกี่ยวกับสิ่งที่ไม่มีบริบทไม่ได้ผล มันขึ้นอยู่กับคุณที่จะกำหนดซึ่งในบรรดาห้ามันจะขึ้นอยู่กับการประยุกต์ใช้และความต้องการการเข้ารหัสสำหรับสถานการณ์เฉพาะของคุณของคุณ ด้วยเหตุนี้จึงมีข้อดีและข้อเสียสำหรับแต่ละชุดขนาดสัญลักษณ์ซึ่งคุณควรพิจารณาถึงสถานการณ์ของคุณก่อนตัดสินใจ

สำหรับพื้นฐานM.1677มาตรฐานรหัสมอร์สสากลส่วนที่ 2 กำหนดเวลาเป็น:

2 ระยะห่างและความยาวของสัญญาณ
2.1เส้นประมีค่าเท่ากับสามจุด
2.2ช่องว่างระหว่างสัญญาณที่มีตัวอักษรเดียวกันมีค่าเท่ากับหนึ่งจุด
2.3ช่องว่างระหว่างตัวอักษรสองตัวมีค่าเท่ากับสามจุด
2.4ช่องว่างระหว่างคำสองคำมีค่าเท่ากับเจ็ดจุด

โปรดทราบว่าการกำหนดเวลาเท่านั้นเช่นเส้นประไม่ได้หมายถึงสิ่งเดียวกันกับสามจุดมันเป็นเพียงความยาวเท่ากัน หน่วยพื้นฐานของเวลาคือจุด


เลขฐานสอง

เราสามารถเลือกไบนารีได้ถ้าต้องการ มันเป็นไปได้ที่จะเป็นตัวแทนของรหัสมอร์สด้วย "binary binary" ในขณะที่คุณเรียกว่า - วิธีการของผู้เขียนคือการกำหนดตัวเลขให้กับ "จุด" และ "เส้นประ" วิธีการดังกล่าวใช้ไม่ได้และฉันไม่คิดว่าผู้เขียนจะเข้าใจรหัสมอร์สได้อย่างมั่นคง แต่มีวิธีการอื่นที่ใช้งานได้ หากเราเลือกไบนารีเราจะแสดงว่าสัญญาณนั้นสูงหรือต่ำโดยแต่ละสัญลักษณ์มีส่วนแบ่งเวลาเป็นจุดเดียว โปรดทราบว่านี่เป็นวิธีการที่อธิบายไว้ในหน้ารายการรหัสไบนารีที่คุณอ้างถึง

การเลือกไบนารีการเข้ารหัสแบบอื่นสามารถเลือกได้เช่นกัน (เช่นคำตอบของบ็อบจาร์วิส ) โดยเพิ่มค่าความยากในการถอดรหัสกลับไปที่รหัสมอร์สที่ได้ยินได้ (การเข้ารหัสของบ๊อบไม่สามารถถอดรหัสแบบไร้รัฐได้เช่นการแลกเปลี่ยน

สัญลักษณ์:

  • ต่ำ, ปิด, ฯลฯ (0)
  • สูง, เปิด, ฯลฯ (1)

ตัวอย่างการเข้ารหัส:

  • ตัวแยกสัญญาณ: 0
  • ตัวคั่นจดหมาย: 000
  • ตัวคั่นคำ: 0000000
  • สามจุด: 10101
  • สามขีดกลาง: 11101110111
  • คำว่า "ลูกชาย": 101010001110111011100011101
  • วลี "คือ": 10100010101000000010111

ข้อดี:

  • ขนาดชุดสัญลักษณ์ที่น้อยที่สุด
  • จัดการได้อย่างง่ายดายด้วยตรรกะดิจิตอลทั่วไป
  • ง่ายต่อการถอดรหัสลงในรหัสมอร์สที่ได้ยินได้ การถอดรหัสแบบไร้รัฐและไม่ต้องการข้อมูลการจัดเก็บเกี่ยวกับเวลาของสัญลักษณ์ (ทุกสัญลักษณ์มีความยาวเท่ากัน)

จุดด้อย:

  • การเข้ารหัสที่ยาวนาน
  • โอกาสมากมายสำหรับการเข้ารหัสที่ไม่ถูกต้อง
  • ความหมายสัญลักษณ์ส่วนบุคคล (0, 1) ขึ้นอยู่กับบริบท


ประกอบไปด้วย 3 อย่าง

ด้วยตัวเลือกนี้เราให้คำจำกัดความตัวอักษรและคำว่าการเว้นระยะและการเว้นระยะสัญญาณนั้นเป็นนัย (แม้ว่าคุณสามารถเลือกที่จะต้องการสัญลักษณ์ที่มีความยาวจุดระหว่างสัญญาณหากมันเหมาะกับคุณมากกว่า)

สัญลักษณ์:

  • ที่เหลือความยาวดอท (0)
  • จุด (1)
  • เส้นประ (2)

ตัวอย่างการเข้ารหัส:

  • ตัวคั่นจดหมาย: 000
  • ตัวคั่นคำ: 0000000
  • สามจุด: 111
  • สามขีดกลาง: 222
  • คำว่า "ลูกชาย": 11100022200021
  • วลี "คือ": 11000111000000012

ข้อดี:

  • ชุดสัญลักษณ์ขนาดเล็ก
  • ไม่จำเป็นต้องใช้ตัวแยกสัญญาณอีกต่อไป
  • ความยาวการเข้ารหัสที่สั้นกว่าไบนารี
  • ลบการเข้ารหัสที่ไม่ถูกต้องออกบางส่วน (เช่น 0110 ด้วยตัวเลือกไบนารีไม่สามารถทำได้อีกต่อไป)

จุดด้อย:

  • ยังคงการเข้ารหัสที่มีความยาว
  • ยังคงมีความเป็นไปได้มากมายสำหรับการเข้ารหัสที่ไม่ถูกต้องโดยเฉพาะอย่างยิ่งที่วาง
  • ไม่สามารถถอดรหัสแบบไร้รัฐเว้นแต่ว่าคุณเลือกที่จะวางความยาวจุดที่ชัดเจนระหว่างสัญญาณ
  • ตัวคั่นสัญญาณนั้นมีความหมายโดยนัยนอกจากว่าคุณเลือกที่จะวางความยาวจุดที่ชัดเจนระหว่างสัญญาณ
  • ความหมายสัญลักษณ์แต่ละอย่างบางอย่าง (0) ขึ้นอยู่กับบริบท


ประกอบด้วยสี่

สัญลักษณ์:

  • ตัวคั่นจดหมาย (0)
  • ตัวแยกคำ (1)
  • จุด (2)
  • เส้นประ (3)

ตัวอย่างการเข้ารหัส:

  • สามจุด: 222
  • สามขีดกลาง: 333
  • คำว่า "ลูกชาย": 2220333032
  • วลี "คือ": 220222123

ข้อดี:

  • ความยาวที่เข้ารหัสสั้นมาก
  • ความเป็นไปได้ของการเข้ารหัสที่ไม่ถูกต้องลดลง
  • สัญลักษณ์มีความแม่นยำทางความหมาย
  • เนื้อหามนุษย์อ่านง่ายขึ้น

จุดด้อย:

  • ชุดสัญลักษณ์ขนาดใหญ่
  • ไม่สามารถถอดรหัสแบบไร้รัฐได้
  • ตัวแยกสัญญาณเป็นสิ่งที่แน่นอน


quinary

การตีความโดยตรงของรายการของ Wikipedia หมายเหตุนี้คล้ายกับตัวเลือกไบนารียกเว้นชุดที่ถูกต้องต่าง ๆ ของไบนารี 0 หรือ 1 จะได้รับสัญลักษณ์ของตนเอง

สัญลักษณ์:

  • ตัวแยกสัญญาณ (0)
  • ตัวคั่นจดหมาย (1)
  • ตัวแยกคำ (2)
  • จุด (3)
  • เส้นประ (4)

ตัวอย่างการเข้ารหัส:

  • สามจุด: 30303
  • สามขีดกลาง: 40404
  • คำว่า "ลูกชาย": 303031404041403
  • วลี "คือ": 3031303032304

ข้อดี (เมื่อเทียบกับสี่):

  • สามารถถอดรหัสได้อย่างไร้สัญชาติ
  • ขนาดชุดสัญลักษณ์เพียงอย่างเดียวที่ไม่น่าสงสัยโดยตรงและรัดกุมแสดงวัตถุห้าอย่างที่กล่าวถึงในส่วนที่ 2 ของมาตรฐาน: "จุด" (ซึ่งการกำหนดเวลาทั้งหมดสัมพันธ์กับ), "ขีด", "ช่องว่างระหว่างสัญญาณ", "ช่องว่างระหว่าง ตัวอักษรสองตัว "," เว้นวรรคระหว่างคำสองคำ "

ข้อเสีย (เทียบกับสี่):

  • ความเป็นไปได้ที่สูงขึ้นสำหรับการเข้ารหัสที่ไม่ถูกต้อง
  • เพิ่มความยาวการเข้ารหัสโดยไม่ต้องเพิ่มข้อมูลพิเศษ (ความง่ายในการถอดรหัสจะลดลง)
  • ไม่ใช่เรื่องง่ายที่จะถอดรหัสเป็นตัวเลือกไบนารีเพราะสัญลักษณ์แต่ละอันมีความยาวต่างกันและต้องรักษาความสัมพันธ์นี้ไว้ที่อื่น


57 Ary:

รวมถึงเพื่อความสมบูรณ์

สัญลักษณ์:

  • 26 ตัวอักษร
  • 10 ตัวเลข
  • เครื่องหมายวรรคตอน 20 เครื่องหมายและเครื่องหมายเบ็ดเตล็ด
  • ตัวแยกคำ (ช่องว่าง)

ตัวอย่างการเข้ารหัส:

  • คำว่า "ลูกชาย": son
  • วลี "คือ": is a

ข้อดี:

  • การเข้ารหัสที่สั้นที่สุด
  • มนุษย์อ่านได้
  • การเข้ารหัสไม่ถูกต้องเป็นไปไม่ได้

จุดด้อย:

  • ชุดสัญลักษณ์ที่ใหญ่ที่สุด
  • ถอดรหัสเป็นรหัสมอร์สได้ยาก จำเป็นในการรักษาตารางลำดับรหัสเอาท์พุทของมอร์สสำหรับแต่ละสัญลักษณ์และจำเป็นในการตรวจสอบขอบเขตของคำและตัวอักษรที่อยู่ติดกันเพื่อกำหนดตำแหน่งที่จะแทรกวางต่างๆ
  • เป็นไปไม่ได้ที่จะขยายเกินข้อกำหนดของรหัสมอร์สโดยไม่ต้องเพิ่มสัญลักษณ์ใหม่ (แลกเปลี่ยนเพื่อป้องกันการเข้ารหัสที่ไม่ถูกต้อง)
  • ตัวแยกสัญญาณและตัวอักษรมีความหมายโดยนัย

การสิ้นสุด

สำหรับการจัดเก็บเป็นสตรีมสัญลักษณ์บนอุปกรณ์หากคุณจำเป็นต้องทำเช่นนั้นมันก็คุ้มค่าที่จะสังเกตได้ว่า M.1677 กำหนดลำดับการยกเลิกข้อความและการส่งสัญญาณ จากส่วนที่สอง:

5โทรเลขทุกเครื่องจะต้องสิ้นสุดด้วยสัญญาณไขว้ (. -. -.)
6จุดสิ้นสุดของการส่งสัญญาณจะต้องระบุด้วยสัญญาณไขว้ (. -. -.) ตามด้วยคำเชิญให้ส่งสัญญาณ K (-. -)
7การสิ้นสุดการทำงานจะถูกระบุโดยสถานีที่ส่งโทรเลขล่าสุด ข้อบ่งชี้ที่ถูกต้องคือสัญญาณสิ้นสุดการทำงาน (.... -. -)

น่าเสียดายที่มาตรฐานเงียบในความสามารถในการแยกแยะเช่นสตริง "+ K" จากลำดับ ( end-of-telegram , คำเชิญเพื่อส่งสัญญาณ ) อย่างไรก็ตามการสิ้นสุดการทำงานนั้นไม่เหมือนใคร หากคุณกำลังเก็บรหัสมอร์สคุณจะต้องเลือกว่าคุณต้องการระบุจุดสิ้นสุดของลำดับที่จัดเก็บไว้อย่างไร

หากคุณกำลังจัดเก็บการสนทนาทั้งหมดและใช้ชุดสัญลักษณ์ไบนารีคุณอาจพิจารณาถึงการสิ้นสุดการทำงานว่าเป็นตัวบ่งชี้ลำดับสุดท้ายโดยมีเหตุผลแสดงเป็นลำดับบิตที่ไม่ซ้ำกัน 101010111010111 คุณต้องพิจารณาประเภท ของข้อมูลที่คุณจัดเก็บ (เช่นชิ้นส่วนข้อความ, ข้อความทั้งหมด, บทสนทนาทั้งหมด) รวมถึงสิ่งอำนวยความสะดวกที่คุณได้รับจากสื่อบันทึกข้อมูลของคุณ (เช่นความสามารถในการนำหน้าด้วยความยาวของข้อความ) ก่อนที่จะตัดสินใจ ฉันคิดว่าคุณสามารถไปได้ไกลถึงการกำหนดตัวบ่งชี้ลำดับท้ายของคุณเอง ไม่ว่าในกรณีใด ๆ สิ่งเหล่านี้เป็นเรื่องของการจัดเก็บข้อมูลพื้นฐานและมีความเป็นไปได้มากเกินกว่าที่จะแสดงรายการได้ที่นี่ ตัวเลือกขึ้นอยู่กับคุณจริงๆตามสิ่งที่เหมาะสมกับสถานการณ์ของคุณ


ไม่สามารถถอดรหัสได้อย่างไร้รัฐ: การเข้ารหัสเหล่านี้ต้องการสถานะบางอย่างในการที่จะถอดรหัสเป็นรหัสมอร์สที่ได้ยินได้ พวกเขาทั้งหมดต้องการ "ถ้าสัญลักษณ์ก่อนหน้านี้เป็นจุด / เส้นประและสัญลักษณ์ปัจจุบันคือจุด / ขีดกลางจากนั้นแทรกตัวแยกสัญญาณ" ในขณะที่คุณสามารถลองและ "โกง" และผนวกตัวแยกสัญญาณให้กับสัญลักษณ์ทั้งหมดโดยอัตโนมัติในขณะที่ลดตัวคั่นคำเหลือ 5 ตัวและตัวคั่นตัวอักษรเหลือ 1, M.1677 afaict ไม่ได้ห้ามตัวคั่นคำต่อเนื่องกันอย่างชัดเจน

separ ตัวคั่นสัญญาณมีความหมายโดยนัย:สิ่งนี้เกี่ยวข้องโดยตรงกับข้อความด้านบน แต่มีความหมายเชิงความหมายมากกว่า การเข้ารหัสเหล่านี้มีตัวคั่นสัญญาณโดยนัยในสัญกรณ์ของพวกเขา นั่นคือ "zzz" คือสังหรณ์สามซีที่แยกจากกันขอบเขตคือ "piggybacked" ในทุกสิ่งที่แยกสัญลักษณ์ในการเข้ารหัสเอง พิจารณาคำอธิบาย "จุดสามจุดในแถว"; เราใช้นี่เพื่อหมายถึงสามแยกกันโดยสังหรณ์ใจจุด แต่ถ้าตัวคั่นไม่ได้บอกเป็นนัยก็สามารถนำไปแยกไม่ออกจากเส้นประ เฉพาะไบนารีและวิกิพีเดียสไตล์วิกิพีเดีย (หรือสามส่วนที่มีตัวเลือกตัวแยกสัญญาณอย่างชัดเจน) เท่านั้นที่จะลบความกำกวมและ "ทางลัด" ทั้งหมดที่นี่ซึ่งอาจมีค่ามากขึ้นอยู่กับสถานการณ์ ด้วยเหตุนี้เองที่ทำให้มีการโต้แย้งอย่างมากสำหรับการเลือกแบบ quinary


TL; DR:

ขณะที่คุณสามารถดูมีข้อดีและข้อเสียในแต่ละครั้งและมันก็ขึ้นอยู่กับคุณที่จะตัดสินใจว่าคุณต้องการที่จะรักษามันขึ้นอยู่กับความต้องการของคุณ ไม่มีคำตอบที่ถูก คุณสามารถพยายามยืนยันว่าข้อใดข้อหนึ่งเหมาะสมกว่าข้ออื่น ๆ โดยทั่วไป แต่ข้อโต้แย้งเหล่านี้จะทำให้ความพึงพอใจของคนอวดดีโดยไม่มีบริบท

ตอนนี้ทั้งหมดที่กล่าวในความคิดของฉันตัวเลือก quinary เป็นตัวแทนที่รู้สึก "ถูก" ที่สุดสำหรับฉันสำหรับรหัสมอร์สตัวเอง (เดิมฉันชอบ quaternary) มันเป็นตัวเลือกเดียวที่ให้สิ่งต่อไปนี้ทั้งหมด:

  • สัญลักษณ์ที่ไม่มีบริบท (สัญลักษณ์ของมันเองมีข้อมูลทั้งหมดเกี่ยวกับความหมายโดยไม่ต้องตรวจสอบสัญลักษณ์ที่อยู่ติดกัน)
  • เป็นตัวแทนของดั้งเดิมทั้งหมดที่กำหนดไว้ใน M.1667
  • ตัวคั่น (สัญญาณ, ตัวอักษร, คำ) ไม่ได้บอกเป็นนัยโดยสัญกรณ์หรือการเข้ารหัสพื้นฐาน (นี่เป็นสิ่งสำคัญถ้าฉันเขียนสิ่ง{ dot, dot, dash }เหล่านั้น,มีความสำคัญ

อย่างไรก็ตามมีข้อโต้แย้งที่แข็งแกร่งสำหรับทุกคน ข้อโต้แย้งที่เกี่ยวข้องกับการเข้ารหัสยังใช้กับการรักษาของมอร์สเอง ไม่มีคำตอบที่เป็นรูปธรรม 100% แต่แน่นอนว่ามันสามารถสร้างหัวข้อที่ดีสำหรับการอภิปรายกับเพื่อนของคุณที่บาร์

. . . - -


1
โปรดย้ายการสนทนาเพิ่มเติมใด ๆ ไปยังchat.stackexchange.com/rooms/21638/…
Wandering Logic

1
ความคิดเห็นไม่ได้มีไว้สำหรับการอภิปรายเพิ่มเติม การสนทนานี้ได้รับการย้ายไปแชท
Raphael

คุณอ้างอิงถึงการถอดรหัสแบบไร้รัฐในอาร์กิวเมนต์ของคุณ ในทฤษฎีการเข้ารหัสดูเหมือนว่ารัฐจะใช้งานได้น้อยมากในรหัส convolutional ซึ่งเป็นตระกูลของการแก้ไขข้อผิดพลาด นี่เป็นหัวข้อที่ไม่สมบูรณ์เนื่องจากรหัสมอร์สเป็นอะไรก็ได้ยกเว้นการแก้ไขข้อผิดพลาด แน่นอนมันไม่สามารถตรวจจับข้อผิดพลาดบางบิตได้ คุณประดิษฐ์รหัสโดยพลการหลายประเภทว่าเป็นรุ่นของรหัสมอร์ส แต่พวกเขาก็ไม่เข้าใจ นำเสนอพวกเขาทำไม ไม่ต้องการสถานะเช่นการเข้ารหัสโฮโมมอร์ฟิคดูเหมือนว่าเป็นข้อกำหนดขั้นต่ำ และคุณพลาดการเข้ารหัสที่น่าสนใจ cc @KorayTugay
babou

@babou ข้อโต้แย้งการถอดรหัสไร้กฎ?
Koray Tugay

@babou ฉันไม่รังเกียจที่จะมีประเด็นนอกประเด็น แน่นอนว่าชุดสัญลักษณ์นั้นเป็นกฎเกณฑ์ นั่นคือจุดที่ฉันทำกับคำตอบนี้ คำที่ประกอบไปด้วยคำที่ตั้งอยู่ด้านบนของอาร์กิวเมนต์รหัสคำนำหน้าไบนารีนั้นเป็นกฎเกณฑ์ที่เท่าเทียมกัน เมื่อมองอย่างรวดเร็วครั้งแรกไม่ แต่โดยพื้นฐานแล้วคุณได้เลือกตัวเลือกเพื่อตั้งค่าอาร์กิวเมนต์บนชุดคำของรหัสด้วยตัวอักษรสองตัว (0 และ 1) มันเป็นตัวเลือกโดยพลการเพราะตัวเลือกที่จะให้ความหมายพิเศษ "sep sep sep" แต่ไม่ได้ทำเพื่อ "หน่วยที่ 1" เป็นเรื่องที่ไม่มีเหตุผล คุณสามารถพูดได้อย่างง่ายดายว่า "เส้นประ" คือ "จุดจุดจุด" และโต้แย้งสำหรับไบนารีมากกว่าสามส่วน
Jason C

5

แม้จะมีความคิดเริ่มต้นของฉันเกี่ยวกับเรื่องนี้ แต่กลับกลายเป็นว่าคำถามนี้สามารถทำเป็นระเบียบในลักษณะที่ยอมรับคำตอบที่ค่อนข้างแม่นยำ (modulo สองประเด็นที่มีคำจำกัดความ) คำตอบจะออกมาเป็น 3 หรือ 4 คือไตรภาคหรือ quaternary "ทุกอย่างเริ่มตั้งแต่ 2 ถึง 57" คำตอบที่ถูกต้องเฉพาะในแง่ที่ว่าถ้ามีคนถามคุณสำหรับลักษณะของกลุ่มชาว Abelian คุณบอกเขาว่าพวกเขาถูกวาง

เริ่มต้นด้วยการดูที่การเข้ารหัสทางกายภาพสำหรับรหัสมอร์ส นั่นคือ B ASKจริง ๆนั่นคือไบนารีแอมพลิจูด-shift keying ซึ่งเป็นวิธีที่ซับซ้อนที่บอกว่ามีแอมพลิจูดทางกายภาพ (ไฟฟ้า / ออปติคัล ฯลฯ ) สองระดับเพื่อให้เราเข้ารหัสข้อความของเรา ดังนั้นคำถามทันทีคือ: นี่ไม่ได้หมายความว่าคำตอบคือรหัสมอร์สเป็นเลขฐานสอง? ดีก็ไบนารีเท่านั้นในทางที่ค่อนข้างไม่ใช่ข้อมูลในแง่ที่ว่าไบนารี / ปิดสัญญาณที่ส่งผ่านสายไม่สอดคล้องโดยตรงกับสายหรือจุดใดอย่างหนึ่ง ในระดับการติดต่อที่คลุมเครือนี้เราสามารถส่งรหัส ASCII (ด้วยการเข้ารหัสบิตโดยตรงและชัดเจน) และเรียกมันว่า "มอร์ส" และ / หรือ "ไบนารี"; เช่นเดียวกับรหัส Huffman ใด ๆ (แทน ASCII)

M:MT* * * *TT* * * *T{0,1}* * * *

TTT* * * *TTมีคำศัพท์ที่แตกต่างกันซึ่งการแมปใด ๆ เป็นรหัส แต่สิ่งที่สามารถถอดรหัสได้นั้นมีการกล่าวถึงและรหัสย่อของ UD ที่นี่ฉันจะเป็นเพียงคำศัพท์หลัง คุณจะเห็นอีกไม่ช้าทำไมฉันพูดว่า "นึกคิด")

TTT

TT

just-dotjust-lineunit-spaceletter-spaceword-spaceunit-spacejust-dotjust-line0just-dotjust-line

  • dit= just-dot unit-space= 10 และ
  • dah= just-line unit-space= 1110

ditเพื่อให้เป็นรหัสมอร์สสี่: dah, letter-space, word-space, การสังเกตครั้งต่อไปคือword-spaceสามารถประมาณ (หรือสันนิษฐานได้ว่า) สองletter-spaceวินาทีคือหกศูนย์ ดังนั้นวิธีที่คุณจะได้รับชุดคำศัพท์ประกอบไปด้วย เป็นข้อมูลอ้างอิงสำหรับสายของเหตุผลนี้เห็นเช่น[1] [2]

T={10,1110,000}{10,1110,000,07}010=0307=0703ดังนั้นจึงมีการแยกตัวประกอบที่ไม่ซ้ำกัน ขณะนี้เป็นทฤษฎีปัญหาก็คือไม่มีความกังวลในทางปฏิบัติเพราะมนุษย์ "จังหวะ" ได้ยากลำบากในการวัดความเงียบนานมากแล้วดังนั้นโดยทั่วไปเงียบ ๆ นานกว่าความยาวบางสันนิษฐาน (โดยมนุษย์) จะเป็นword-spaceของแปลก

00000T1420T0

ditdahletter-spaceletter-spacejust-linejust-dotunit-space0ditdah000

นอกจากนี้คุณยังสามารถใช้การคำนวณเอนโทรปีวิธีการ trit สมมติdahและditและletter-spaceเป็น "เทียบเท่า" เป็น trits [3]ในแง่ที่ว่าสำหรับตัวอย่าง'e' ใช้เวลา 2 trits และ 'Y' ใช้เวลา 5 trits แนวทาง trit แบบนามธรรมนั้นไม่มีประโยชน์หากคุณสนใจว่าแต่ละสัญลักษณ์มีราคาแพงเพียงใดในการส่งสัญญาณในการเข้ารหัส BASK Morse จริงในบรรทัด สำหรับหลังคุณต้องลงไปที่ความยาวบิตจริงของสัญลักษณ์ 3 (หรือ 4) ซึ่งถูกมองว่าเป็นช่วงการเปลี่ยนภาพในหุ่นยนต์ ตัวอย่างเช่นตัวอักษร 'e' ใช้เวลา 5 บิตในการเข้ารหัส (เป็นdit letter-space) ในขณะที่ 'y' ใช้เวลา 17 บิต (สามdahวินาทีหนึ่งditและหนึ่งletter-space) แนวความคิดนี้กลับไปที่แชนนอน (ดูหน้า 3-4) รายละเอียดเพิ่มเติมสามารถพบได้ใน "ข้อมูลและการเข้ารหัสของทฤษฎี Blahut e กรัมเขาคำนวณ" เฉลี่ย 9.296 หน่วยเวลาส่งสัญญาณต่อแหล่งเอาท์พุทจดหมาย "สำหรับรหัสมอร์สใช้รหัสมอร์ส (โดยไม่มีเงื่อนไข) ความน่าจะเป็นของเหตุการณ์ที่เกิดขึ้นในภาษาอังกฤษ สำหรับการแสดงออกที่แตกต่างกันเล็กน้อย (โดยนักสัตววิทยา!) คุณสามารถดูJP Hailman's ; เขาได้รับค่าเฉลี่ยที่แตกต่างกัน (10.2) เพราะเขาถือว่าความน่าจะเป็นที่แตกต่างกันเล็กน้อยสำหรับตัวอักษรภาษาอังกฤษ แต่การวิเคราะห์ของเขาเป็นแนวคิดเดียวกัน

เพื่อสรุปสิ่งนี้: คุณสามารถดูได้หลายมุมมองของรหัสมอร์ส แต่บางคนก็มีผลมากกว่าคนอื่น ๆ ในการพูดสิ่งที่น่าสนใจเกี่ยวกับมัน ฉันไม่ได้ตระหนักถึงการวิเคราะห์ใด ๆ โดยใช้มุมมอง "quinary" และเพื่อให้แบบจำลองนี้ไม่สามารถลดสัญลักษณ์สี่ตัวที่คุณจะต้องตั้งสมมติฐานเกี่ยวกับการเกิดขึ้นของพื้นที่หน่วยที่ไม่ได้อยู่ในมอร์สจริง เช่นว่าคุณอาจมีช่องว่างหน่วยสองช่อง แต่ไม่จำเป็นต้องอยู่ติดกันสามช่อง (ซึ่งเป็นมอร์สที่ไม่ถูกต้อง) มุมมองที่ประกอบไปด้วยสามซื้อการวิเคราะห์อย่างรวดเร็วของความสามารถในการถอดรหัสที่เป็นเอกลักษณ์ มุมมองที่ลึก / มีผลมากที่สุดคือสิ่งที่มองเห็นสัญลักษณ์ 3 หรือ 4 ตามที่แสดงจริงโดยจำนวนบิตที่ไม่เท่ากันเนื่องจากอยู่ในรหัสมอร์สจริง (| dit| = 2, | dah| = 4, | letter-space| = 3 และ |word-space| = 6 หรือ 7); มันยังคงลึกซึ้งในระดับต่ำนี้เพื่อพิจารณาสัญลักษณ์ที่ประกอบไปด้วยสามส่วน / เป็นการเปลี่ยนผ่านในหุ่นยนต์

ทำไมวิกิพีเดียถึงเข้าใจเรื่องนี้ ... ในบางหัวข้อก็ทำได้ บทความหลักของพวกเขาในhttp://en.wikipedia.org/wiki/Coding_theoryไม่ใช่สิ่งที่ฉันอยากจะแนะนำให้อ่าน ฉันไม่สามารถพูดอะไรมากเกี่ยวกับหนังสือ (Petzold) ที่คุณพูดถึงนอกเหนือไปจากที่มันไม่ปรากฏโดยผู้เชี่ยวชาญในทฤษฎีข้อมูล Petzold นั้นถูกต้องเฉพาะในกรณีที่ว่าหากข้อความที่เขียนด้วยรหัสมอร์สประกอบด้วยจดหมายเพียงฉบับเดียวคุณอาจบอกได้ว่าพวกเขาอยู่ในรหัสไบนารี่ ถ้าคุณต้องการส่งคำคุณต้องมีตัวคั่นตัวอักษรมิฉะนั้นรหัสจะไม่ใช่ UD อย่างน่ากลัวจนถึงจุดที่ทำไม่ได้


letter-spaceletter-spaceditdahletter-spaceT={10,1110,00}. นั่นหมายถึงว่า (ตัวอย่าง) ขนาดของ 'e' เป็นเพียง 4 บิตไม่ใช่ 5


โปรดย้ายการสนทนาเพิ่มเติมใด ๆ ไปยังchat.stackexchange.com/rooms/21638/…
Wandering Logic

ความคิดเห็นไม่ได้มีไว้สำหรับการอภิปรายเพิ่มเติม การสนทนานี้ได้รับการย้ายไปแชท
Raphael

-1

ในขั้นต้นรหัสมอร์สตั้งใจที่จะเขียนเครื่องหมายบนกระดาษ แต่ผู้ประกอบการโทรเลขก็สามารถ "อ่าน" การคลิกของอุปกรณ์ รุ่นมอร์ส (อเมริกันหรือ "แผ่นดิน" มอร์ส) นี้มีองค์ประกอบสาม "เครื่องหมาย" จุด, เส้นประและเส้นประยาว

การใช้งาน International Morse ในช่วงศตวรรษที่ผ่านมาการส่งสัญญาณวิทยุมักจะถูกเข้ารหัสด้วยมือ (บนกุญแจโทรเลข) และถอดรหัสด้วยหูโดยฟังรูปแบบเสียงบี๊บจากเครื่องรับ ผู้ประกอบการที่มีทักษะจะได้รับดีกว่าไม่มีทักษะและบางคนสามารถสร้างรหัสที่เข้าใจง่ายกว่าของผู้อื่น ผู้ประกอบการส่งสัญญาณที่ดีกล่าวกันว่ามี "กำปั้นดี" ตัวดำเนินการ inept ถูกเรียกว่า LID (สำหรับต้นกำเนิดของ "ฝา" - ซึ่งฉันเชื่อว่ามาจากข้อผิดพลาดทั่วไปใน American Morse ในการส่ง LID สำหรับ DD, daaahh, dit dit, dah dit dit แทน dah dit dit, dit dit dit - ดูเอกสารอ้างอิงนี้: https://english.stackexchange.com/questions/31818/how-did-the-word-lid-come-to-mean-poor-operator-in-the-context-of-telegraph )

ดังนั้นมันจึงตามมาว่า "การเข้ารหัส" ของมอร์สในรูปแบบไบนารี่ขึ้นอยู่กับจุดประสงค์และทำให้คุณภาพของ "กำปั้นดี" กับ "หมัดแย่" นั้นจะต้องรักษาไว้หรือไม่ เป็นสตริงของการสลับเปิดและปิดที่จะจับคู่กับนาฬิกาและ "แก้ไข" สำหรับความยากลำบากในเฟสหรือระยะเวลาของสัญญาณแต่ละส่วนหรือไม่? หรือว่าแทนที่จะเก็บตัวอย่างในอัตราที่เพียงพอเพื่อรักษาความแตกต่างแบบสุ่มหรือสับสนทำให้สันนิษฐานได้ว่าเป็นการตรวจสอบหรือความสุขในภายหลัง


1
ขออภัยคำถามนี้ตอบคำถามได้อย่างไร
Koray Tugay
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.