รหัสมอร์สเป็นรหัส ternary ของคำนำหน้า (สำหรับการเข้ารหัส 58 ตัวอักษร) ที่ด้านบนของรหัสไบนารี่คำนำหน้าการเข้ารหัสสามสัญลักษณ์
นี่เป็นคำตอบที่สั้นกว่ามากเมื่อยอมรับ อย่างไรก็ตามเมื่อพิจารณาถึงความเข้าใจผิดระหว่างผู้ใช้และจากการร้องขอจาก OP ฉันได้เขียนคำตอบที่ยาวกว่านี้มาก ส่วน "สั้น" ครั้งแรกช่วยให้คุณมีส่วนสำคัญของมัน
สารบัญ
โดยสังเขป (ใหญ่)
เมื่อถามว่า "รหัสมอร์สคือเลขฐานสองแบบสามส่วนหรือสามส่วน" ไม่มีการเปรียบเทียบคำตอบที่เป็นไปได้เว้นแต่จะมีการแก้ไขเกณฑ์บางอย่างสำหรับคำตอบที่ยอมรับได้ อันที่จริงหากไม่มีเกณฑ์ที่เหมาะสมเราสามารถอธิบายคำอธิบายสำหรับโครงสร้างเกือบทุกชนิด เกณฑ์ที่ฉันเลือกมีดังต่อไปนี้:
มันควรจะสะท้อนให้เห็นถึงคำอธิบายสามชั้นของรหัสมอร์สกับการเป็นตัวแทนจุด / ประในชั้นที่สอง;
ควรเหมาะสมกับการนำเสนอและเครื่องมือทางคณิตศาสตร์ที่พัฒนาขึ้นสำหรับการวิเคราะห์เชิงทฤษฎีของรหัสมากที่สุด
ควรง่ายที่สุด
มันควรทำให้ชัดเจนคุณสมบัติของรหัสมอร์ส
สิ่งนี้มีจุดประสงค์เพื่อป้องกันการแฮ็กโดยพลการซึ่งไม่สนใจแนวคิดพื้นฐานของทฤษฎีรหัสว่าเป็นการศึกษาทางวิทยาศาสตร์และอาจมีการอุทธรณ์โดยให้ภาพลวงตาของการวิเคราะห์อย่างเป็นระบบแม้ว่าจะได้ข้อสรุปที่ไม่เป็นทางการ เว็บไซต์นี้ควรเกี่ยวกับ
วิทยาศาสตร์คอมพิวเตอร์ไม่ใช่การเขียนโปรแกรม เราควรใช้วิทยาศาสตร์ขั้นต่ำที่จัดตั้งขึ้นและแนวคิดที่เป็นที่ยอมรับเพื่อตอบคำถามทางเทคนิค
การวิเคราะห์อย่างรวดเร็วของมาตรฐานแสดงให้เห็นว่าสัญลักษณ์ทั้งหมดที่ใช้ในรหัสมอร์สในที่สุดได้รับการเข้ารหัสในไบนารีเพราะมันถูกส่งเป็นสตริงของหน่วยความยาวเท่ากันซึ่งมีสัญญาณที่สามารถเปิดหรือปิดสำหรับแต่ละหน่วย นี้แสดงให้เห็นว่าข้อความที่มอร์สจะเขียนในท้ายที่สุดตัวอักษรตรรกะ }Σ1={0,1}
แต่นั่นไม่ได้กล่าวถึงโครงสร้างภายในของโค้ดเลย ข้อมูลที่จะเข้ารหัสเป็นสตริงบนตัวอักษร 58 สัญลักษณ์ (ตามมาตรฐาน) รวมถึง 57 ตัวอักษรและช่องว่าง สิ่งนี้สอดคล้องกับตัวอักษร
symbl สุดท้ายเป็นพื้นที่Σ3={A,B,…,Z,0,1,…,9,?,=,…,×,@,[]}
อย่างไรก็ตามมาตรฐานระบุว่ามีตัวอักษรกลาง
ขึ้นอยู่กับและและสัญลักษณ์อื่น ๆ มันค่อนข้างชัดเจนΣ2dot
dash
ดังนั้นเนื่องจากไม่มีทางเลือกสำหรับและคำถามจะต้องเข้าใจว่า: " เราควรพิจารณาสัญลักษณ์อะไรจำนวนมากในตัวอักษรกลางเพื่อให้ axplain โครงสร้างและคุณสมบัติของทั้งมอร์สดีที่สุด รหัส "ซึ่งยังหมายถึงการระบุการเข้ารหัสทั้งสองระหว่างสามระดับΣ 3 Σ 2Σ1Σ3Σ2
ให้ความจริงที่ว่ารหัสมอร์สเป็นคำนำหน้า homomorphic (ความยาวตัวแปร) รหัสที่ติ๊ความเคลือบแคลงใด ๆ เมื่อถอดรหัสสัญญาณเราสามารถอธิบายเพียงแค่นี้คุณสมบัติที่สำคัญกับternary อักษร
{ , , } และสองการเข้ารหัสโครงการจาก
ถึงและจากถึงซึ่งทั้ง homomorphic และคำนำหน้าดังนั้นทั้งสองรหัสชัดเจนและสามารถที่จะประกอบด้วยคำนำหน้าชัดเจน การเข้ารหัสสัญลักษณ์ 58 เป็นไบนารี่C 3 → 2 Σ 3 Σ 2 C 2 → 1 Σ 2 Σ 1Σ2=dot
dash
sep
C3 → 2Σ3Σ2C2 → 1Σ2Σ1
ดังนั้นรหัสมอร์สประกอบด้วยคำนำหน้าประกอบไปด้วยรหัสที่แสดงอยู่ในตัวอักษร , ,กับทั้งสามสัญลักษณ์ตัวเองเข้ารหัสในไบนารีกับ codewords ต่อไปนี้:}{ dot
dash
sep
}
dot
→ 1110 → 00→ 10 ,และdash
→ 1110sep
→ 00
โปรดทราบว่าสิ่งที่เรียกว่าช่องว่างระหว่างต่อเนื่องdot
หรือdash
รวมอยู่ในการเป็นตัวแทนของจริงdot
และdash
เพราะนี่คือการแสดงทางคณิตศาสตร์ปกติสำหรับรหัสประเภทดังกล่าวซึ่งมักจะกำหนดเป็นสตริงโฮโมมอร์ฟิซึมจากสัญลักษณ์ต้นทางไปยัง codewords แสดงด้วยสัญลักษณ์เป้าหมาย อย่างที่ฉันทำ
สิ่งนี้แยกออกเล็กน้อยจากงานนำเสนอบางส่วนที่ได้รับในมาตรฐานซึ่งมีจุดมุ่งหมายเพิ่มเติมในการระบุรหัสโดยสังเขปสำหรับผู้ใช้แทนที่จะวิเคราะห์จากคุณสมบัติเชิงโครงสร้างของมัน แต่การเข้ารหัสเหมือนกันในทั้งสองกรณี
แม้จะไม่มีการกำหนดเวลามาตรฐานที่แม่นยำตัวถอดรหัสสัญญาณอนาล็อกก็ยังสามารถแปลเป็นตัวอักษรประกอบไปด้วยที่เราแนะนำเพื่อให้ความเข้าใจด้านบนของรหัสที่สามยังคงใช้ได้
รหัส: จุดพื้นฐาน
คำตอบนี้เป็นไปตามมาตรฐาน ITU-R M.1677-1ลงวันที่ตุลาคม 2552 (ขอบคุณ Jason C สำหรับการอ้างอิง) ฉันจะใช้คำศัพท์dot
และdash
มากกว่าdit
และdah
เนื่องจากเป็นคำศัพท์ที่ใช้โดยมาตรฐานนี้
ก่อนที่เราจะเริ่มพูดคุยถึงรหัสมอร์สเราต้องยอมรับว่ารหัสนั้นคืออะไร การสนทนาที่ยากในคำถามนี้ต้องชัดเจน
พื้นฐานข้อมูลจะต้องมีการแสดงเพื่อที่จะส่งหรือดำเนินการเป็นอย่างอื่น รหัสเป็นระบบในการแปลข้อมูลจากระบบใดระบบหนึ่งของการเป็นตัวแทนเข้าไปอีก นี่คือคำจำกัดความทั่วไปมาก เราจะต้องระมัดระวังไม่ให้เกิดความสับสนแนวคิดของการเป็นตัวแทนและของรหัสจากการเป็นตัวแทนหนึ่ง ( แหล่งที่มา ) ไปยังอีก ( เป้าหมาย )
การเป็นตัวแทนสามารถมีได้หลายรูปแบบเช่นตัวแปรแรงดันไฟฟ้า, จุดสีบนกระดาษ, สตริงของตัวอักษร, ตัวเลข, สตริงไบนารี่ของ 0 และ 1 ฯลฯ มันเป็นสิ่งสำคัญที่จะต้องแยกแยะความแตกต่างระหว่างการเป็นตัวแทนแบบอะนาล็อกและทางการ .
การเป็นตัวแทนแบบอะนาล็อก / กายภาพคือรูปวาดระดับแรงดันไฟฟ้าที่แตกต่างกันรูปร่าง (สำหรับตัวอักษร)
การเป็นตัวแทนเชิงตรรกะ / เป็นทางการ / นามธรรมเป็นตัวแทนทางคณิตศาสตร์ที่มีกราฟนามธรรมสตริงของสัญลักษณ์หรือหน่วยงานทางคณิตศาสตร์อื่น ๆ
แม้ว่าในตอนแรกข้อมูลบางอย่างอาจเป็นแบบอะนาล็อกเรามักจะแปลงเป็นรูปแบบตรรกะเพื่อให้สามารถกำหนดกระบวนการได้อย่างแม่นยำโดยใช้วิธีการทางคณิตศาสตร์หรือโดยคน
ในทางกลับกันเราจัดการกับการเป็นตัวแทนเชิงตรรกะโดยใช้อุปกรณ์ทางกายภาพเช่นคอมพิวเตอร์หรือเครื่องส่งสัญญาณเราจำเป็นต้องให้แบบอะนาล็อกกับการเป็นตัวแทนเชิงตรรกะ
สำหรับวัตถุประสงค์ของการวิเคราะห์นี้รูปแบบอะนาล็อกที่เราพิจารณาคือใช้สำหรับการส่งสัญญาณตามที่อธิบายไว้ในมาตรฐาน แต่ถึงอย่างนั้นเราก็จะพิจารณาว่าขั้นตอนแรกคือการตีความการเป็นตัวแทนอะนาล็อกนี้เป็นการดำเนินการโดยตรงของการเป็นตัวแทนเชิงตรรกะที่มีโครงสร้างเหมือนกันซึ่งเราสร้างการวิเคราะห์ของเราว่ารหัสมอร์สคืออะไร ทฤษฎีรหัสเป็นองค์ความรู้ทางคณิตศาสตร์ที่อยู่บนพื้นฐานการวิเคราะห์การเป็นตัวแทนเชิงตรรกะ
อย่างไรก็ตามเราจะกลับมาที่การเปลี่ยนแปลงแบบอะนาล็อก / ตรรกะในการสนทนาในตอนท้าย
รหัส: คำจำกัดความ
มุมมองเชิงตรรกะของเราคือว่ารหัสที่ใช้ในการแปลแหล่งสตริงในแหล่งอักษรไปยังตัวอักษรเป้าหมายTมันมักจะเป็นกรณีที่ตัวอักษรทั้งสองเหมือนกันมักเป็นเลขฐานสองเมื่อวัตถุประสงค์คือการเพิ่มคุณสมบัติพิเศษบางอย่างให้กับการแสดงข้อมูลเช่นทำให้ทนทานต่อข้อผิดพลาดมากขึ้น (การตรวจจับและแก้ไขข้อผิดพลาด) หรือทำให้การแสดงน้อยลง การลบความซ้ำซ้อน (การบีบอัดรหัสแบบไม่สูญเสียข้อมูล) และอาจมีการสูญเสียข้อมูลบางส่วนอย่างระมัดระวัง (การบีบอัดแบบสูญเสีย)TST
อย่างไรก็ตามจุดประสงค์ของรหัสมอร์สคือการให้วิธีการที่จะเป็นตัวแทนของสตริงบนตัวอักษรขนาดใหญ่เป็นสตริงที่ขึ้นอยู่กับตัวอักษรขนาดเล็กมาก (จริง ๆ ไบนารี) โดยใช้ตัวอักษรกลางเกือบไบนารี (จุดและขีดกลาง) การรับรู้และความสามารถในการบิดเบือน สิ่งนี้สามารถทำได้โดยสิ่งที่เรียกว่า
รหัสความยาวผันแปร :
การใช้คำศัพท์จากทฤษฎีภาษาทางการคำจำกัดความทางคณิตศาสตร์ที่แม่นยำมีดังต่อไปนี้: ให้และเป็นเซต จำกัด สองชุดซึ่งเรียกว่าตัวอักษรต้นทางและเป้าหมายตามลำดับ รหัสเป็นฟังก์ชั่นการแมปแต่ละสัญลักษณ์จากถึงลำดับของสัญลักษณ์เหนือและการขยายไปสู่ homomorphism ของ
เป็นซึ่งแผนที่แต่ละลำดับของ สัญลักษณ์แหล่งที่มากับลำดับของสัญลักษณ์เป้าหมายถูกอ้างถึงเป็นส่วนขยายT C : S → T ∗ S T C S ∗ T ∗STC: S→ T* * * *STCS* * * *T* * * *
เราเรียกcodewordภาพของสัญลักษณ์SC( s ) ∈ T* * * *s ∈ S
ตัวแปรที่มีความยาวรหัสคืออ่านได้โดยไม่ซ้ำกันถ้า homomorphism ที่สอดคล้องกันของเข้าเป็นหนึง นั่นหมายความว่าสตริงใด ๆ ในสามารถเป็นภาพของสตริงมากที่สุดคนหนึ่งใน * นอกจากนี้เรายังบอกว่ารหัสนั้นไม่คลุมเครือซึ่งหมายความว่าสตริงใด ๆ สามารถถอดรหัสได้อย่างไม่น่าสงสัยถ้าหากทั้งหมดCS* * * *T* * * *T* * * *S* * * *
รหัสความยาวผันแปรได้เป็นรหัสนำหน้าหากไม่มี codeword เป็นคำนำหน้าของรหัสอื่น นอกจากนี้ยัง alled รหัสทันทีหรือรหัสบริบทฟรี เหตุผลสำหรับชื่อเหล่านี้คือเมื่อคุณอ่านสตริงเป้าหมายที่เริ่มต้นด้วยรหัสประจำตัวของรหัสคำนำหน้าคุณรับรู้ถึงจุดสิ้นสุดของ codeword ทันทีที่คุณอ่านสัญลักษณ์สุดท้ายโดยไม่ต้องรู้ / อ่านสัญลักษณ์ถัดไป เป็นผลให้รหัสคำนำหน้ามีความชัดเจนและง่ายต่อการถอดรหัสอย่างรวดเร็วW
มันแสดงให้เห็นได้อย่างง่ายดายว่าความสามารถในการถอดรหัสที่เป็นเอกลักษณ์และคุณสมบัติคำนำหน้าถูกปิดภายใต้องค์ประกอบของรหัส
โปรดสังเกตว่าคำนิยามในฐานะโฮโมมอร์ฟิซึมหมายถึงว่าไม่มีการแบ่งแยกพิเศษระหว่าง codewords มันเป็นโครงสร้างของพวกเขาเช่นคุณสมบัติคำนำหน้าซึ่งช่วยให้ระบุได้อย่างไม่น่าสงสัย
แน่นอนถ้ามีสัญลักษณ์แยกดังกล่าวพวกเขาจะต้องเป็นส่วนหนึ่งของตัวอักษรเป้าหมายเพราะพวกเขาจะต้องถอดรหัสสตริงจากตัวอักษรเป้าหมาย จากนั้นจะเป็นการง่ายที่จะเปลี่ยนกลับไปใช้แบบจำลองเชิงทฤษฎีของรหัสความยาวผันแปรได้โดยการเพิ่มตัวคั่นไปยังคำรหัสก่อนหน้า หากเป็นการยกระดับความยากลำบากทางบริบท (เนื่องจากมีตัวคั่นหลายตัว) นั่นจะเป็นเพียงคำใบ้ว่ารหัสนั้นซับซ้อนกว่าชัดเจน นี่เป็นเหตุผลที่ดีที่จะยึดตามแบบจำลองเชิงทฤษฎีที่อธิบายไว้ข้างต้น
รหัสมอร์ส
รหัสมอร์สอธิบายไว้ในมาตรฐานในสามระดับ:
3. มันมีวัตถุประสงค์เพื่อให้การเข้ารหัสของข้อความภาษาธรรมชาติโดยใช้ 57 ตัวอักษร (27 ตัวอักษร, 10 หลัก, 20 synbols และ ponctuations) และพื้นที่ว่างระหว่างคำเพื่อตัดสตริงอักขระเป็นคำ การเว้นวรรคระหว่างคำถูกใช้เหมือนตัวละครพิเศษที่สามารถนำไปผสมกับสิ่งอื่น ๆ ได้ซึ่งฉันจะสังเกตSEP
เห็น
2. อักขระเหล่านี้ทั้งหมดจะถูกเข้ารหัสเป็นตัวต่อเนื่องdash
และdot
โดยใช้ช่องว่างระหว่างตัวอักษรซึ่งฉันจะต้องทราบsep
เพื่อแยกdash
และdot
จดหมายฉบับหนึ่งออกจากจดหมายฉบับถัดไป
1. dash
และdot
เช่นเดียวกับการsep
จะได้รับการเข้ารหัสเป็นสัญญาณหรือไม่มีสัญญาณ (เรียกว่าเว้นวรรค) ที่มีความยาวกำหนดไว้อย่างแม่นยำในแง่ของหน่วยได้รับการยอมรับบางส่วน โดยเฉพาะอย่างยิ่งdash
และการเข้ารหัสตัวอักษรจะต้องแยกออกจากพื้นที่ระหว่างองค์ประกอบที่ฉันจะทราบdot
σ
สิ่งนี้เรียกร้องให้มีข้อสรุปเล็กน้อย
ข้อความที่จะส่งและรับในรูปแบบอะนาล็อกคือความต่อเนื่องของหน่วยความยาว (ความยาวของพื้นที่หรือความยาวของเวลา) ซึ่งสัญญาณจะเปิดปิดตลอดระยะเวลาทั้งหมดของแต่ละหน่วยตามที่ระบุในภาคผนวก 1 ส่วนที่ 1 ส่วน 2 มาตรฐาน :
2 Spacing and length of the signals
2.1 A dash is equal to three dots.
2.2 The space between the signals forming the same letter is equal to one dot.
2.3 The space between two letters is equal to three dots.
2.4 The space between two words is equal to seven dots.
นี้ชัดเจนการเข้ารหัสแบบอะนาล็อกในสิ่งที่เป็นที่รู้จักกันเป็นกระแสบิตซึ่งสามารถแสดงเหตุผลในสัญกรณ์ไบนารีด้วยสตริงของ0
ans 1
ยืนสำหรับอนาล็อกปิดและบน
เพื่อที่จะออกไปประเด็นที่เป็นนามธรรมที่เกี่ยวข้องกับการแสดงแบบอะนาล็อกเราจึงสามารถพิจารณาว่าข้อความรหัสมอร์สจะถูกส่งเป็นสตริงบิตว่าเราจะทราบด้วยและ0
1
ดังนั้นข้อความที่ตัดตอนมาจากมาตรฐานข้างต้นสามารถแสดงเหตุผลได้ดังนี้:
- 0. เป็นตัวแทนจาก
dot
1
- 1. เป็นตัวแทนจาก
dash
111
- 2. พื้นที่ระหว่างองค์ประกอบเป็นตัวแทนจาก
σ
0
- 3. พื้นที่ระหว่างตัวอักษรเป็นตัวแทนจาก
sep
000
- 4. พื้นที่ระหว่างคำว่าเป็นตัวแทนจาก
SEP
0000000
ดังนั้นเราจึงเห็นรหัสมอร์สว่าใช้คำ 5 รหัสในรูปแบบไบนารี่เพื่อเข้ารหัสสัญลักษณ์ 5 ตัวนี้ ยกเว้นความจริงที่ว่านี่ไม่ใช่วิธีการอธิบายระบบมีบางอย่างมากกว่านั้นและมันก็ไม่ใช่วิธีที่สะดวกที่สุดที่จะนึกถึงจากมุมมองที่ไร้เดียงสาหรือมุมมองทางคณิตศาสตร์
โปรดทราบว่าคำอธิบายนี้มีไว้สำหรับคนธรรมดาไม่ใช่ผู้เชี่ยวชาญด้านทฤษฎีรหัส ด้วยเหตุนี้จึงอธิบายลักษณะที่ปรากฏที่มองเห็นได้มากกว่าโครงสร้างภายในที่ปรับให้เหมาะสม มันไม่มีเหตุผลที่จะห้ามคำอธิบายอื่น ๆ ที่เข้ากันได้กับสิ่งนี้แม้ว่าจะมีโครงสร้างทางคณิตศาสตร์มากขึ้นเพื่อเน้นคุณสมบัติของรหัส
แต่ก่อนอื่นเราควรทราบว่าคำอธิบายที่สมบูรณ์ของรหัสเกี่ยวข้องกับการแสดง 3 ระดับซึ่งจำได้ทันที:
- 3.
SEP
ข้อความที่ประกอบด้วยสายอักขระรวมทั้ง
- 2. การเข้ารหัสของสตริงตัวอักษรเป็นสตริงของ
dot
, และdash
sep
- 1. การเข้ารหัสสตริงระดับ 2 ของทั้งสามนี้
symbols
เป็นสตริงไบนารี
เราอาจจะพูดถึงสัญลักษณ์ที่เข้ารหัสในสิ่งที่ แต่มันเป็นสิ่งสำคัญของรหัสมอร์สว่ามันมีสามระดับของการเป็นตัวแทนกับตัวละครที่ด้านบน, dot
s และdash
es ที่อยู่ตรงกลางและบิต0
และ1
ที่ด้านล่าง .
นี่หมายความว่ามีสองรหัสจำเป็นหนึ่งจากระดับ 3 ถึงระดับ 2 และอื่น ๆ จากระดับ 2 ถึงระดับ 1
การวิเคราะห์การเป็นตัวแทนสามระดับ
เพื่อให้มีการวิเคราะห์ที่สอดคล้องกันของระบบการเข้ารหัส 3 ระดับนี้อันดับแรกเราควรวิเคราะห์ว่าข้อมูลประเภทใดที่เกี่ยวข้องในแต่ละระดับ
1. สตริงบิตโดยความหมายและความจำเป็นของการเป็นตัวแทนแอนะล็อก, ประกอบด้วยเฉพาะของและ0
1
3. ในระดับข้อความที่เราต้องการและตัวอักษร 58 สัญลักษณ์รวมทั้ง 57 SEP
ตัวอักษรและพื้นที่ระหว่างคำว่า ทั้งหมด 58 คนต้องมีการเข้ารหัสแบบไบนารีในท้ายที่สุด แต่ถึงแม้ว่ารหัสมาตรฐานมอร์สจะระบุตัวอักษร 57 + 1 เหล่านี้ แต่ก็ไม่ได้ระบุว่าควรใช้การเข้ารหัสข้อมูลอย่างไร นั่นคือบทบาทของภาษาอังกฤษและภาษาธรรมชาติอื่น ๆ รหัสมอร์สให้ระบบอื่นที่มีตัวอักษร 58 สัญลักษณ์ซึ่งพวกเขาสามารถสร้างรหัส 58 รหัสได้ แต่รหัสมอร์สไม่ใช่รหัส 58 ตัว
2. ที่dot
และdash
ระดับสิ่งที่เราต้องการคือสัญลักษณ์สองตัวนี้เพื่อให้รหัส 57 ตัวอักษรคือให้ codeword สำหรับแต่ละตัวเป็นสตริงของdot
และdash
พร้อมกับตัวคั่นบางตัวsep
เพื่อทำเครื่องหมายเมื่อตัวอักษรตัวหนึ่งเสร็จสิ้นและอีกจุดเริ่มต้น SEP
เรายังต้องใช้วิธีการเข้ารหัสพื้นที่ระหว่างบางคำ เราอาจพยายามที่จะให้มันโดยตรงที่ leavel 1 แต่สิ่งนี้จะทำให้องค์กรที่มีโครงสร้างของรหัสไม่เป็นระเบียบ
ที่จริงคำอธิบายของมาตรฐานอาจถูกวิจารณ์อย่างถูกต้องสำหรับการทำเช่นนั้น แต่ผู้เขียนอาจคิดว่าการนำเสนอของพวกเขาจะง่ายกว่าสำหรับผู้ใช้ทั่วไป นอกจากนี้ยังเป็นไปตามคำอธิบายดั้งเดิมของรหัสมอร์สซึ่งมีมาก่อนการวิเคราะห์ทางคณิตศาสตร์ประเภทนี้
สิ่งนี้เรียกข้อสังเกตหลายประการ:
ที่ระดับ 3 ระดับตัวอักษรช่องว่างระหว่างตัวอักษรsep
ไม่มีความหมายอีกต่อไป นี่เป็นเรื่องปกติเนื่องจากไม่มีความหมายในจักรวาลของตัวอักษรมากกว่าช่องว่างที่แยกอักขระที่เขียนสองตัวบนกระดาษ มีความจำเป็นที่ระดับ 2 เพื่อรับรู้รหัสที่เป็นตัวแทนของตัวอักษร แต่นั่นคือทั้งหมด
ในทำนองเดียวกันที่ระดับ 2 พื้นที่ระหว่างองค์ประกอบσ
จะไม่มีความหมายอีกต่อไป มันไม่มีความหมายในโลกของdot
และdash
แต่เป็นสิ่งจำเป็นเท่านั้นที่ระดับ 1 เพื่อแจ้งคำรหัสไบนารีตัวแทน,dot
dash
แต่ในระดับที่ 1 0
ก็ไม่ได้แตกต่างจากบิต
ดังนั้นพื้นที่ว่างระหว่างองค์ประกอบσ
จึงไม่มีอะไรพิเศษอีกต่อไป 0
มันเป็นเพียงหนึ่งในการใช้งานของ
อย่างไรก็ตามตามที่อธิบายไว้ก่อนหน้านี้หากจะต้องวิเคราะห์รหัสโดยใช้ความรู้เกี่ยวกับความยาวของรหัสตัวแปรตัวคั่นควรผนวกเข้ากับ codewords ที่พวกเขาทำตามเพื่อกำหนดรหัสเป็นสตริงธรรมดา homomorphismΣ* * * *2→ Σ* * * *1
นี่หมายถึงข้อกำหนดบางส่วนของรหัสต่อไปนี้:
และdot
→การ→10
dash
→1110
ตัวอักษรระดับ 2ต้องการสัญลักษณ์อื่นอย่างน้อยหนึ่งตัวซึ่งมีการเว้นวรรคระหว่างตัวอักษรซึ่งควรเป็นไปตามตัวอักษรของมาตรฐาน แต่ความหมายของรหัสที่ยาวตัวแปรเป็น homomorphism ที่จำเป็นต้องมีการผนวกพื้นที่ระหว่างองค์ประกอบ
แต่ละ codeword สำหรับและ ดังนั้นเราจะต้องมีเพียงcodeword สำหรับเท่านั้นดังนั้นเมื่อสิ้นสุดด้วยการมาจาก preceeding หรือมันทำให้ 3 ตามที่กำหนดโดยมาตรฐาน สิ่งนี้ใช้ได้เสมอเนื่องจากไม่มีข้อกำหนดในมาตรฐานสำหรับการมีตัวคั่นระหว่างตัวอักษรสองตัวที่ติดตามกันΣ2sep
000
0
dot
dash
00
sep
0
dot
dash
0
นี้ก็เพียงพอที่จะเข้ารหัสตัวอักษร { , , } กับ homomorphic รหัสกำหนดไว้ดังนี้Σ2=dot
dash
sep
C2 → 1: Σ2→ Σ* * * *1
dot
→10
dash
→1110
sep
→00
และเรามีความประหลาดใจที่ดีในการค้นพบว่าไม่มี codeword เป็นคำนำหน้าของอีก ดังนั้นเราจึงมีรหัสคำนำหน้าซึ่งไม่มีความชัดเจนและง่ายต่อการถอดรหัส
ตอนนี้เราสามารถดำเนินการในทำนองเดียวกันในการกำหนดรหัส *C3 → 2: Σ3→ Σ* * * *2
การใช้มาตรฐานสายdot
และdash
เป็น codewords สำหรับตัวละครในในทางที่ได้รับจากตารางของมาตรฐานเช่นการเป็นตัวแทนของตัวอักษร
ฉΣ3dot
dot
dash
dot
ฉ
อีกครั้ง codewords เหล่านี้จะถูกคั่นด้วยช่องว่างระหว่างตัวอักษร เพื่อกำหนดรหัสเป็นโฮโมมอร์ฟิซึมเราต้องรวมตัวคั่นใน codewords เพื่อให้คำจำกัดความของโฮโมมอร์ฟิซึมกลายเป็นค่อนข้าง: ฉ→ dot
dot
dash
dot
sep
นี้ใช้กับแต่ละ 57 ตัวอักษรในตัวอักษร\แต่อีกครั้งเราก็ต้องแยกคำซึ่งเป็นไปตามมาตรฐานที่เป็น เราทราบก่อนว่ารหัส 3 บิตนั้นได้รับการจัดเตรียมไว้แล้ว 2 ตัวต่อจากนั้นจะลงท้ายด้วยตัวอักษรสุดท้ายของคำและ 1 โดยบิตที่จะสิ้นสุดการเข้ารหัสสุดท้ายหรือการเข้ารหัสของจดหมายฉบับสุดท้าย ดังนั้นต้องในท้ายที่สุดจะเขียนเป็นส่วนที่เหลือΣ3SEP
0000000
0
sep
0
dot
dash
SEP
0000
แต่การที่จะเคารพวิธีฉัตรSEP
ควรได้รับการเข้ารหัสใน codeword จาก * เนื่องจากเป็นรหัสที่เข้ารหัสแบบไบนารีจึงเป็นไปตามที่สามารถเข้ารหัสได้Σ* * * *2sep
00
SEP
sep
sep
ดังนั้นเราสามารถเข้ารหัสตัวอักษร
, ด้วยรหัส homomorphic
กำหนดไว้ดังนี้:Σ3= { A , B , … , Z, 0 , 1 , ... , 9 , ? , = , … , × , @ , SEP
}C3 → 2: Σ3→ Σ* * * *2
และเรามีความประหลาดใจเพิ่มเติมที่จะเห็นว่าไม่มี codeword เป็นคำนำหน้าของอีก ดังนั้นรหัสจึงเป็นรหัสนำหน้าด้วยC3 → 2
เนื่องจากคุณสมบัติคำนำหน้าปิดอยู่ภายใต้องค์ประกอบของรหัสรหัสมอร์สเป็นรหัสนำหน้าCMo r s e= C2 → 1∘ C3 → 2
เราจึงสามารถสรุปได้ว่ารหัสมอร์สสามารถเข้าใจได้อย่างง่ายดายและวิเคราะห์เป็นองค์ประกอบของคำนำหน้าไบนารีการเข้ารหัสของตัวอักษรสัญลักษณ์ 3 { dot
, dash
, sep
} เป็นตัวอักษรไบนารีและคำนำหน้าการเข้ารหัสของตัวอักษร 58 สัญลักษณ์ (57 ตัวอักษร และหนึ่งช่องว่าง) เป็น 3 ตัวอักษรตัวอักษร
การเรียบเรียงเองนั้นเป็นการเข้ารหัสคำนำหน้าของสัญลักษณ์ 58 ตัวเพื่อเป็นตัวแทนไบนารี
ข้อสังเกตในการวิเคราะห์นี้
เป็นการยากที่จะพิสูจน์ว่าการนำเสนอโครงสร้างเป็นสิ่งที่ดีที่สุดที่จะเกิดขึ้น อย่างไรก็ตามดูเหมือนว่าการวิเคราะห์ข้างต้นตรงตามเกณฑ์ที่กำหนดไว้ที่จุดเริ่มต้นของคำตอบนี้: ความใกล้ชิดกับคำจำกัดความ 3 ชั้นนำเสนออย่างเป็นทางการตามทฤษฎีการเข้ารหัสปัจจุบันความเรียบง่ายและหลักฐานคุณสมบัติหลักของรหัส
โปรดทราบว่ามีจุดเล็กน้อยในการค้นหาคุณสมบัติการแก้ไขข้อผิดพลาด รหัสมอร์สอาจไม่ได้ตรวจสอบความผิดพลาดบิตเดียวมันก็อาจมีการเปลี่ยนแปลงทั้งสองเป็นหนึ่งdot
dash
อย่างไรก็ตามมันทำให้เกิดข้อผิดพลาดในท้องถิ่นเท่านั้น
เกี่ยวกับการบีบอัดการเข้ารหัส ternary ถูกออกแบบมาเพื่อประมาณลดจำนวนของจุดและขีดกลางในชนิดของ approximative Huffman การเข้ารหัส แต่รหัสที่ประกอบขึ้นสองชุดนั้นสามารถทำให้หนาแน่นขึ้นได้อย่างง่ายดาย
เกี่ยวกับขนาดของตัวอักษรไม่มีตัวเลือกสำหรับไบนารีและตัวอักษรสัญลักษณ์ 58 ตัวอักษรกลางอาจมีสัญลักษณ์มากกว่า แต่จะมีจุดประสงค์อะไร?
อย่างไรก็ตามบางคนอาจมีแนวโน้มที่จะรับรู้ช่องว่างDET
ที่ระดับ 2 ดังนั้นจึงทำให้ตัวอักษรquaternaryแล้วใช้มันโดยตรงที่ระดับ 3 เข้ารหัสเหมือนตัวเองในระดับ 2
นี้จะตอบสนองความคมชัดมาตรฐานสำหรับการเข้ารหัสในไบนารีDET
0000
แต่มันจะป้องกันการวิเคราะห์ของการเข้ารหัสไบนารี
เป็นรหัสคำนำหน้าทำให้ยากที่จะแสดงให้เห็นว่า
เป็นรหัสนำหน้าจึงไม่มีความชัดเจน C M o r s eC2 → 1CMo r s e
อันที่จริงทางเลือกดังกล่าวจะทำให้สตริงไบนารี0000
คลุมเครืออ่านได้เป็นอย่างใดอย่างหนึ่งหรือเป็นSEP
sep
sep
ความคลุมเครือจะต้องได้รับการแก้ไขด้วยกฎตามบริบทที่sep
ไม่สามารถทำตามได้เองทำให้การทำให้เป็นทางการซับซ้อนขึ้น
ความสำคัญของการแปลงสัญญาณอนาล็อกเป็นโลจิคัล
การวิเคราะห์นี้อาศัยความจริงที่ว่าการสลายตัวของสัญญาณเปิด / ปิดเป็นหน่วยที่มีความยาวเท่ากันบ่งชี้อย่างชัดเจนว่าการแทนแบบอะนาล็อกของสตริงไบนารี นอกจากนี้ความยาวในหน่วยที่ถูกต้องสำหรับการวิเคราะห์ข้างต้นซึ่งดูเหมือนว่าไม่น่าจะเกิดขึ้นโดยบังเอิญ (แม้ว่ามันจะเป็นไปได้)
อย่างไรก็ตามจาก (ดูคร่าวๆ) ดูสิทธิบัตรดั้งเดิม 1647ดูเหมือนว่าจะไม่ถูกต้องแม่นยำโดยมีประโยคเช่น (ด้านบนของหน้า 2):
สัญลักษณ์ของตัวเลขที่แตกต่างกันหรือของตัวเลขเชิงผสมเมื่อใช้ในประโยคคำหรือตัวเลขประกอบด้วยระยะทางหรือช่องว่างของการแยกระหว่างตัวละครในระดับที่สูงกว่าระยะทางที่ใช้ในการแยกอักขระที่ประกอบด้วยความแตกต่างใด ๆ หรือสารประกอบตัวเลข
คนที่ถูกส่งด้วยมือหรือรับโดยหูในภายหลังก็ไม่น่าจะแม่นยำเช่นกัน ที่จริงแล้วกำปั้นของพวกเขาเช่นเวลาของพวกเขามักจะเป็นที่รู้จัก มุมมองนี้ยังได้รับการสนับสนุนจากข้อเท็จจริงที่ว่าความยาวของระยะห่างนั้นไม่ได้รับการเคารพเสมอไปโดยเฉพาะเมื่อเรียนรู้รหัสมอร์ส
สถานการณ์เหล่านี้สอดคล้องกับมุมมองแบบแอนะล็อกของรหัสเป็นสัญญาณสั้น (จุด) สัญญาณกลาง (เส้นประ) และหยุดชั่วคราวสั้นกลางและยาว การเคลื่อนย้ายโดยตรงไปยังตัวอักษรเชิงตรรกะจะให้ตัวอักษรแบบ quinaryโดยที่ 58 สัญลักษณ์จะต้องถูกเข้ารหัส แน่นอนว่านี่ไม่ใช่การนำเสนอรหัสมอร์ส 3 ชั้นอีกต่อไป
อย่างไรก็ตามเพื่อให้เกิดความเข้าใจ (และอาจหลีกเลี่ยงความคลุมเครือ) ตัวอักษรนี้ควรใช้กับข้อ จำกัด ที่สัญลักษณ์สัญญาณสอง ( dot
หรือdash
) ไม่สามารถตามซึ่งกันและกันและสัญลักษณ์หยุดชั่วคราวไม่สามารถทำตามซึ่งกันและกัน การวิเคราะห์รหัสและคุณสมบัติของมันจะมีความซับซ้อนมากขึ้นและวิธีธรรมชาติในการทำให้มันง่ายขึ้นก็คือการทำสิ่งที่ทำ: แนะนำการกำหนดเวลาที่เหมาะสมเพื่อเปลี่ยนเป็นองค์ประกอบของสองรหัสซึ่งนำไปสู่การวิเคราะห์ที่ค่อนข้างง่าย จำไว้ว่ามันรวมถึงการแสดงรหัสเป็นคำนำหน้า)
นอกจากนี้ไม่จำเป็นอย่างเคร่งครัดที่จะต้องปฏิบัติตามการกำหนดเวลาที่แน่นอนในการเป็นตัวแทนแบบอะนาล็อก เนื่องจากตัวถอดรหัสของการแปลแบบอะนาล็อกสามารถแยกความแตกต่างของการหยุดสั้นกลางและยาวไม่ว่าจะด้วยวิธีใดก็ตามมันก็ควรเลียนแบบสิ่งที่ทำในกรณีไบนารี ดังนั้นในระยะสั้นและสัญญาณกลาง (ตามจำเป็นโดยหยุด) จะรับรู้เป็นตรรกะหรือdot
dash
หยุดสั้นจะลืมเป็นเพียงการให้บริการในการทำเครื่องหมายจุดสิ้นสุดของหรือdot
dash
หยุดกลางจะรับรู้เป็นsep
และหยุดยาวได้รับการยอมรับว่าเป็นสองsep
ในการทดแทน ดังนั้นสัญญาณอะนาล็อกจะถูกแสดงในตัวอักษรประกอบไปด้วยซึ่งสามารถใช้เป็นก่อนที่จะเข้ารหัส 58 ตัวอักษรสัญลักษณ์ การวิเคราะห์เบื้องต้นของเราสามารถใช้งานได้แม้ว่าจะไม่ได้รับการกำหนดเวลาอย่างเคร่งครัด
ผลัดกันสัญญาณ - หยุดชั่วคราวสามารถนำมาใช้เพื่อเปลี่ยนอักษร quinary นี้เป็นหนึ่งในสามประกอบไปด้วยเพียงสามช่วงเวลาที่เป็นสัญลักษณ์ของตัวอักษรและใช้การวิเคราะห์บริบทเพื่อตรวจสอบว่าระยะเวลาที่กำหนดเป็นสัญญาณหรือหยุดชั่วคราว แต่นี่เป็นการวิเคราะห์ที่ซับซ้อนอีกเล็กน้อย
นี่เป็นเพียงการแสดงให้เห็นว่ามีหลายวิธีในการมองสิ่งต่าง ๆ แต่พวกเขาไม่สะดวกและอาจไม่ได้ยืมทั้งหมดเพื่อวิเคราะห์ด้วยเครื่องมือทางคณิตศาสตร์ที่พัฒนาขึ้นเพื่อวิเคราะห์รหัส
เพิ่มเติมการอ้างอิงถึงการจดสิทธิบัตรสามารถพบได้บนอินเทอร์เน็ต
ข้อสรุป
จากการกำหนดเวลามาตรฐานที่แม่นยำคำตอบที่ดีน่าจะพิจารณารหัสมอร์สว่าเป็นองค์ประกอบของการเข้ารหัสคำนำหน้าไตรภาค (จาก 58 ตัวอักษร) เป็น 3 สัญลักษณ์ตัวอักษรประกอบด้วยการเข้ารหัสคำนำหน้าไบนารีของสัญลักษณ์สามตัวนี้
หากไม่มีการกำหนดเวลามาตรฐานที่แม่นยำจะไม่สามารถพิจารณาระดับไบนารีได้อีกต่อไป จากนั้นอนาล็อกเพื่อถอดรหัสตรรกะตามธรรมชาติที่เกิดขึ้นในระดับของตัวอักษรกลางของและdot
dash
อย่างไรก็ตามตัวถอดรหัสแบบแอนะล็อกกับแบบลอจิคัลสามารถ stil ถอดรหัสเป็นตัวอักษรสัญลักษณ์ 3 ตัวก่อนหน้าดังนั้นจึงรักษาการบังคับใช้การวิเคราะห์ของเรา