ทฤษฎีที่อยู่เบื้องหลังการเข้ารหัสการทำนายเชิงเส้น (LPC)


9
  • ทฤษฎีเบื้องหลัง LPC คืออะไร
  • เหตุใดการใช้งาน LPC บางอย่างจึงมีความทนทานต่อการส่งผ่านหรือการเข้ารหัสข้อผิดพลาดเชิงปริมาณมากกว่าแผนการเข้ารหัสเสียงที่บีบอัดอื่น ๆ

  • สามารถใช้วิธีการ LPC สำหรับการทำนายคำในระยะสั้นหรือแบบเดียวกับการใช้ตัวกรองคาลมานได้หรือไม่?

  • การใช้ LPC มีเงื่อนไขหรือข้อ จำกัด อะไรบ้าง

"ทำไม LPC ถึงมีความทนทานต่อการส่งหรือการเข้ารหัสผิดพลาดมากกว่าแผนการเข้ารหัสเสียงที่บีบอัดอื่น ๆ " ที่บอกว่า? ฉันไม่รู้ LPC เป็นอย่างดี แต่ฉันคิดว่ามันเกี่ยวข้องกับการลดความซ้ำซ้อนซึ่งจะมีผลตรงกันข้าม
endolith

คำถามนี้ทำให้เข้าใจผิดเนื่องจากอยู่บนสมมติฐานที่ผิด โปรดปิดและแก้ไขสิ่งนี้
Dipan Mehta

มีคำถามและสถานที่หลายแห่งที่นี่ คุณคิดว่าต้องซ่อมอันไหน
hotpaw2

1
คำสั่งWhy are(were) certain implementations of LPC said to be more tolerant of transmission or encoding errors quantization than other compressed voice encoding schemes?นั้นค่อนข้างเท็จ คุณสามารถอ้างอิงการอ้างอิงใด ๆ ที่บอกสิ่งที่ดีกว่าอย่างอื่นได้หรือไม่?
Dipan Mehta

1
นั่นคือคำถามของฉัน ฉันได้ยินเรื่องนี้ที่ไหนสักแห่ง แต่ไม่รู้ว่าทำไมเรื่องนี้ถึงได้รับการกล่าวถึง
hotpaw2

คำตอบ:


14

ก่อนอื่นการบอกว่าการเข้ารหัสเชิงเส้นตรง (LPC) คือ "การยอมให้มีข้อผิดพลาดในการส่งหรือการเข้ารหัสมากกว่า" ไม่เป็นความจริง รูปแบบที่สัมประสิทธิ์ถูกส่งสร้างความแตกต่างใหญ่ ตัวอย่างเช่นหากค่าสัมประสิทธิ์การทำนายเชิงเส้นถูกแก้ไขสำหรับพวกมันจะมีความไวสูงต่อการหาปริมาณเหมือนค่าสัมประสิทธิ์การกรอง IIR สูงมาก (นี่เป็นเพราะตัวกรองการสังเคราะห์จะเป็น IIR แต่มากกว่านั้นในภายหลัง) อย่างไรก็ตามหากพวกเขาถูกส่งในรูปแบบอื่น ๆ ปัญหานี้สามารถบรรเทาได้อย่างง่ายดาย

วิธีหนึ่งคือการถ่ายโอนค่าสัมประสิทธิ์การสะท้อน หากคุณแก้ปัญหาซ้ำ ๆ สำหรับตัวกรองการทำนายเชิงเส้นลำดับ k-th ค่าสัมประสิทธิ์การเรียงลำดับสูงสุดในแต่ละขั้นตอนจะเรียกว่าสัมประสิทธิ์การสะท้อน สิ่งเหล่านี้สามารถใช้ร่วมกันเพื่อจำแนกลักษณะของระบบอย่างสมบูรณ์ (ซึ่งสามารถมองเห็นได้ง่ายจากการเรียกซ้ำของเลวินสัน) ในความเป็นจริงคุณสามารถใช้พวกมันทั้งหมดเข้าด้วยกันเพื่อสร้างฟิลเตอร์ขัดแตะ ตัวกรองเหล่านี้มักจะถูกใช้เมื่อต้องคำนึงถึงปริมาณในเชิงปริมาณเนื่องจากมีความทนทานมากกว่านับจำนวนบิต นอกจากนี้หากขนาดของสัมประสิทธิ์การสะท้อนเหล่านี้ถูก จำกัด โดยความสามัคคีคุณจะรับประกันตัวกรอง BIBO ที่เสถียรซึ่งมีความสำคัญสำหรับ LPC ซึ่งตัวกรองนั้นใช้ในการสังเคราะห์สัญญาณของคุณ มีวิธีการอื่น ๆ เช่นเส้นสเปกตรัมคู่ที่ใช้บ่อย ๆ แต่ไม่ได้

ตอนนี้เพื่อตอบคำถามแรกทฤษฎีของ LPC หมุนรอบแบบจำลองทางเดินเสียง โดยพื้นฐานแล้วเรากำลังสร้างแบบจำลองเสียงพูดขณะที่อากาศสั่นสะเทือนเป็นอินพุตของหลอดโครงสร้างบางอย่าง คุณสามารถมองหาแหล่งข้อมูลที่ให้รายละเอียดมากขึ้นในการจำลองโมเดลนี้ (ความยาวของท่อความเข้มของอากาศโครงสร้าง ฯลฯ ) ทรัพยากรเหล่านี้เกี่ยวข้องกับโครงสร้างเหล่านี้โดยตรงกับตัวกรอง IIR ตอบสนองต่อสิ่งเร้าต่าง ๆ เสียงสีขาวเป็นต้น

ดังนั้นเมื่อเราหาค่าสัมประสิทธิ์การทำนายเชิงเส้นเราจะมองหาค่าสัมประสิทธิ์เช่นถ้าเราใส่สัญญาณของเรา (ตัวอย่างเสียง) ลงในตัวกรอง FIR ที่สร้างขึ้นจากค่าสัมประสิทธิ์เราจะได้เสียงสีขาวเป็นสัญญาณออก ดังนั้นลองคิดดูว่ามันหมายถึงอะไร เรากำลังป้อนข้อมูลสูงสัญญาณที่มีความสัมพันธ์และการส่งสัญญาณลำดับเสียงสีขาว ผลก็คือเรากำลังลบการพึ่งพาเชิงเส้นทั้งหมดของสัญญาณนั้น อีกวิธีในการดูนี้คือข้อมูลที่มีความหมายทั้งหมดมีอยู่ในสัมประสิทธิ์ที่ลบการพึ่งพาเชิงเส้นนี้ออก ดังนั้นเราสามารถถ่ายโอนค่าสัมประสิทธิ์เหล่านี้ (หรือบางรูปแบบตามข้างบน) และจุดสิ้นสุดการรับสามารถสร้างสัญญาณขึ้นมาใหม่ สิ่งนี้ทำได้โดยการย้อนกลับตัวกรอง FIR เชิงเส้นตรงเพื่อสร้างตัวกรอง IIR และป้อนสัญญาณรบกวนสีขาว ดังนั้นการบีบอัดมาจากการลบการพึ่งพาเชิงเส้นนี้และการถ่ายโอนสัมประสิทธิ์ นี่คือเหตุผลที่บางครั้งวิธี Burg ก็ถูกเรียกว่าเป็นวิธีการแบบเอนโทรปีที่สูงที่สุดเนื่องจากมันมีจุดมุ่งหมายเพื่อเพิ่ม "สุ่ม" หรือความขาวของสัญญาณรบกวนในตัวกรองการทำนายเชิงเส้น อีกวิธีในการดูนี้

เพื่อตอบคำถามสุดท้ายของคุณฉันไม่แน่ใจว่าสิ่งที่คุณถามทั้งหมด LPC หรือการทำนายเชิงเส้นตรงหมายถึงการ "บีบอัด" สัญญาณโดยสมมติว่ามันสามารถสร้างแบบจำลองได้อย่างมีประสิทธิภาพตามที่กล่าวไว้ก่อนหน้านี้ แน่นอนคุณสามารถใช้การทำนายเชิงเส้นเพื่อทำ "การคาดการณ์ระยะสั้น" ตามที่คุณกล่าวถึง นี่คือพื้นฐานโดยนัยที่อยู่เบื้องหลังวิธี AR ความละเอียดสูงที่ใช้สำหรับการประมาณความหนาแน่นสเปกตรัมพลังงาน ลำดับความสัมพันธ์อัตโนมัติอาจถูกขยายซ้ำจากรูปแบบ จำกัด จากการบันทึกข้อมูลที่ จำกัด ไปยังอินฟินิตี้เป็นลำดับความสัมพันธ์ทางทฤษฎีตามลำดับความผ่อนคลาย นี่คือสาเหตุที่วิธีการประมาณค่า PSD ของ PSD ไม่แสดงปรากฏการณ์ sidelobe


1
"ทฤษฎีของ LPC หมุนรอบตัวแบบจำลองเสียงพูด" นี่เป็นเรื่องจริงเสมอหรือไม่? FLAC ใช้ LPC กับรูปคลื่นเสียงทั่วไปไม่ใช่แค่เสียง
endolith

3
คำขอโทษของฉันฉันได้เรียนรู้มันผ่านการเปรียบเทียบของคอร์ดเสียงเป็นแบบจำลองทางกายภาพซึ่งเป็นที่มาจาก อย่างที่ฉันพูดมีสถานที่ที่พวกเขาเจาะลึกลงไปในเรื่องนี้ แต่คุณถูกต้อง LPC เหมาะสำหรับรูปคลื่นเสียงทั่วไป ดังที่ฉันได้กล่าวไปแล้วมันใช้งานได้ดีกับคลื่นความถี่ห่าม ในฐานะที่เป็นข้อพิสูจน์มันทำงานได้ไม่ดีกับสัญญาณที่มีเสียงดังซึ่งคลื่นความถี่นั้นหุนหันพลันแล่นน้อยลง
ไบรอัน
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.