มีข้อได้เปรียบทางคณิตศาสตร์สำหรับอัตราการสุ่มตัวอย่างที่สูงขึ้นหรือไม่?


18

เนื่องจากคนส่วนใหญ่ไม่สามารถได้ยินความถี่สูงกว่า 20kHz ต่อไปได้ฉันไม่เคยเข้าใจข้อโต้แย้งที่แน่นอนสำหรับการใช้อัตราการสุ่มตัวอย่างที่สูงกว่า 48kHz ที่ 48kHz ฉันเข้าใจว่าการสร้างตัวกรอง lowpass ด้วยแบนด์วิดท์สูงขึ้นเล็กน้อยเพื่อลบ aliasing แต่ฉันไม่เข้าใจว่าทำไมทุกคนต้องการบันทึกที่ 96kHz

สำหรับโครงการที่ใช้ระบบดิจิตอลอย่างเคร่งครัดเช่นใช้การสังเคราะห์แบบดิจิตอลบริสุทธิ์และไม่บันทึกเนื้อหาใด ๆ ที่จะถูกแปลงจากอะนาล็อก -> ดิจิตอลมีข้อได้เปรียบอะไรบ้างในการใช้อัตราการสุ่มตัวอย่างที่สูงกว่า 44.1kHz?

มีสิ่งอื่นใดอีกหรือไม่ที่จะได้รับประโยชน์จากการใช้ 96kHz? มันจะมีประโยชน์เมื่อใช้การดำเนินการ DSP บางประเภทในภายหลังหรือไม่? หรือมันเป็นผลของยาหลอกสำหรับหูอย่างหมดจด?

หมายเหตุ: มีคำถามอื่น ๆ ที่นี่ถามเกี่ยวกับอัตราการสุ่มตัวอย่างที่จะใช้สำหรับโครงการบันทึกประเภทต่าง ๆ แต่ที่นี่ฉันขอข้อมูลจริงที่ยากสำหรับเหตุผลทางคณิตศาสตร์หรือ DSP ที่เกี่ยวข้องกับการสนับสนุนการใช้อัตราการสุ่มตัวอย่างที่สูงขึ้น

คำตอบ:


19

ฉันมักจะใช้อัตราการสุ่มตัวอย่างสองครั้งหากเป็นไปได้ด้วยเหตุผลสำคัญสองข้อ

เหตุผลแรก: เพื่อกำจัดคุณสมบัติของตัวกรองป้องกันภาพเมื่อทำงานกับแหล่งกำเนิดเสียงแบบอะนาล็อก ตัวกรองป้องกันภาพคืออะไร?

สมมติว่าฉันกำลังบันทึกที่ 44100 Hz
ถ้าฉันจะบันทึกคลื่นไซน์ที่มีค่าน้อยกว่า 10 KHz คุณจะเห็นเส้นเอ็นอย่างชัดเจนเมื่อคุณพล็อตค่าตัวอย่างในกราฟ
หากฉันสุ่มตัวอย่างคลื่นไซน์ที่ 0dB FS ด้วยความถี่ 22,5KHz ตัวอย่างจะอ่าน 1 และ -1 สลับกัน

ตอนนี้นี่คือปัญหา ถ้าฉันบันทึกคลื่นไซน์ที่ 0dB FS ด้วยความถี่ 30 KHz และพล็อตตัวอย่างแต่ละตัวอย่างใช้เวลามากกว่าครึ่งไซน์และถ้าคุณเล่นตัวอย่าง - มันจะคืนไซน์ 11KHz (ถ้าคุณไม่เชื่อฉันให้วาดรูปง่ายๆ) พฤติกรรมนี้เรียกว่า 'เอฟเฟ็กต์ภาพ'

ซึ่งหมายความว่าก่อนที่จะสุ่มตัวอย่างสัญญาณเราต้องแน่ใจว่าไม่มีความถี่ใดที่นำเสนอสิ่งที่เหนือกว่าที่เรียกว่า "ความถี่ nyquist" (ซึ่งเป็นอัตราการสุ่มตัวอย่างครึ่งหนึ่ง) เมื่อใช้แหล่งกำเนิดเสียงแบบดิจิทัลที่ให้เสียงของพวกเขาได้ถูกสุ่มตัวอย่างมาแล้วนี่ไม่ใช่ข้อตกลงที่ยิ่งใหญ่เพราะบางครั้งพวกเขาสามารถตั้งโปรแกรมให้ไม่สร้างสัญญาณเหนือครึ่งอัตราการสุ่มตัวอย่างหรือพวกเขาสามารถกรองทุกอย่างโดยใช้เฟสเชิงเส้น ตัวกรอง brickwall ที่ไม่มีผลต่อส่วนที่เหลือ

แต่ถ้าคุณสุ่มสัญญาณจากแหล่งกำเนิดสัญญาณอนาล็อกตัวกรองนี้จะทำก่อนที่สัญญาณจะถูกสุ่มตัวอย่าง วิธีเดียวในการกรองเสียงอะนาล็อกคือการใช้วงจรอิเลคตร และเนื่องจากตัวกรองนั้นควรมีส่วนโค้งที่สูงชันมากมันจะส่งผลกระทบต่อความถี่ในช่วงเสียงแม้ว่าตัวกรองนั้นไม่ได้ออกแบบมาสำหรับมันก็ตาม ขณะนี้มีตัวกรองที่ดีภายในตัวแปลง A / D ดังนั้นปัญหาจึงน้อยมาก แต่มันค่อนข้างน่ารำคาญที่จะฟังเมื่อคุณทำงานหลายวันในระบบเสียง 44.1 KHz เทียบกับการใช้ 96KHz ตัวกรองที่จะนำไปใช้เมื่อคุณลดตัวอย่าง 96 กลับไปที่ 44.1 นั้นแน่นอนว่าเป็นตัวกรองดิจิทัลและอาจมีคุณภาพที่ดีกว่ามาก และมันจะถูกนำไปใช้เฉพาะเมื่อคุณทำเสร็จกับงานทั้งหมดดังนั้นมันจะไม่รบกวนคุณ

เหตุผลที่สอง: การกำจัดลักษณะของสัญญาณการทำให้เป็นคลื่น

เมื่อคุณบันทึกด้วยความละเอียด 24 บิตและคุณวางแผนที่จะให้เจ้านายของคุณอยู่ที่ 16 บิตคุณจะต้องมีสัญญาณที่ผิดเพี้ยนเพื่อปกปิดข้อผิดพลาดในการปัดเศษ ตอนนี้เสียงไม่ได้สวยในการบันทึกของคุณและในขณะที่สัญญาณรบกวนบรอดแบนด์ดีที่สุดสำหรับการปกปิดข้อผิดพลาดในการปัดเศษการปรับรูปร่างอาจเป็นการปรับปรุงครั้งใหญ่ที่นำไปใช้กับสัญญาณที่ผิดเพี้ยนเพื่อให้รบกวนน้อยลง ทีนี้ถ้าการบันทึกเสียงนั้นใช้ 96KHz คุณสามารถสร้างสัญญาณรบกวนซึ่งส่วนใหญ่เป็นความถี่ที่สูงกว่า 24KHz ได้ดังนั้นจึงไม่มีใครได้ยินเสียงพวกนั้นเลย เสียงที่ดังอยู่ในตอนท้ายของการบันทึกในที่สุดกรองออกในขณะที่คุณลงตัวอย่างโครงการของคุณกลับไปที่ 44.1 KHz

ดังนั้นบรรทัดล่าง: มันมีประโยชน์เมื่อบันทึกสิ่งอะนาล็อก:

  • ได้แน่นอน. คุณมีสัญญาณรบกวนน้อยลงจากฟิลเตอร์ป้องกันภาพสั่นไหวและสัญญาณรบกวนน้อยลงเมื่อใช้กับการสร้างเสียงรบกวนที่เหมาะสม

มันจะมีประโยชน์เมื่อทำงานกับสิ่งดิจิตอลที่มาจาก softsynth ของฉันหรือไม่

  • ใช่ยังมีประโยชน์ถ้าคุณวางแผนที่จะทำงานกับ 24 บิตและควบคุมมันได้ถึง 16 บิต คุณสามารถได้รับเสียงรบกวนอย่างมากจากการสร้างสัญญาณที่สั่นไหว

"เนื่องจากบางครั้งพวกเขาสามารถตั้งโปรแกรมให้ไม่สร้างสัญญาณเหนือครึ่งหนึ่งของอัตราการสุ่มตัวอย่าง" อย่างไรก็ตาม: "หรือพวกเขาสามารถกรองทุกอย่างออกมาได้โดยใช้ตัวกรองอิฐมอลต์เฟสเชิงเส้นที่ไม่มีผลต่อส่วนที่เหลือ" ฉันไม่ แน่ใจว่าเป็นไปได้ เพื่อที่จะกรองคลื่นอัลตร้าซาวด์จากคลื่นที่สร้างขึ้นแบบดิจิทัลคุณจะต้องสร้างมันด้วยความถี่การสุ่มตัวอย่างที่สูงขึ้นในตอนแรก (ซึ่งจะยังคงเป็นนามแฝง แต่ไม่มากในวงเสียง) คุณไม่สามารถกรองความถี่ที่ใช้นามแฝงได้
endolith

3
"ตอนนี้ถ้าการบันทึกถูกสร้างขึ้นด้วย 96KHz คุณสามารถสร้างสัญญาณรบกวนซึ่งส่วนใหญ่เป็นความถี่ที่สูงกว่า 24KHz ดังนั้นจึงไม่มีใครได้ยินเสียงพวกนั้นเสียงรบกวนที่ปลายด้านท้ายของการบันทึกก็จะถูกกรองออกในตอนที่คุณดูตัวอย่าง โครงการของคุณกลับไปที่ 44.1 KHz " ฉันไม่คิดว่าถูกต้องเช่นกัน หากคุณกรอง dither ทั้งหมดออกแล้วผลลัพธ์ของคุณจะไม่มีอีกต่อไปใช่หรือไม่ มันจะกลับไปมีการบิดเบือนเชิงปริมาณหรือไม่
endolith

ความคิดเห็นแรก: คุณพูดถูก ฉันคิดว่าสิ่งที่ฉันหมายถึงคือเมื่อคุณใช้เอฟเฟกต์ดิจิตอลคุณสามารถคาดหวังว่าช่วงความถี่ของเอาต์พุตจะได้รับการดูแล ใช้วิธีนี้หากผลลัพธ์ออกมาเป็นนามแฝงในตอนแรกการเพิ่มความถี่ตัวอย่างของคุณเองจะไม่เปลี่ยนแปลง ตามความคิดเห็นที่สองของคุณ: น่าสนใจ; มันทั้งหมดขึ้นอยู่กับตัวกรองที่ใช้ก่อนการสุ่มตัวอย่าง หากเสียงถูกถ่ายกลับมาจะเห็นได้ชัดว่าจะปิดบังควอนตัม แต่มันจะไม่เหมือนกันเลย ฉันคิดว่าฉันจะรูปร่างเสียงของฉันรอบ freq nyquist สุดท้าย
The Pellmeister

1
การทำงานบางประเภทอาจเปลี่ยนส่วนประกอบความถี่สูงกว่า 24KHz เป็นองค์ประกอบความถี่ต่ำกว่า 20KHz และในทางกลับกัน หากเสียงไม่ได้ถูกเก็บไว้ในอัตราการสุ่มตัวอย่างที่สูงขึ้นระหว่างการดำเนินการดังกล่าวครั้งแรกและครั้งสุดท้ายการสูญเสียข้อมูลในระดับกลางอาจส่งผลต่อเสียงที่ได้ยินในเอาต์พุตสุดท้าย
supercat

12

สำหรับโครงการที่ใช้ระบบดิจิตอลอย่างเคร่งครัดเช่นใช้การสังเคราะห์แบบดิจิตอลบริสุทธิ์และไม่บันทึกเนื้อหาใด ๆ ที่จะถูกแปลงจากอะนาล็อก -> ดิจิตอลมีข้อได้เปรียบอะไรบ้างในการใช้อัตราการสุ่มตัวอย่างที่สูงกว่า 44.1kHz?

ใช่. ตัวอย่างบางส่วน:

การสร้างความถี่ที่คุณไม่ต้องการ

นามแฝงจากการสังเคราะห์แบบดิจิทัล

หลายตาราง / ฟันเลื่อย / สามเหลี่ยมกำเนิดคลื่นจะไร้เดียงสาที่เขียนในการที่พวกเขาผลิตจำนวนอนันต์ของเสียงดนตรีที่มีชื่อว่าและเสียงที่ไม่ดีอย่างเห็นได้ชัด ( ..., +1, +1, +1, +1, −1, −1, −1, −1, ...คือไม่ได้คลื่นสี่เหลี่ยมที่ถูกต้องและฮาร์โมนิ aliased จะผลิตเสียงจูนวิทยุในช่วงหลัง portamento.)

หากความถี่การสุ่มตัวอย่างสูงขึ้นเอฟเฟกต์นี้จะลดลงเนื่องจากความถี่การ aliasing อยู่ห่างจากย่านความถี่เสียงมากขึ้น

แน่นอนว่ามันจะดีกว่าถ้าตัวกำเนิดถูกเขียนด้วยวิธีกำจัดนามแฝงอย่างสมบูรณ์แต่คุณไม่สามารถควบคุมมันได้ในฐานะผู้ใช้ แม้แต่คนที่เขียนดีมักจะประนีประนอมด้วยนามแฝง "ลดลง"ไม่ จำกัด วงอย่างสมบูรณ์ดังนั้นอัตราการสุ่มตัวอย่างที่สูงขึ้นจึงยังช่วยได้

นามแฝงจากการบิดเบือนดิจิตอล

ในทำนองเดียวกันเมื่อคุณใช้การบิดเบือนแบบดิจิตอลที่ไม่ใช่แบบเชิงเส้นใด ๆ มันจะสร้างฮาร์โมนิกหรือผลิตภัณฑ์intermodulationจำนวนไม่ จำกัด สิ่งที่จะถูกสร้างขึ้นเหนือความถี่ Nyquist นั้นจะถูกส่งกลับเป็นช่วงเสียง

แม้ว่ามันจะเป็นไปได้ในทางทฤษฎีที่จะบิดเบือนในแบบ band Bandaแต่ก็ไม่ได้เป็นเรื่องปกติที่ปลั๊กอินตัวแปลงสัญญาณจะทำเช่นนี้ ปลั๊กอินบิดเบือนกีตาร์ทั้งหมดที่ฉันทดสอบมีนามแฝงแม้ประมวลผลที่ 96 kHz

ฉันไม่แน่ใจว่าปัญหานี้จริงหรือไม่ สิ่งต่าง ๆ มากมายทำให้เกิดการบิดเบือนเล็กน้อยเช่นคอมเพรสเซอร์หรือไดรฟ์ข้อมูลจางหายไป แต่จำนวนนั้นน้อยมากดังนั้นจำนวน aliased จึงน้อยกว่ามาก สำหรับการบิดเบือนที่หนักหน่วงความถี่ของนามแฝงอาจไม่สามารถสังเกตเห็นได้เพราะถูกฝังอยู่ในเสียงรบกวน อัตราการสุ่มตัวอย่างที่สูงขึ้นจะช่วยลดผลกระทบที่เป็นอันตรายใด ๆ

ขาดของความถี่ที่คุณทำลง

ข้อกังวลที่เป็นไปได้อีกประการหนึ่งคือความถี่อัลตราโซนิกที่สังเคราะห์ขึ้นอาจมีประโยชน์ในการประมวลผลในภายหลังแม้ว่าคุณจะไม่ได้ยินเสียงโดยตรงในการบันทึก:

การเปลี่ยนความถี่จากการเปลี่ยนแปลงเวลา

หากคุณสุ่มตัวอย่างคลื่นใหม่เพื่อทำให้ช้าลงเช่นในเครื่องเล่น soundfont ความถี่ล้ำเสียงเหล่านั้นจะกลายเป็นความถี่ที่ได้ยินได้ หากคุณกรองพวกเขาออกเพื่อหลีกเลี่ยงการใช้นามแฝงในอัตราการสุ่มตัวอย่างที่ต่ำกว่าเสียงที่ช้าลงจะหายไปในระดับไฮเอนด์

บิดเบือน / Modulation

ดังที่ได้กล่าวไว้ก่อนหน้านี้การบิดเบือนจะสร้างความถี่ในการรวมใหม่ที่ตำแหน่งผลรวมและตำแหน่งที่แตกต่างจากความถี่ในการบันทึกดั้งเดิม เวลานี้เรามีความกังวลเกี่ยวกับความถี่เสียงที่ต้องการซึ่งเกิดจากการบิดเบือน / การปรับความถี่อัลตราโซนิก (ไม่เกี่ยวข้องกับนามแฝง) หากความถี่อัลตราโซนิกเหล่านั้นไม่ได้อยู่ในการบันทึกก่อนการบิดเบือนเอาต์พุตจะหายไปจากความถี่ที่ได้ยินได้ที่สร้างขึ้นและมันจะไม่เลียนแบบเอฟเฟกต์อะนาล็อกที่เทียบเท่ากัน

อีกครั้งฉันไม่แน่ใจว่านี่เป็นปัญหาจริงหรือไม่ แต่อย่างน้อยก็เป็นไปได้และอัตราการสุ่มตัวอย่างที่สูงขึ้นซึ่งรวมอัลตร้าซาวด์จะทำให้ดีขึ้น

โดยทั่วไปการทำงานในอัตราการสุ่มตัวอย่างที่สูงขึ้นจะให้ "headroom" เพื่อป้องกันปัญหาเกี่ยวกับเอฟเฟกต์และสิ่งต่าง ๆ ที่อาจไม่สามารถนำไปใช้ได้อย่างถูกต้อง เช่นเดียวกับการถ่ายเอกสารการถ่ายสำเนาคุณภาพของสำเนาแต่ละชุดจะดีขึ้นเท่าไรการย่อยสลายที่น้อยลงก็จะเกิดขึ้นในผลิตภัณฑ์ขั้นสุดท้าย

ไร้ประโยชน์สำหรับการเล่น

นี่ไม่ได้หมายความว่าอัตราการสุ่มตัวอย่างที่สูงขึ้นเป็นความคิดที่ดีสำหรับการเล่นของมิกซ์เสร็จ พวกเขาไม่. ตามที่อธิบายไว้ข้างต้นความเพี้ยนของอัลตร้าซาวด์สามารถสร้างเสียงที่ได้ยินได้และลำโพงเป็นสิ่งที่เป็นเส้นตรงที่สุดในห่วงโซ่เสียงดังนั้นคุณจึงต้องการกำจัดอัลตร้าซาวด์ใด ๆ จากส่วนผสมสุดท้ายเพื่อป้องกันไม่ให้ลำโพงบิดเบี้ยว

ไม่มีประโยชน์ในการสุ่มตัวอย่างอัตราการเล่นเพลงที่สูงขึ้น; ควรใช้ในขั้นตอนการบันทึกและการประมวลผลเท่านั้น ดู24/192 ดาวน์โหลดเพลง ... และทำไมพวกเขาทำให้รู้สึกไม่


1
+1 สำหรับการกล่าวถึงเครื่องกำเนิดคลื่นสี่เหลี่ยมที่ไม่ถูกต้อง นอกจากนี้เดียวกันสามารถกล่าวว่าสำหรับฟันเลื่อยและสามเหลี่ยมคลื่น ...
หลี Borsch

การอัปแซมปลิงแบบดิจิตอลเป็น 96KHz หรืออัตราที่สูงกว่ามักจะเป็นประโยชน์สำหรับการเล่นเนื่องจากเอาต์พุตเสียงสามารถเก็บรักษาได้อย่างง่ายดายจากเนื้อหาที่ไม่ต้องการในช่วง 22Khz ถึง 48KHz การสร้างตัวกรองแบบอะนาล็อกเพื่อฆ่าทุกอย่างที่เกี่ยวกับ 48Khz โดยไม่ทำร้ายอะไรที่ต่ำกว่า 22Khz นั้นง่ายกว่าการสร้างเพียงตัวเดียวที่จะฆ่าทุกอย่างที่สูงกว่า 26Khz โดยที่ไม่ทำอะไรเลยที่ต่ำกว่า 22Khz หากเสียงจะถูกแปลงเป็น 96Khz สำหรับการเล่นและหนึ่งมีไว้ที่ 96Khz หนึ่งอาจรวมไว้ที่ 96Khz มากกว่า downconverting และ upconverting
supercat

@supercat สำหรับการบันทึกไม่ใช่การเล่น มันง่ายที่จะสร้างตัวกรองดิจิตอลที่สูงชันเป็นพิเศษเพื่อลบทุกสิ่งที่เกิน 20 kHz ก่อนที่จะเล่น การสร้างตัวกรองแบบอะนาล็อกเพื่อลบอัลตร้าซาวด์ก่อนการสุ่มตัวอย่างนั้นยาก / แพงซึ่งเป็นสาเหตุที่ ADC ใช้การ oversampling ในอัตราที่สูงกว่ามาก (MHz) จากนั้นใช้ตัวกรองแบบดิจิทัลเพื่อลบอัลตร้าซาวด์
endolith

5

การมีเฮดรูมสำหรับเอฟเฟกต์เป็นเหตุผลที่สมเหตุสมผลในทางทฤษฎี (และในทางปฏิบัติ) ที่จะมีอัตราการสุ่มตัวอย่างสูงกว่าขีด จำกัด การได้ยินของมนุษย์ถึงสองเท่า

เหตุผลนี้ทำให้มองเห็นได้ง่ายโดยเปรียบเทียบกับการแก้ไขภาพ - ถ้าคุณบอกว่าภาพ 800x600 px กับภาพโดยรวมของกำแพงอิฐความคมชัดสูงแหอวนสิ่งทอลายทางหรือพื้นผิวความคมชัดสูงอื่น ๆ ที่เว้นระยะห่าง ทวีคูณ 45 °โดยไม่ทำให้เกิดเอฟเฟกต์ของแสงและรายละเอียดเบลอ ด้วยเสียงการบิดเบือนที่เกิดขึ้นกับการแก้ไขมีเงื่อนไขต่างกัน แต่ใช้หลักการทฤษฎีการสุ่มตัวอย่าง Nyquist-Shannon นามแฝงเป็นคำที่ใช้บ่อยกว่า "เอฟเฟ็กต์ภาพ" สำหรับเหตุการณ์ที่เสียงตัวอย่างมีเนื้อหาความถี่อยู่ครึ่งหนึ่งของอัตราการสุ่มตัวอย่าง (เรียกว่าความถี่ Nyquist)

ในทางปฏิบัติเช่นเดียวกับ Pelle ten Cate ได้อธิบายไปแล้วตัวกรอง low-pass low brick นั้นไม่สามารถทำได้ แต่จะมีการไล่ระดับสีลาด (slope) เสมอ

อีกเหตุผลที่ดีในการบันทึกด้วยอัตราการสุ่มตัวอย่างที่สูงขึ้นคือการได้ภาพสเตอริโอที่แม่นยำยิ่งขึ้นเนื่องจากการได้ยินของมนุษย์ในส่วนใหญ่อาศัยความแตกต่างของเวลาเล็กน้อย (ประมาณ 5-20 มิลลิวินาทีและทางร่างกายเหล่านี้เป็นความแตกต่างของเฟส) ส่วนหัว "เงา" และด้านอื่น ๆ ก็เป็นส่วนหนึ่งเช่นกัน

ด้วยอัตราการสุ่มตัวอย่างซีดีเพลง 44100 Hz แต่ละตัวอย่างแสดงถึง 22,6 microseconds และตัวอย่างหนึ่งช่วงความถี่ 882 Hz มี 50 ตัวอย่าง นอกจากนี้การหน่วงเวลาค่อนข้างนานที่ 20 มิลลิวินาทีมีระยะเวลานาน 50 ตัวอย่าง ดังนั้นเพียง 25 ตัวอย่างที่ความถี่กลางนั่นหมายถึงการยกเลิกเฟส 180 °

ดังนั้นอัตราการสุ่มตัวอย่าง 44,1 KHz นั้นดีพอ แต่ไม่มีประโยชน์สำหรับการแก้ไขมากนัก

สิ่งที่ควรคำนึงถึงก็คือการใช้การทำ dithering (เช่นเดียวกับการแก้ไขภาพ) เพื่อป้องกันไม่ให้เกิดเสียงรบกวนในเชิงปริมาณ และต่อไปคุณจะถามฉันควรใช้ปริมาณ 24 บิตแทน 16 บิต ...


มันแสดงให้เห็นว่าอัลตร้าซาวด์ยังคงมีผลต่อการรับรู้สเตอริโอของเราแม้ว่าเราจะไม่ได้ยินอย่างมีสติ?
endolith

1
ไม่ได้ผลของความแตกต่างระหว่างเวลาในภาพสเตอริโอมีผลต่อความถี่ต่ำสุด (ต่ำกว่า 1500 Hz) ซึ่งระยะหูมีความยาวสั้นกว่าความยาวคลื่นดังนั้นจึงมีความแตกต่างของเฟส สำหรับความถี่ที่สูงขึ้นความแตกต่างของระดับเสียงมีผลต่อการแปลเสียงมากขึ้น ดู: en.wikipedia.org/wiki/Interaural_time_difference#Duplex_theory
peterhil

4

อีกเหตุผลที่ดีในการใช้อัตราการสุ่มตัวอย่างที่สูงขึ้นคือการแก้ไขข้อบกพร่องของการใช้งานปลั๊กอิน ตัวเขียนปลั๊กอินจำนวนมากไม่ได้คำนึงถึงผลกระทบจากการขยายแบนด์วิดท์ของการดำเนินการสัญญาณไม่เชิงเส้นอย่างถูกต้องและด้วยเหตุนี้คุณจะได้รับเอฟเฟกต์นามแฝงก่อนออกจากกล่อง

ตัวอย่างเช่นคอมเพรสเซอร์นั้นเป็นแอมพลิฟายเออร์ที่ควบคุมแรงดันไฟฟ้า ... มันคูณสัญญาณหนึ่ง (สัญญาณเสียง) ด้วยสัญญาณอื่น (อัตราขยาย) การคูณ 2 สัญญาณยังเป็นที่รู้จักกันในนามการมอดูเลตวงแหวนหรือเฮเทอโรไดนิ่ง; มันมีผลกระทบของการสร้างผลรวมและสัญญาณที่แตกต่างของ 2 อินพุต ถ้าคุณคูณไซน์ 15 kHz ด้วยไซน์ 10 kHz คุณจะได้รับสัญญาณเอาท์พุตที่มีส่วนประกอบ 5 kHz และ 25 kHz หากการเพิ่มขึ้นของคอมเพรสเซอร์ของคุณมีการโจมตีที่รวดเร็วมากและสัญญาณอินพุตมีแบนด์วิดธ์กว้างสัญญาณคอมโพเนนต์ "รวม" สามารถข้ามขีด จำกัด Fs / 2 ได้อย่างง่ายดายบนพื้นฐานชั่วคราวทำให้เกิดขยะขยะความถี่ต่ำปลอมในเอาต์พุตของคุณ สัญญาณ.

การแก้ไขที่แท้จริงสำหรับสิ่งนี้มีไว้สำหรับปลั๊กอินที่จะนำไปใช้โดยใช้การสุ่มตัวอย่างภายใน แต่ถ้าคุณไม่สามารถเข้าใจได้ว่าสิ่งที่ดีที่สุดถัดไปคือการใช้ระบบที่มีค่า F สูงที่สุดเท่าที่จะทำได้ คุณจะไม่มีเนื้อหาเสียงจริง ๆ ในสตราโตสเฟียร์ แต่คุณได้รับการปกป้องจากปลั๊กอินบางตัวที่ผ่านพ้นขอบเขต


2

เหตุผลทางคณิตศาสตร์อย่างน้อยก็เพื่อความต้องการของโลกเสียงโดยทั่วไปแล้วทฤษฎีการสุ่มตัวอย่างของ Nyquist-Shannonบางครั้งก็เรียกว่าทฤษฎีบท Nyquist ซึ่งในภาษาพื้นฐานเพียงระบุว่าการทำซ้ำอย่างเต็มที่ รูปคลื่นที่มีความถี่สูงสุด n Hz คุณต้องการตัวอย่าง 2n ต่อวินาที


1
ใช่ แต่ Nyquist-Shannon ใช้ตัวกรองอิฐซึ่งเป็นไปไม่ได้ทางร่างกาย
endolith

1

เมื่อบันทึกด้วยหลายแทร็คฉันเชื่อว่าความลึกของบิตสำคัญกว่าอัตราการสุ่มตัวอย่าง

ตัวอย่างเช่น 24 บิตน่าจะดีกว่า 16 บิต สิ่งนี้เกี่ยวข้องกับวิธีการที่แทร็กของคุณถูกผสมเข้าด้วยกันและสิ่งที่เรียกว่า "ข้อผิดพลาดในการปัดเศษ" เมื่อมีบิตไม่เพียงพอ

ฮาร์ดแวร์และซอฟต์แวร์ส่วนใหญ่สามารถรองรับ 96k & 24 บิตได้ง่ายดังนั้นจึงไม่จำเป็นต้องชำระน้อยลง

คุณสามารถสร้างการบันทึกคุณภาพสูงโดยใช้อุปกรณ์ 16/44.1 ที่เก่ากว่า

มันเกี่ยวกับความสามารถมากกว่าอุปกรณ์


2
แม้ว่านี่จะไม่ใช่ 'ไม่จริง' แต่การทำงานกับ 24 บิตจะแนะนำข้อเสียเปรียบที่คุณต้องใช้หากคุณต้องการกลับไปเป็น 16 บิต เสียงรบกวนจะลดลงอย่างมากหากใช้กับสัญญาณ 96 KHz เมื่อใช้การสร้างเสียง (ดูคำตอบอื่น ๆ สำหรับรายละเอียด)
The Pellmeister

1
ซอฟต์แวร์เสียงระดับมืออาชีพทั้งหมดทำงานร่วมกับจุดลอยตัว 32 หรือ 64 บิตภายในระหว่างการผสมโดยไม่คำนึงถึงความลึกบิตที่ใช้ระหว่างการบันทึก
leftaroundabout

3
@PelletenCate ถ้าคุณทำงานกับ 16 บิตคุณเมาแล้วเพราะคุณเพิ่มสัญญาณรบกวนเชิงปริมาณในแต่ละขั้นตอนการแก้ไขที่ไม่สำคัญ นี่เป็นความผิดที่แสดงถึงการทำงานกับ 24 บิตขึ้นไปที่แนะนำข้อเสียดังกล่าว
Sarge Borsch

ฉัน +1 แล้ว ฉันไม่ควรอธิบายว่ามันเป็นข้อเสียเปรียบเพราะมันไม่ใช่ อย่างไรก็ตามฉันควรจะบอกว่าทั้งเสียง quantisation และเสียง dithering ที่ไม่มีรูปร่างนั้นสามารถได้ยินได้ใน 44/16 มิกซ์ ประเด็นของฉันคือการเปลี่ยนเป็น 24 บิตคุณให้โอกาสตัวเองในการเปลี่ยนปัญหาหนึ่ง (เสียงเชิงปริมาณ) สำหรับอีก (เสียงรบกวน) ซึ่งสามารถลดลงได้อย่างมีประสิทธิภาพโดยการบันทึกในอัตราการสุ่มตัวอย่างที่สูงขึ้น
The Pellmeister

0

"... ข้อเท็จจริงที่แท้จริงและยากสำหรับเหตุผลทางคณิตศาสตร์หรือ DSP ที่เกี่ยวข้องใด ๆ ที่สนับสนุนการใช้อัตราการสุ่มตัวอย่างที่สูงขึ้น"

เรียกว่าข้อเท็จจริงจริงมาจากวิศวกรเสียงจริงมีความเป็นไปได้ในการค้นหาหลายที่นี่ แต่มันอาจจะเร็วกว่าการค้นหาบนอินเทอร์เน็ตสำหรับบทความที่เขียนโดยวิศวกรจริง การถามที่นี่หมายถึงคุณชำระให้กับเราฉันไม่ใช่วิศวกรเสียง แต่ฉันสามารถใช้เครื่องมือค้นหา

สิ่งที่ต้องพิจารณาคือพื้นเสียงของคุณ คำตอบอื่น ๆ พูดถึงว่าคุณจะเพิ่มเสียงรบกวนอย่างไรและพูดถึงข้อผิดพลาดที่ทำให้เกิดเสียงและควอนติเซชั่น แต่คำตอบอื่น ๆ ที่ใกล้เคียงที่สุดคือการพูดถึงพื้นเป็นอาหารอันโอชะ: "... ความถี่ aliased อาจไม่สังเกตเห็น "

หากคุณกำลังบันทึกที่สถานที่ก่อสร้างสถานีรถไฟหรืออู่ต่อเรือคุณสามารถถูกและบันทึกที่ 44.1 หากคุณไม่ได้แสวงหาความสมบูรณ์แบบ - มิฉะนั้นเช่นเดียวกับวิดีโอ 4: 2: 2 และไม่ใช่ 4: 2: 0 ดังนั้นจึงเหมาะสำหรับ เสียงมากกว่า Bits แต่ไม่เกิน 32 (สำหรับคุณภายในซอฟต์แวร์มากกว่า 32) และอัตราตัวอย่างสูงกว่า แต่ไม่เกิน 96kHz (อีกครั้งสำหรับคุณใช้ซอฟต์แวร์และฮาร์ดแวร์ภายในซึ่งทำงานที่อัตราตัวอย่างสูงกว่า)

ลองบทความเหล่านี้เพื่อให้คุณเริ่มต้นค้นหาคำแนะนำของวิศวกร - คุณจะไม่ไปที่ข้อตกลงทางกฎหมาย stackexchange สำหรับข้อมูลสำคัญดังนั้นเรียนรู้ที่จะเรียนรู้ในท้ายที่สุดมันคือจำนวนเงินที่คุณสนใจผู้ชมของคุณใส่ใจระดับทักษะของคุณและสิ่งที่คุณสามารถจ่ายได้

ทำไมต้อง 88.2 - http://www.soundonsound.com/sound-advice/q-why-882khz-best-sample-rate-recording

ทำไมต้อง 24/96 - http://www.premiersoundfactory.com/modules/pico/content0035.html

สถานที่มากมายบนอินเทอร์เน็ตรวมถึงหลักสูตรออนไลน์ฟรี

เวอร์ชั่นสั้นคือใช่มีเหตุผลและเป็นเรื่องยาก - อย่าโยนในข้อผิดพลาดที่จุดเริ่มต้นและหวังว่าจะครอบตัดพวกเขาในภายหลังคุณจะไม่ต้องการให้ใครบางคนพูดในขณะที่คุณกำลังพยายามบันทึกหรือคนแปลกหน้าวิ่งผ่าน Shot - ยังมีวิดีโอที่มีทั้งแบบนั้นและอีกหลายนิ้วหัวแม่มือ

แฮ็คที่ต้องจำคือบันทึกเสียงดังโดยไม่ต้องตัดในอัตราที่สูงที่คุณสามารถจ่ายได้ (เวลา, พื้นที่เก็บข้อมูล, ทักษะ, เงิน, และประเภทของอินพุต (IE: สถานที่ก่อสร้าง), ผู้ชม) และตัดความแตกต่างที่เงียบที่สุด การหาปริมาณหมัดและเสียงรบกวน (ที่คุณอาจไม่เคยสังเกตมาก่อนจนกว่าเราจะพูดถึงมัน)

[เขียนโดยมีเจตนาที่จะเป็นคำตอบง่ายๆโดยไม่มีข้อผิดพลาดตามข้อเท็จจริงและไม่ได้มีเจตนาที่จะทำให้ผู้สนใจรักเสียงหรือวิศวกรเสียงมืออาชีพ]

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.