ทำไมหูฟังที่ใช้งานไม่เท่ากันกับการตอบสนองความถี่แบน


11

หูฟังบางรุ่นใช้งานอยู่โดยมีแอมพลิฟายเออร์ในถ้วยและต้องใช้แหล่งพลังงาน (โดยทั่วไปคือแบตเตอรี่ AAA)

จากนั้นฉันเห็นว่ามีออดิโอไฟล์มากมายที่พูดถึงการตอบสนองความถี่เป็นตัวชี้วัดของหูฟังที่ดีแค่ไหน

อย่างไรก็ตามด้วยแอมป์บางตัวดูเหมือนว่าจะง่ายต่อการปรับสมดุลสัญญาณอินพุท pre-amplified ซึ่งสามารถแก้ไขการตอบสนองความถี่ของผู้ขับขี่ได้อย่างสมบูรณ์และทำให้เกิดการตอบสนองความถี่ที่แบนมากหากต้องการ (หรือไม่เช่นเบส เพิ่มหรือตัด)

มีบางอย่างที่ยากเป็นพิเศษกับการทำเช่นนั้นหรือไม่?

กราฟการตอบสนองความถี่ http://graphs.headphone.com/graphCompare.php?graphType=0&graphID [สหรัฐ] = 1383&graphID [[]] [==]

ตัวอย่างเช่นสำหรับ Dre Beats Studio (สายสีน้ำเงิน) บางทีวงจร EQ อาจให้ + 3db @ 750Hz, -5dB @ 1100Hz, +6.5dB@1300Hz, + 5dB @ 1550Hz, -4.5dB@8.5kHz และ + 14dB @ 15kHz พร้อมการปรับความชันเพื่อปรับการตอบสนองความถี่ให้เป็น 0db ตั้งแต่ 500Hz ถึง 20kHz

คำตอบ:


20

เมื่อคุณนำบางสิ่งมาใส่หูของคุณเพื่อทำซ้ำการบันทึกแบบสเตอริโอมาตรฐานคุณไม่ต้องการการตอบสนองความถี่แบบแบนเนื่องจากฟังก์ชั่นการถ่ายโอนที่เกี่ยวข้องกับศีรษะซึ่งปกติจะเข้ามาเล่นเพื่อให้ได้เสียงที่ไกลออกไป .

ให้ฉันพูดสองสามย่อหน้าจากหนังสือ :

ส่วนประกอบทั้งหมดในห่วงโซ่การส่งสัญญาณด้วยไฟฟ้าหูฟังเป็นสิ่งที่ถกเถียงกันมากที่สุด ความเที่ยงตรงสูงในความหมายที่แท้จริงไม่เพียง แต่เกี่ยวข้องกับเสียงต่ำ แต่ยังเกี่ยวกับการแปลเชิงพื้นที่มีความเกี่ยวข้องมากขึ้นกับ stereophony ลำโพงเนื่องจากการแปลในหูฟังแบบ in-head ที่มีชื่อเสียง และยังบันทึกเสียง binaural ด้วยหัวหุ่นซึ่งมีแนวโน้มมากที่สุดสำหรับความเที่ยงตรงระดับสูงที่แท้จริงในชีวิต แม้แต่ในสมัยรุ่งเรืองพวกเขาไม่พบสถานที่ในการบันทึกและแพร่ภาพเป็นประจำ ในเวลานั้นมีสาเหตุที่ไม่น่าเชื่อถือของการแปลส่วนหน้า, ความไม่ลงรอยกันกับการแพร่พันธุ์ของลำโพง, รวมถึงแนวโน้มที่จะไม่สวยงาม เนื่องจากการประมวลผลสัญญาณดิจิตอล (DSP) สามารถกรองเป็นประจำโดยใช้ฟังก์ชั่นการถ่ายโอนที่เกี่ยวข้องกับหัว binaural, HRTF, หัวหุ่นไม่จำเป็นต้องใช้อีกต่อไป

แอปพลิเคชั่นหูฟังที่ใช้กันมากที่สุดคือการให้อาหารพวกมันด้วยสัญญาณสเตอริโอที่มีไว้สำหรับลำโพง คำถามนี้ทำให้เกิดการตอบสนองความถี่ในอุดมคติ สำหรับอุปกรณ์อื่น ๆ ในห่วงโซ่การส่งสัญญาณ (รูปที่ 14.1) เช่นไมโครโฟนเครื่องขยายเสียงและลำโพงการตอบสนองแบบแบนมักเป็นวัตถุประสงค์ในการออกแบบ จำเป็นต้องใช้ลำโพงเพื่อสร้างการตอบสนอง SPL แบบแบนที่ระยะทางปกติ 1 ม. SPL แบบฟรีฟิลด์ ณ จุดนี้จะจำลอง SPL ที่ตำแหน่งไมโครโฟนในสนามเสียงของคอนเสิร์ตที่ถูกบันทึกไว้ ฟังการบันทึกที่ด้านหน้าของ LS หัวของผู้ฟังจะบิดเบือน SPL เป็นเส้นตรงโดยการเลี้ยวเบน สัญญาณหูของเขาไม่แสดงการตอบสนองแบบเรียบอีกต่อไป อย่างไรก็ตาม สิ่งนี้ไม่จำเป็นต้องเกี่ยวข้องกับผู้ผลิตลำโพงเนื่องจากจะเกิดขึ้นเช่นกันหากผู้ฟังมีการแสดงสด ในทางตรงกันข้ามผู้ผลิตหูฟังมีความกังวลโดยตรงกับการผลิตสัญญาณหูเหล่านี้ ข้อกำหนดที่วางไว้ในมาตรฐานได้นำไปสู่หูฟังที่มีการสอบเทียบภาคสนามซึ่งการตอบสนองความถี่จะทำซ้ำสัญญาณหูสำหรับลำโพงข้างหน้ารวมถึงการสอบเทียบภาคสนามแบบกระจายซึ่งมีจุดมุ่งหมายเพื่อจำลอง SPL ในหูของ ผู้ฟังสำหรับเสียงที่ส่งมาจากทุกทิศทาง สันนิษฐานว่าลำโพงหลายตัวมีแหล่งกำเนิดที่ไม่ต่อเนื่องแต่ละตัวมีการตอบสนองต่อแรงดันไฟฟ้าแบบแบน ผู้ผลิตหูฟังเกี่ยวข้องโดยตรงกับการผลิตสัญญาณหูเหล่านี้ ข้อกำหนดที่วางไว้ในมาตรฐานได้นำไปสู่หูฟังที่มีการสอบเทียบภาคสนามซึ่งการตอบสนองความถี่จะทำซ้ำสัญญาณหูสำหรับลำโพงข้างหน้ารวมถึงการสอบเทียบภาคสนามแบบกระจายซึ่งมีจุดมุ่งหมายเพื่อจำลอง SPL ในหูของ ผู้ฟังสำหรับเสียงที่ส่งมาจากทุกทิศทาง สันนิษฐานว่าลำโพงหลายตัวมีแหล่งกำเนิดที่ไม่ต่อเนื่องแต่ละตัวมีการตอบสนองต่อแรงดันไฟฟ้าแบบแบน ผู้ผลิตหูฟังเกี่ยวข้องโดยตรงกับการผลิตสัญญาณหูเหล่านี้ ข้อกำหนดที่วางไว้ในมาตรฐานได้นำไปสู่หูฟังที่มีการสอบเทียบภาคสนามซึ่งการตอบสนองความถี่จะทำซ้ำสัญญาณหูสำหรับลำโพงข้างหน้ารวมถึงการสอบเทียบภาคสนามแบบกระจายซึ่งมีจุดมุ่งหมายเพื่อจำลอง SPL ในหูของ ผู้ฟังสำหรับเสียงที่ส่งมาจากทุกทิศทาง สันนิษฐานว่าลำโพงหลายตัวมีแหล่งกำเนิดที่ไม่ต่อเนื่องแต่ละตัวมีการตอบสนองต่อแรงดันไฟฟ้าแบบแบน ซึ่งจุดมุ่งหมายคือการทำซ้ำ SPL ในหูของผู้ฟังเพื่อให้เกิดเสียงที่มาจากทุกทิศทาง สันนิษฐานว่าลำโพงหลายตัวมีแหล่งกำเนิดที่ไม่ต่อเนื่องแต่ละตัวมีการตอบสนองต่อแรงดันไฟฟ้าแบบแบน ซึ่งจุดมุ่งหมายคือการทำซ้ำ SPL ในหูของผู้ฟังเพื่อให้เกิดเสียงที่มาจากทุกทิศทาง สันนิษฐานว่าลำโพงหลายตัวมีแหล่งกำเนิดที่ไม่ต่อเนื่องแต่ละตัวมีการตอบสนองต่อแรงดันไฟฟ้าแบบแบน

ป้อนคำอธิบายรูปภาพที่นี่

(a) การตอบสนองแบบ Free-field: สำหรับความต้องการของการอ้างอิงที่ดีกว่ามาตรฐานระหว่างประเทศและอื่น ๆ ได้กำหนดข้อกำหนดสำหรับหูฟังความเที่ยงตรงสูงดังต่อไปนี้: การตอบสนองความถี่และการรับรู้เสียงดังสำหรับสัญญาณโมโนแรงดันคงที่ ของลำโพงตอบสนองแบบแบนที่ด้านหน้าของผู้ฟังภายใต้เงื่อนไขของเสียงสะท้อน ฟังก์ชั่นการถ่ายโอนแบบ free-field (FF) ของหูฟังที่ความถี่ที่กำหนด (1,000 Hz ที่เลือกเป็นการอ้างอิง 0 dB) เท่ากับจำนวนเงินใน dB ซึ่งจะขยายสัญญาณหูฟังให้เสียงดังเท่ากัน จำเป็นต้องเฉลี่ยค่าเฉลี่ยของวิชาที่น้อยที่สุด (โดยทั่วไปคือแปด) [... ] รูปที่ 14.76 แสดงฟิลด์ความอดทนทั่วไป

ป้อนคำอธิบายรูปภาพที่นี่

(b) การตอบสนองแบบกระจายสนาม: ในช่วงทศวรรษ 1980 มีการเคลื่อนไหวเพื่อแทนที่ข้อกำหนดมาตรฐานเขตข้อมูลอิสระด้วยอีกชุดหนึ่งโดยที่ฟิลด์การกระจาย (DF) เป็นการอ้างอิง เมื่อมันปรากฏออกมามันก็เดินเข้าไปในมาตรฐาน แต่ไม่ได้แทนที่เก่า ทั้งสองยืนเคียงข้างกัน ความไม่พอใจกับการอ้างอิง FF เกิดขึ้นส่วนใหญ่มาจากขนาดสูงสุด 2 kHz มันมีหน้าที่รับผิดชอบในการเปลี่ยนสีของภาพเนื่องจากการแปลส่วนหน้าไม่สามารถทำได้แม้จะเป็นสัญญาณโมโน รูปแบบการเชื่อมโยงของ Theile (รูปที่ 14.62) การเปรียบเทียบการตอบสนองของหูสำหรับฟิลด์แบบกระจายและแบบอิสระแสดงในรูปที่ 14.77 [... ] เนื่องจากการทดสอบการฟังแบบอัตนัยเป็นสิ่งที่นับได้ หูฟัง FF ได้รับการยกเว้นมากกว่ากฎแล้ว เพดานของการตอบสนองความถี่ที่แตกต่างกันมีไว้เพื่อรองรับการตั้งค่าส่วนบุคคลและผู้ผลิตแต่ละรายมีปรัชญาหูฟังของตัวเองพร้อมการตอบสนองความถี่ตั้งแต่เขตแบนไปจนถึงพื้นที่ว่างและอื่น ๆ

ป้อนคำอธิบายรูปภาพที่นี่

ปัญหาความแตกต่าง HRTF นี้ก็เป็นสาเหตุที่ทำให้คนขับรถ (ในหูฟัง) ทำเสียงได้ดีกว่าสำหรับคนที่ บริษัท อย่าง Sennheiser ขายเช่นนี้ ไดรเวอร์ที่ทำมุมไม่ได้ทำให้เสียงของหูฟังเหมือนกับลำโพงอย่างเต็มที่

ที่โรงงานหรือในห้องปฏิบัติการจะใช้หูเทียมเมื่อวัดการตอบสนองความถี่ ด้านล่างเป็นห้องปฏิบัติการระดับหนึ่ง ระดับโรงงานง่ายขึ้นอีกเล็กน้อย

ป้อนคำอธิบายรูปภาพที่นี่

ฉันยังพบวิธีการที่ใช้โดยไซต์ HeadRoom นั้น :

วิธีที่เราทดสอบการตอบสนองความถี่: เพื่อทำการทดสอบนี้เราขับชุดหูฟังด้วยโทนเสียง 200 ชุดที่แรงดันไฟฟ้าเดียวกันและความถี่ที่เพิ่มขึ้นเรื่อย ๆ จากนั้นเราวัดเอาท์พุทที่แต่ละความถี่ผ่านหูของไมโครโฟน Head Acoustics ที่มีความเชี่ยวชาญสูง หลังจากนั้นเราใช้เส้นโค้งการแก้ไขเสียงที่ลบฟังก์ชั่นการถ่ายโอนที่เกี่ยวข้องกับหัวและผลิตข้อมูลสำหรับการแสดงผลอย่างถูกต้อง

ไมโครโฟนที่ใช้น่าจะเป็นอันนี้ ดูเหมือนว่าพวกเขาจะเปลี่ยนฟังก์ชั่นการถ่ายโอนของหัวหุ่น / หูผ่านทางซอฟต์แวร์เพราะพวกเขาพูดก่อนหน้าว่า "ในทางทฤษฎีกราฟนี้ควรเป็นเส้นแบนที่ 0dB" ... แต่ฉันไม่แน่ใจทั้งหมดว่าพวกเขาทำอะไร ... เพราะหลังจากนั้นพวกเขาพูดว่า "หูฟัง" เป็นธรรมชาติ "ควรจะสูงกว่าในเบส (ประมาณ 3 หรือ 4 เดซิเบล) ระหว่าง 40Hz และ 500Hz" และ "หูฟังจะต้องถูกม้วนในที่สูงเพื่อชดเชยไดรเวอร์ที่อยู่ใกล้กับหูมาก ๆ เส้นแบนที่ลาดเอียงเบา ๆ จาก 1kHz ถึงประมาณ 8-10dB ที่ 20kHz นั้นเหมาะสม" ซึ่งไม่ได้รวบรวมสำหรับฉันที่เกี่ยวข้องกับคำสั่งก่อนหน้าของพวกเขาเกี่ยวกับการย้อนกลับ / การลบ HRTF

ดูใบรับรองบางอย่างที่ผู้คนได้รับจากผู้ผลิต (Sennheiser) สำหรับรุ่นหูฟัง (HD800) ที่ใช้ในตัวอย่าง HeadRoom นั้นดูเหมือนว่า HeadRoom จะแสดงข้อมูลโดยไม่มีรูปแบบการแก้ไขปลอมสำหรับหูฟัง (ซึ่งจะอธิบายว่าทำไมพวกเขาถึงให้ คำแนะนำในการตีความภายหลังดังนั้นคำแนะนำ "แบน" เริ่มต้นของพวกเขาจึงเป็นคำแนะนำที่ทำให้เข้าใจผิดในขณะที่ Sennheiser ใช้การแก้ไข DF (เขตกระจาย) เพื่อให้กราฟของพวกเขาดูเกือบจะแบน

ป้อนคำอธิบายรูปภาพที่นี่

ป้อนคำอธิบายรูปภาพที่นี่

นี่เป็นเพียงการคาดเดาว่าความแตกต่างในอุปกรณ์การวัด (และ / หรือระหว่างตัวอย่างหูฟัง) สามารถอธิบายความแตกต่างเหล่านั้นได้ดีเนื่องจากไม่ใหญ่


อย่างไรก็ตามนี่เป็นส่วนหนึ่งของการวิจัยเชิงรุกและต่อเนื่อง (ดังที่คุณอาจเดาได้จากประโยคสุดท้ายที่ยกมาเกี่ยวกับ DF) มีบางอย่างที่ทำโดยนักวิจัย HK; ฉันไม่มีสิทธิ์เข้าถึงเอกสาร AES ของพวกเขา (ฟรี) แต่สามารถอ่านสรุปสรุปที่ค่อนข้างเป็นธรรมได้ในบล็อก Innerfidelity 2013 , 2014รวมถึงลิงก์ต่อไปนี้จากบล็อกหลักของผู้เขียน HK, ฌอนโอลีฟ ; เป็นทางลัดต่อไปนี้เป็นสไลด์ฟรีจากการนำเสนอล่าสุด (พ.ย. 2558) ที่พบที่นั่น นี่เป็นเนื้อหาค่อนข้างน้อย ... ฉันได้ดูเพียงสั้น ๆ แต่ชุดรูปแบบน่าจะเป็นที่ DF ไม่ดีพอ

นี่คือคู่ของภาพนิ่งที่น่าสนใจจากหนึ่งในพวกเขานำเสนอก่อนหน้านี้ ประการแรกการตอบสนองความถี่ทั้งหมด (ไม่ตัดทอนเป็น 12KHz) ของ HD800 และบนอุปกรณ์ที่เปิดเผยชัดเจนยิ่งขึ้น:

ป้อนคำอธิบายรูปภาพที่นี่

และบางทีสิ่งที่น่าสนใจที่สุดสำหรับ OP นั้นคือเสียงทุ้มของ Beats ไม่ใช่สิ่งที่น่าดึงดูดใจเมื่อเปรียบเทียบกับหูฟังที่มีราคาสูงถึงสี่ถึงหกเท่า

ป้อนคำอธิบายรูปภาพที่นี่


ฉันไม่เห็นด้วยกับหนังสือของคุณที่บอกว่า "และยังมีการบันทึก binaural ด้วยหัวหุ่นซึ่งมีแนวโน้มมากที่สุดสำหรับความเที่ยงตรงสูงจริงในชีวิตมีชะตาสำหรับการทำสำเนาหูฟังแม้ในสมัยรุ่งเรืองพวกเขาไม่พบสถานที่ในการบันทึกและ ออกอากาศ." การแข่งขันกีฬาถ่ายทอดสดทุกครั้งที่ฉันได้ใช้ไมโครโฟน "holophone" เพื่อจับภาพเสียงรอบข้างเพื่อใช้ในการผสมเสียงรอบทิศทาง www.holophone.com
Dwayne Reid

@DwayneReid: น่าสนใจ เป้าหมายสูงสุดของหูฟังที่บันทึกนั้นอยู่หรือไม่ว่าจะเป็นรอบทิศทาง 5.1 หรือ 7.1 พร้อมลำโพง นอกจากนี้ยังมีเทคโนโลยีสำหรับ downmix 5.1 / 7.1 สำหรับหูฟัง แต่ฉันไม่ได้รับสิ่งนี้
Fizz

ผลิตภัณฑ์ที่โฆษณาในหน้าหลักของพวกเขากล่าวว่า "เป็นไมโครโฟนที่ได้รับการจดสิทธิบัตรเฉพาะที่ออกแบบมาสำหรับการจับเสียงรอบทิศทาง 7.1 แชนเนล" โดยสิ้นเชิงดังนั้น "ประสบการณ์การเล่นเสียง 3 มิติที่สมจริงอย่างไม่น่าเชื่อผ่านลำโพงหรือหูฟังสเตอริโอ" จาก 7.1) สำหรับหูฟัง
Fizz

ขอบคุณคำตอบนี้ให้ข้อมูลจริงๆ ฉันกำลังสรุปว่าถูกต้องหรือไม่: การตอบสนองความถี่ของหูฟังพยายามเลียนแบบความผิดเพี้ยนที่เกิดขึ้นจากแหล่งกำเนิดเสียงด้านหน้าที่กระจายไปทั่วใบหน้าของคุณและเข้าไปในคลองหูของคุณและการตอบสนองความถี่แบนราบอย่างสมบูรณ์
Ehryk

ยังไม่ชัดเจนว่าถ้าพวกเขาใช้การแปลงผกผันเป้าหมายก็จะเป็นเส้นแบน 0dB ข้ามสเปกตรัมความถี่ทั้งหมดซึ่งในทางทฤษฎีสามารถใส่ผ่านอีควอไลเซอร์ได้ ความคิดเห็นใด ๆ เกี่ยวกับสาเหตุที่ผู้ผลิตหูฟังที่ใช้งานอยู่ไม่ได้ทำเช่นนี้เพื่อแก้ไขการบิดเบือนหลังหัวแบน 0dB หรืออาจขายแอมป์หูฟังเฉพาะกับพวกเขาที่ใช้ EQ นี้เช่น Sennheiser Orpheus แต่อาจน้อยกว่า $ 30k ? ดูเหมือนว่าพวกเขาจะเป็นหูฟังในอุดมคติแล้ว ...
Ehryk

4

คำตอบง่ายๆคือระบบตอบสนองความถี่แบนที่สร้างขึ้นด้วย op-amps เพื่อแก้ไขการตอบสนองของผู้ขับขี่จำเป็นต้องมีการตอบสนองเฟสที่ไม่แบนในแถบความถี่ ความไม่แบนนี้หมายถึงความถี่ขององค์ประกอบเสียงชั่วคราวมีความล่าช้าไม่สม่ำเสมอทำให้เกิดความผิดเพี้ยนเล็กน้อยซึ่งจะป้องกันการรับรู้องค์ประกอบของเสียงที่เหมาะสมซึ่งหมายความว่าสามารถแยกแยะเสียงที่แตกต่างกันได้น้อยลง

ดังนั้นมันฟังดูน่ากลัว ราวกับว่าเสียงทั้งหมดนั้นมาจากลูกบอลที่คลุมเครืออยู่ตรงกลางระหว่างหูของพวกเขา

ปัญหา HRTF ในคำตอบข้างต้นเป็นเพียงส่วนหนึ่งของเรื่องนี้ - อื่น ๆ คือวงจรโดเมนแบบอะนาล็อกที่คาดว่าจะสามารถมีการตอบสนองเวลาสาเหตุและการแก้ไขไดรเวอร์อย่างถูกต้องหนึ่งต้องมีตัวกรองที่เกิดขึ้นจริง

สิ่งนี้สามารถประมาณแบบดิจิทัลได้ด้วยฟิลเตอร์ Finite Impulse Response ที่จับคู่กับไดรเวอร์ แต่ต้องใช้การหน่วงเวลาเล็กน้อยซึ่งเพียงพอที่จะทำให้ภาพยนตร์มีการซิงค์ที่ไม่ตรงกัน

และดูเหมือนว่ามันจะมาจากภายในหัวของคุณเว้นแต่ว่า HRTF จะถูกเพิ่มเข้าไปด้วย

ดังนั้นมันไม่ง่ายเลย

ในการสร้างระบบ "โปร่งใส" คุณไม่ต้องการเพียงแบนด์แบนด์ในช่วงการได้ยินของมนุษย์คุณยังต้องมีเฟสเชิงเส้นด้วย - พล็อตล่าช้ากลุ่มแบน - และมีหลักฐานบางอย่างที่บอกว่าเฟสเชิงเส้นนี้ต้องการ เพื่อดำเนินต่อไปจนถึงความถี่สูงอย่างน่าประหลาดใจเพื่อไม่ให้ตัวชี้นำทิศทางหายไป

สิ่งนี้ง่ายต่อการตรวจสอบโดยการทดสอบ: เปิด. wav ของเพลงบางเพลงที่คุณคุ้นเคยในโปรแกรมแก้ไขไฟล์เสียงเช่น Audacity หรือ snd และลบ 44100 Hz ตัวอย่างเดียวจากเพียงหนึ่งช่องสัญญาณและปรับช่องอื่นเพื่อให้ช่องแรกเป็นช่องแรก ตัวอย่างเกิดขึ้นกับช่องที่แก้ไขช่องที่สองแล้วเล่น

คุณจะได้ยินความแตกต่างที่เห็นได้ชัดเจนแม้ว่าความแตกต่างจะล่าช้าเพียง 1/44100 วินาทีเท่านั้น

พิจารณาสิ่งนี้: เสียงจะอยู่ที่ประมาณ 340 มม. / ms ดังนั้นที่ 20 kHz นี่เป็นข้อผิดพลาดเวลาบวกลบหนึ่งตัวอย่างล่าช้าหรือ 50 microseconds นั่นคือการเดินทางด้วยเสียง 17 มม. แต่คุณสามารถได้ยินความแตกต่างของ 22.17 microseconds ที่หายไปซึ่งเพียง 7.7 มม. การเดินทางด้วยเสียง

โดยทั่วไปแล้วการได้ยินของมนุษย์ถูกตัดขาดโดยทั่วไปถือว่าอยู่ที่ประมาณ 20 kHz ดังนั้นจะเกิดอะไรขึ้น?

คำตอบคือการทดสอบการได้ยินจะดำเนินการด้วยเสียงทดสอบซึ่งส่วนใหญ่ประกอบด้วยความถี่เพียงครั้งละหนึ่งครั้งเป็นเวลาค่อนข้างนานในแต่ละส่วนของการทดสอบ แต่หูชั้นในของเราประกอบด้วยโครงสร้างทางกายภาพที่ทำหน้าที่ FFT แปลก ๆ บนเสียงในขณะที่เผยเซลล์ประสาทให้กับมันดังนั้นเซลล์ประสาทในตำแหน่งที่ต่างกันมีความสัมพันธ์กับความถี่ที่แตกต่างกัน

เซลล์ประสาทส่วนบุคคลสามารถทำการยิงใหม่ได้อย่างรวดเร็วดังนั้นในบางกรณีมีการใช้เพียงไม่กี่ครั้งในการติดตาม ... แต่มันใช้งานได้ถึง 4 kHz หรือประมาณนั้น ... ซึ่งเป็นสิ่งที่ถูกต้องของเรา การรับรู้ของเสียงสิ้นสุด แต่มันไม่มีอะไรในสมองที่จะหยุดเซลล์ประสาทที่ยิงได้ทุกเวลาที่รู้สึกว่าเอียงดังนั้นความถี่สูงสุดที่สำคัญคืออะไร?

ประเด็นก็คือความแตกต่างของเฟสเล็ก ๆ ระหว่างหูนั้นเป็นสิ่งที่สังเกตได้ แต่แทนที่จะเปลี่ยนวิธีที่เราระบุเสียง (ซึ่ง HRTF ก็เปลี่ยนไป!) แม้ว่าดูเหมือนว่ามันควรจะ "กลิ้งออก" จากขอบเขตการได้ยินของเรา

คำตอบก็คือจุด -3dB หรือ -10dB นั้นยังต่ำเกินไป - คุณต้องไปที่จุด -80 dB เพื่อรับมันทั้งหมด และถ้าคุณต้องการที่จะจัดการกับเสียงที่ดังเช่นเดียวกับความเงียบคุณจะต้องดีจนถึง -100 dB ซึ่งการทดสอบการฟังด้วยน้ำเสียงแบบเดี่ยวนั้นไม่น่าจะเห็นได้บ่อยนักเนื่องจากความถี่เช่นนี้จะ "นับ" เมื่อพวกเขามาถึงเฟสพร้อมกับเสียงประสานอื่น ๆ ซึ่งเป็นส่วนหนึ่งของเสียงที่คมชัดชั่วคราว - พลังงานของพวกเขาในกรณีนี้รวมเข้าด้วยกัน เพื่อกระตุ้นการตอบสนองของระบบประสาทถึงแม้ว่าในแต่ละองค์ประกอบของการแยกสัญญาณจะมีขนาดเล็กเกินกว่าจะนับได้

อีกปัญหาหนึ่งคือเราถูกทิ้งระเบิดอย่างต่อเนื่องโดยแหล่งกำเนิดของคลื่นอัลตราโซนิกหลายต่อหลายครั้งซึ่งอาจมาจากเซลล์ประสาทที่แตกหักในหูชั้นในของเราเองได้รับความเสียหายจากระดับเสียงที่มากเกินไปในบางจุดในชีวิต มันจะยากที่จะแยกแยะเสียงเอาท์พุตที่แยกได้ของการทดสอบการฟังเสียงดังในระดับ "ดัง"!

สิ่งนี้ต้องการการออกแบบระบบ "โปร่งใส" เพื่อใช้ความถี่ต่ำผ่านที่สูงกว่ามากเพื่อให้มีที่ว่างสำหรับมนุษย์ต่ำผ่านหายไป (ด้วยการปรับเฟสของตัวเองซึ่งสมองของคุณถูก "ปรับเทียบ" เป็น) ก่อนระบบ การมอดูเลตเฟสเริ่มเปลี่ยนรูปร่างของภาวะชั่วครู่และขยับพวกมันไปรอบ ๆ ในเวลาที่สมองไม่สามารถรับรู้ได้ว่าเสียงนั้นเป็นของอะไรอีกต่อไป

ด้วยหูฟังมันง่ายกว่ามากที่จะสร้างขึ้นมาให้มีไดร์เวอร์บรอดแบรนด์เดี่ยวที่มีแบนด์วิดท์เพียงพอและพึ่งพาการตอบสนองความถี่ธรรมชาติที่สูงมากของไดรเวอร์ 'ไม่ถูกแก้ไข' เพื่อป้องกันความผิดเพี้ยนทางโลก ใช้งานได้ดีกว่ากับหูฟังเนื่องจากคนขับขนาดเล็กยืมตัวเองได้ดีกับสภาพนี้

เหตุผลสำหรับความต้องการเฟสเชิงเส้นจะถูกหยั่งรากลึกในความเป็นคู่ความถี่โดเมนเวลา - โดเมนเนื่องจากเป็นเหตุผลที่คุณไม่สามารถสร้างตัวกรอง zero-delay ที่สามารถ "แก้ไขระบบร่างกายจริงใด ๆ ได้อย่างสมบูรณ์แบบ

เหตุผลก็คือ "เฟสลิเนียริตี้" ที่สำคัญและไม่ใช่ "ความเรียบของเฟส" เนื่องจากความลาดชันโดยรวมของเฟสโค้งไม่สำคัญ - โดยความเป็นคู่ความชันเฟสใด ๆ นั้นเทียบเท่ากับการหน่วงเวลาคงที่

หูชั้นนอกของทุกคนมีรูปทรงที่แตกต่างกันดังนั้นฟังก์ชั่นการถ่ายโอนที่แตกต่างกันจึงเกิดขึ้นที่ความถี่ที่ต่างกันเล็กน้อย สมองของคุณเคยชินกับสิ่งที่มันมีอยู่ หากคุณใช้สิ่งที่ผิดมันจะฟังดูแย่ลงเพราะการแก้ไขที่สมองของคุณเคยทำจะไม่สอดคล้องกับฟังก์ชั่นการถ่ายโอนของหูฟังอีกต่อไปและคุณจะมีสิ่งที่แย่กว่าการขาดการยกเลิกการสั่นพ้อง คุณจะมีเสา / ศูนย์ที่ไม่สมดุลเป็นสองเท่าเพื่อถ่วงเวลาการเลื่อนเฟสของคุณและทำให้กลุ่มของคุณล่าช้ามากและความสัมพันธ์ของส่วนประกอบมาถึงเวลา

มันจะฟังดูไม่ชัดเจนและคุณจะไม่สามารถสร้างภาพถ่ายอวกาศที่เข้ารหัสด้วยการบันทึกได้

หากคุณทำแบบทดสอบการฟังของคนตาบอดทุกคนจะเลือกหูฟังที่ไม่ได้รับการแก้ไขซึ่งอย่างน้อยก็ไม่ทำให้กลุ่มล่าช้ามากดังนั้นสมองของพวกเขาจึงสามารถปรับตัวเข้ากับมันได้

และนี่คือสาเหตุที่หูฟังที่ใช้งานอยู่ไม่พยายามทำให้เท่าเทียมกัน มันยากเกินไปที่จะทำให้ถูกต้อง

นอกจากนี้ยังเป็นสาเหตุที่การแก้ไขห้องดิจิตอลเป็นช่อง: เพราะการใช้อย่างถูกต้องต้องมีการวัดบ่อยครั้งซึ่งเป็นเรื่องยาก / เป็นไปไม่ได้ที่จะแสดงสดและผู้บริโภคทั่วไปไม่ต้องการที่จะรู้

ส่วนใหญ่เป็นเพราะเสียงสะท้อนในห้องภายใต้การแก้ไขซึ่งส่วนใหญ่ของการตอบสนองเสียงเบสให้ขยับเล็กน้อยเป็นความดันอากาศอุณหภูมิและความชื้นเปลี่ยนแปลงทั้งหมดจึงเปลี่ยนความเร็วของเสียงเล็กน้อยจึงเปลี่ยนเสียงสะท้อนจากสิ่งที่พวกเขา เมื่อถูกวัด


การกรองใน Fomian ทำให้เกิดการผิดเพี้ยนของเฟสการปรับอีควอไลเซอร์เฟสทั้งหมดสามารถใช้เพื่อชดเชยสิ่งนี้ในทฤษฎีดิจิตอลหรืออะนาล็อกสามารถมีเฟสที่ดีได้
ออทิสติก

อ้าขอบคุณ สิ่งนี้ทำให้ชัดเจนว่าทำไมมันไม่ทำในหูฟังที่ใช้งานอยู่ซึ่งผ่านสัญญาณอะนาล็อก (หูฟังแบบมีสาย) สิ่งนี้ดูเหมือนจะเปิดโอกาสให้ปรับระดับแบบเรียลไทม์โดยไม่ผิดเพี้ยนเฟสทั้งแบบดิจิทัลบนแหล่งสัญญาณ (เช่นคอมพิวเตอร์หรือโทรศัพท์) หรือแบบดิจิทัลบนหูฟังไร้สายโดยไม่ล่าช้า จะยังคงเปิดเป็นความเป็นไปได้สำหรับการตอบสนอง 'สมบูรณ์แบบ' (โพสต์ HRTF)?
Ehryk

ไม่ต้องมีความล่าช้าบ้าง มิฉะนั้นคุณต้องใช้ไทม์แมชชีนเนื่องจากวิธีการเดียวที่จะแก้ไขเฟสของระบบจริง (สาเหตุ) โดยไม่เพิ่มความล่าช้าใด ๆ ก็คือการใช้ตัวกรองที่ตอบสนองเวลาย้อนกลับได้อย่างแม่นยำ และนี่หมายความว่าจำเป็นต้องรู้ "อนาคต" ของสัญญาณก่อนที่จะตกลงไปในเวลา = 0
RGD2

-1

บทความและการสนทนาที่น่าสนใจ เรามักจะคิดว่าทฤษฎีบท Nyquist เป็นกฎที่ใช้กับทุกที่และจากนั้นเราจะพบว่ามันไม่ คุณวัดขีด จำกัด ของการได้ยินของมนุษย์ถึง 20kHz โดยใช้คลื่นไซน์จากนั้นสุ่มตัวอย่างที่ 44.1 หรือ 48 kHz ด้วยความมั่นใจว่าคุณได้บันทึกทุกสิ่งที่หูได้ยิน แต่การเปลี่ยนหนึ่งช่องโดยตัวอย่างหนึ่งทำให้เกิดการเปลี่ยนแปลงอย่างมีนัยสำคัญแม้ว่าความแตกต่างชั่วคราวจะสูงกว่า 20kHz

ในภาพเคลื่อนไหวเราคิดว่าดวงตาผสานภาพด้วยอัตราเฟรมที่สูงกว่า 20 เฟรมต่อวินาที ดังนั้นฟิล์มถูกถ่ายที่ 24fps และเล่นด้วยชัตเตอร์ 2x เพื่อลดการสั่นไหว (48fps); อัตราเฟรมทีวี 50 หรือ 60 Hz ขึ้นอยู่กับภูมิภาค เราบางคนเห็นการสั่นไหวของเฟรม 50 Hz โดยเฉพาะถ้าเราโตขึ้นด้วย 60 Hz แต่นี่คือสิ่งที่มันน่าสนใจ ที่ Hollywood Professional Association Tech Retreat และการประชุม SMPTE ในช่วงไม่กี่ปีที่ผ่านมาแสดงให้เห็นว่าผู้ชมโดยเฉลี่ยเห็นว่าการปรับปรุงคุณภาพอย่างมีนัยสำคัญเมื่อเฟรมดั้งเดิมถูกขยายจาก 60 Hz เป็น 120 Hz ที่น่าแปลกใจยิ่งกว่าเดิมคือผู้ชมเดิมเห็นการปรับปรุงที่คล้ายกันเมื่อเพิ่มอัตราเฟรมจาก 120 เป็น 240 Hz Nyquist จะบอกเราว่าถ้าเราไม่เห็นอัตราเฟรมที่ 24 เราต้องการเพียงแค่เพิ่มอัตราเฟรมเป็นสองเท่าเพื่อรับประกันการจับภาพทุกอย่างที่ตาสามารถแก้ไขได้ แต่ที่นี่เราอยู่ที่อัตราเฟรม 10 เท่าและยังคงสังเกตเห็นความแตกต่างที่เห็นได้ชัดเจน

เห็นได้ชัดว่ามีอะไรเกิดขึ้นที่นี่อีก ในกรณีของการถ่ายภาพเคลื่อนไหวการเคลื่อนไหวในภาพมีผลต่ออัตราเฟรมที่ต้องการ และในเสียงฉันคาดหวังว่าความซับซ้อนและความหนาแน่นของเสียงจะกำหนดความละเอียดของเสียงที่ต้องการ เสียงทั้งหมดนั้นขึ้นอยู่กับความต่อเนื่องของเฟสมากกว่าการตอบสนองความถี่เพื่อให้เสียงที่เปล่งออกมาจำเป็นสำหรับการถ่ายภาพ


ฉันไม่พบสิ่งใดที่นี่เพื่อตอบคำถาม อัตราตัวอย่างและทฤษฎีการสุ่มตัวอย่าง Nyquist เกี่ยวข้องกับการทำให้เท่าเทียมกันของหูฟังอย่างไร
ท่อ

ไม่มี ADC ในมนุษย์ การได้ยินของมนุษย์ \ วิสัยทัศน์ไม่ได้ "ตัวอย่าง" อะไรเลยมันใช้เซลล์ประสาทซึ่งเป็นการผสมผสานระหว่างอะนาล็อกและดิจิตอลและยังคงต่อเนื่อง หูมีการตัดทางกายภาพ การรับรู้ด้วยสายตายัง จำกัด ด้วยความเร็วที่สมองสามารถประมวลผลข้อมูลได้
สไปค์แรงดันไฟฟ้า
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.