เสียงล่าช้าสูงสุดก่อนที่ผู้เล่นจะสังเกตเห็น?


38

เมื่อมีเหตุการณ์ในเกมความล่าช้าสูงสุดในการสร้างเสียงที่ผู้เล่นจะต้องเชื่อมโยงเสียงกับเหตุการณ์นั้นคืออะไร (และไม่เข้าใจความล่าช้า)


ไม่มาก. ฉันเดาว่ามันต้องน้อยกว่า 1/10 ของวินาที แม้ว่าโดยส่วนตัวแล้วฉันอาจสังเกตเห็นว่ามันมีมากกว่าสองสามเฟรมที่ 60 FPS
Almo

อย่าลืมว่าในกรณีส่วนใหญ่เอาต์พุตที่แสดงผลจะมีความล่าช้าบ้างซึ่งบางส่วนจะมาจากจอภาพ อาจใช้เวลามากกว่า 100 ms สำหรับผลลัพธ์ของอินพุตของผู้เล่นที่จะแสดงบนหน้าจอ ดูanandtech.com/show/2803
Adam

1
ประมาณ 20 มิลลิวินาทีเมื่อเล่นเครื่องดนตรีประมาณ 80 มิลลิวินาทีเมื่อคุณเป็นผู้ฟัง นี่เป็นเพียงประสบการณ์ส่วนตัวของฉันระยะทางของคุณอาจแตกต่างกันไป
rwols

มากกว่าเวลาใด ๆ ที่คุณต้องการความมั่นคง ตราบใดที่ทุกอย่างมีความล่าช้าเท่ากันคุณก็สามารถอยู่ในเหตุผลได้ หากทุกอย่างช้าไป 100ms คุณอาจจะไม่สังเกตเห็นมันจริงๆ แต่ถ้าเสียงบางเสียงใกล้เข้ามาทันทีและเสียงอื่น ๆ ที่เหลืออยู่นั้นอยู่ในระหว่างนั้นคุณจะสังเกตเห็นได้
0xFADE

หากคุณสนใจพฤติกรรมที่เป็นจริงคุณอาจพิจารณาถึงความล่าช้าของเหตุการณ์ที่อยู่ห่างไกลจากผู้ฟังว่าเป็นสิ่งที่ดี
Darkwings

คำตอบ:


48

ผลดังต่อไปนี้จะถูกคำนวณสำหรับการประสานริมฝีปากซึ่งเป็น concidered จะเป็น"ส่วนใหญ่ที่เห็นได้ชัด A / V ข้อผิดพลาดการซิงค์"


Wikipediaพูดว่า

สำหรับแอปพลิเคชั่นโทรทัศน์เสียงควรนำไปสู่วิดีโอไม่เกิน 15 มิลลิวินาทีและเสียงควรล่าช้าวิดีโอไม่เกิน 45 มิลลิวินาที สำหรับภาพยนตร์ลิปซิงค์ที่ยอมรับได้นั้นจะต้องไม่เกิน 22 มิลลิวินาทีในทิศทางใดทิศทางหนึ่ง


ห้องปฏิบัติการสื่อและอะคูสติกรับรู้พูดว่า

ผลการทดลองพบว่าเกณฑ์เสียงนำเฉลี่ยสำหรับการตรวจจับการซิงค์ a / v คือ 185.19 ms โดยมีค่าเบี่ยงเบนมาตรฐานเท่ากับ 42.32 ms


ATSCพูดว่า

เมื่อดูอย่างรวดเร็วดูเหมือนว่าหลวม: +90 ms ถึง -185 ms ในฐานะ“ Window of Acceptability”

และ

  • ตรวจจับไม่ได้ตั้งแต่ -100 ms ถึง +25 ms
  • ตรวจพบได้ที่ -125 ms & +45 ms
  • ไม่สามารถยอมรับได้ที่ -185 ms & +90 ms

(- เสียงล่าช้า + เสียงขั้นสูง)


สรุป

ผลลัพธ์ไม่ได้อยู่ไกลกัน ดูเหมือนว่าการหน่วงเวลาที่ยอมรับได้สูงสุดอยู่ที่ประมาณ 150ms ซึ่งก็คือ 9 เฟรมที่ 60 เฟรมต่อวินาที


3
"หากคุณมีความล่าช้าควรเป็นวิดีโอที่ล่าช้า" ดูเหมือนว่าควรกลับรายการบทความ ATSC ระบุไว้อย่างชัดเจนว่าผู้คนคาดหวัง / ทนเสียงที่เกิดขึ้นเล็กน้อยหลังจากที่เห็น (เนื่องจากในชีวิตจริงเสียงล่าช้าโดยประมาณ 1 ms ต่อฟุต) แต่ไม่เชื่อมโยงเหตุการณ์อย่างเหมาะสม ถ้าเหตุการณ์วิดีโอเกิดขึ้นหลังจากเสียง
Peteris

คุณพูดถูกฉันเข้าใจผิดโดยสิ้นเชิง ขอขอบคุณ. (ฉันแก้ไข)
Heckel

1
ฉันสามารถบอกคุณได้จากประสบการณ์ส่วนตัวว่าสิ่งนี้อาจแตกต่างกันระหว่างหูในบุคคลเดียวกัน ฉันมีภาวะขนถ่ายที่หายากซึ่งจริง ๆ แล้วทำให้สมองของฉันประมวลผลการกระตุ้นการได้ยินในหูซ้ายของฉันล่าช้าออกไปอย่างเห็นได้ชัดเมื่อเทียบกับหูขวา ในวันที่ไม่ดีสิ่งนี้จะทำให้เกิดอาการวิงเวียนศีรษะ แต่ส่วนใหญ่จะสามารถทนได้ ใช่แล้วนี่เป็นเรื่องส่วนตัวอย่างยิ่ง
Andon M. Coleman

คุณจะได้รับ 150ms ที่ไหน แหล่งที่มาของคุณอย่างชัดเจนเฉลี่ยประมาณ 45ms
Miles Rout

Wikipedia กล่าวว่า 45ms แต่ไม่จำเป็นต้องเป็นแหล่งที่เชื่อถือได้มากที่สุด แหล่งข้อมูลที่สองบอกว่า 185.19 มิลลิวินาทีและ 125 มิลลิวินาทีที่สามจนกว่าจะสังเกตเห็นได้ คุณสามารถอ้างอิงแหล่งข้อมูลเพื่อช่วยให้ฉันเข้าใจว่าฉันผิดตรงไหนได้บ้าง
Heckel

9

มันขึ้นอยู่กับเหตุการณ์

รู้สึกว่าการระเบิดที่คุณเห็นและได้ยินเป็นเหตุการณ์เดียวที่จะมีความคลาดเคลื่อนที่อธิบายไว้ในคำตอบอื่น ๆ - ไม่เกิน ~ 50ms; บางคนอาจมีความละเอียดอ่อนมากขึ้น (เช่นนักดนตรี) ดังนั้นฉันขอแนะนำให้ตั้งเป้าหมายที่ 30ms หรือไม่เกิน 2 เฟรมที่ 60fps

ฉันเชื่อว่าระยะทางที่รับรู้ควรมีผลต่อความคลาดเคลื่อนเหล่านั้น ผู้คนคาดหวังว่าเสียงจากระยะไกลจะล่าช้าเล็กน้อยเนื่องจากในชีวิตจริงเสียงจะมองเห็นได้ไกลประมาณ 1ms ต่อฟุตแต่ละระยะ ดังนั้นการระเบิดของแผนที่ RTS ของเกม RTS ที่ถูกย่ออาจมีความทนทานต่อเสียงที่ช้ากว่าผู้เล่นที่ยิงปืนของตัวเองใน FPS

กรณีพิเศษเช่นการมีความรู้สึกที่เหมาะสมสำหรับเกมดนตรี / จังหวะอาจต้องใช้ความคลาดเคลื่อนที่เข้มงวดมากขึ้น 15-20ms หรือต่ำกว่า - ตัวอย่างเช่นหากผู้เล่นได้ยินทั้ง "อินพุตแอ็คชั่น" เช่นการร้องเพลงในไมค์หรือการต่อสู้ เครื่องดนตรีพลาสติกและเสียงที่สร้างโดยระบบของคุณสำหรับเหตุการณ์เดียวกันความล่าช้า 50ms จะทำให้เสียง "ต้นฉบับ" และ "เล่น" ผสมกันอย่างน่าประหลาด

นอกจากนี้โปรดจำไว้ว่าความล่าช้าระหว่างการเริ่มต้นไฟล์เสียงและ "เหตุการณ์" ในไฟล์เสียงนั้น - ในคลิปเสียงหลายรายการ "เหตุการณ์" จะไม่อยู่บนขอบคุณอาจมีเสียงฟ้าผ่า การนัดหยุดงานที่ 'ตี' ที่เกิดขึ้นหลังจากการเริ่มต้น 200ms ซึ่งจะเห็นได้ชัดให้กับทุกคนและสวยมากไฟล์เสียงทั้งหมดแม้กลองตีจะมีบางอย่างล่าช้ามี

อย่าวัดค่าเฉลี่ย - ดูกรณีที่เลวร้ายที่สุด

การมองเห็นและการได้ยินนั้นเชื่อมโยงกันอย่างลึกซึ้งในการรับรู้ของมนุษย์และหากหนึ่งในนั้น stutters ค่อนข้างที่จะอื่น ๆ ก็จะสามารถรับรู้ ไม่เป็นไรถ้าเวลาส่วนใหญ่จะเร็วมาก แต่บางครั้งก็มีการหน่วงเวลา 0.2 วินาทีในขณะที่บางสิ่งกำลังโหลด - ผู้คนจะสังเกตเห็นสถานการณ์ดังกล่าว นี่คือเหตุผลที่เสียงมักจะถูกเรียกใช้บนเธรดแยกต่างหากแยกต่างหากจากกิจกรรมอื่น ๆ และเพิ่งได้รับการแจ้งเตือนอย่างรวดเร็วว่าควรเล่นคลิปใดที่โหลดไว้ล่วงหน้า


5

สถานการณ์ใด ๆ ที่ผู้เล่นทำให้เกิดเสียง (เพลงเกมปืนใน FPS) จะต้องมีความล่าช้าน้อยมากเนื่องจากผู้เล่นได้ส่งแรงกระตุ้นเพื่อให้มันเกิดขึ้นในช่วงเวลานั้นเช่นเดียวกับนักดนตรีที่ได้ยินเครื่องมือของพวกเขาล่าช้า ของความล่าช้าน้อยมาก วิศวกรเสียงกังวลเกี่ยวกับความล่าช้าในการบันทึกที่ต่ำกว่า 5 m วินาทีทำลาย "ร่อง"

วารสารของ American Academy of Audiology ระบุว่าผู้คน (ไม่ใช่แค่นักดนตรี) เมื่อฟังเสียงของตัวเองล่าช้าจะรับรู้ถึงความล่าช้าสั้น ๆ เป็น 3 mSec และการล่าช้าเกิน 10 mSec นั้นเป็นที่น่ารังเกียจ 90% ของเวลา

มนุษย์ใช้การหน่วงเวลาระหว่างหูของพวกเขาสำหรับข้อมูลทิศทางและดังนั้นจะต้องสามารถประมวลผลและดึงข้อมูลจากความล่าช้าต่ำกว่า 1mSec

185.19 ms ที่ยกมาข้างต้นนั้นไม่เกี่ยวข้องเนื่องจากอ้างถึงข้อผิดพลาดของเสียงชั้นนำและสิ่งที่ผู้คนพบว่ายอมรับได้เมื่อดูภาพยนตร์อย่างอดทนไม่ได้มีส่วนร่วมในเกม


4

คำตอบที่ได้รับการยอมรับที่นี่ส่วนใหญ่กล่าวถึงการรับรู้ของการประสานเสียงในการรับชมวิดีโออย่างอดทน ในกรณีเหล่านี้ผู้ชมจะไม่สามารถตรึงลงได้อย่างง่ายดายเมื่อเสียงควรเล่นยกเว้นการเข้าร่วมเพื่อบอกสัญญาณในวิดีโอ ซึ่งหมายความว่าพวกเขามีความคาดหวังที่ จำกัด ของเสียง

มีสองกรณีที่สำคัญในเกมที่ไม่มีการคาดหมายต่ำนี้:

  1. เมื่อผู้เล่นเองทำให้เกิดเสียง (ตามที่ SamB ชี้) ดังนั้นจากช่วงเวลาที่พวกเขาตั้งใจจะกดปุ่มที่พวกเขารู้ว่าเมื่อพวกเขาคาดหวังว่าจะได้ยินเสียง

  2. เมื่อเสียงที่ควรจะขึ้นอยู่กับจังหวะเป็นจังหวะเช่นเดียวกับในเกมเพลงหรืออะไรก็ตามที่มีการจับเวลา / เคาน์เตอร์ฟ้องจังหวะนี้ช่วยให้ผู้เล่นที่คาดการณ์เสียงถัดไปและสังเกตเห็นถ้าเล่นนอกเวลา

ในการพูดคุยนี้จาก GDC 2013, Mathieu Pavageau ให้เหตุผลว่าผู้เล่นสามารถรับรู้ความแตกต่างของความแม่นยำในการซิงค์สูงกว่า 5msซึ่งน้อยกว่าตัวอย่างจากการซิงก์ริมฝีปาก ลองดูหัวข้อ "ตัวอย่างของการรับรู้เวลา" และ "ตัวอย่างของเกม Ubisoft" เพื่อรับฟังด้วยตัวคุณเอง คุณสามารถได้ยินเมนู Rayman Origins ไม่ได้ "laggy" ต่อ se เมื่อซิงค์ภายใน 16 ms (เฟรมวิดีโอ) แต่เมื่อ synched ภายใน 5 ms มันฟังดูดีขึ้น & แน่นขึ้น

Pavageau สนับสนุนการใช้การโทรกลับด้วยเสียงระดับต่ำเพื่อรับความแม่นยำของเฟรมย่อยแบบนี้หากคุณต้องการเพลย์ลีลาจังหวะที่หลากหลาย


2

สำหรับเกมที่ต้องใช้บุคคลในการตอบสนองต่อสัญญาณเสียงทุกมิลลิวินาทีโดยที่เสียงล่าช้าจะทำให้การตอบสนองของบุคคลนั้นล่าช้าเช่นกัน คนที่เป็นเพียงการดูหนังหรือตัดฉากไม่อาจสังเกตเห็นมากเกินไปถ้าเสียงและวิดีโอจะไม่ตรงกับในซิงค์ แต่ก็มักจะมีความสำคัญและบางครั้งสำคัญที่ยิ่งเสียงในซิงค์กับสิ่งที่ผู้เล่นที่คาดว่าจะทำ


-1

ในทางทฤษฎีทุกอย่างที่สูงกว่า 50ms สามารถสังเกตได้เมื่อมันมาพร้อมกับความสัมพันธ์กับรูปภาพที่ 25ms คุณสามารถเริ่มได้ยินเสียงและความล่าช้าของมันเป็นเสียงที่แยกกันสองเสียงดังนั้นฉันจะบอกว่าฉันขอแนะนำให้คุณอยู่ต่ำกว่า 50 มิลลิวินาที สามารถอยู่ที่บางสิ่งบางอย่างตั้งแต่ 5ms ถึง 15ms มันจะดีจริงๆ

ฉันหวังว่านี่จะช่วยคุณได้!

https://en.wikipedia.org/wiki/Delayed_Auditory_Feedback


คำตอบนี้ไม่ได้เพิ่มคำแนะนำใหม่ใด ๆ ที่ไม่ได้มีอยู่ในคำตอบที่มีอยู่ดังนั้นจึงมีความเสี่ยงที่จะถูกปิดเพราะเป็นเพียงปลั๊กหรือโฆษณาสำหรับข้อมูลติดต่อ บริษัท ของคุณ StackExchange ไม่ได้มีไว้สำหรับการส่งเสริมการบริการดังนั้นฉันขอแนะนำให้ลบส่วนนั้นออก (ผู้ใช้ยังสามารถค้นหาชื่อผู้ใช้ของคุณ) และเพิ่มรายละเอียดเพิ่มเติมเกี่ยวกับสาเหตุที่คุณต้องการแนะนำการกำหนดเวลาที่เฉพาะเจาะจง
DMGregory

ไม่มีคำตอบที่เราเห็นว่าถูกต้องสำหรับเราเราเป็นทีมวิศวกรเสียงและอะคูสติกเป็นสิ่งแรกที่เราเรียนรู้ คำตอบบางคำพูดมากกว่า 100ms คำตอบที่บอกว่า -100s & + 85s นั้นเป็นคำตอบอย่างไร -50ms หรือ + 50ms ยังคงความแตกต่าง 50ms ระหว่างแอคชั่นและเสียง เราแค่พยายามช่วยหากการให้อีเมลของเราเป็นสิ่งที่ไม่เหมาะสมเราจะลบออก
X-Raysounds

ตัวอย่างเช่นดูคำตอบของ Peteris เมื่อ 3 ปีก่อนซึ่งให้ค่าสูงสุดแน่นอน 50 ms และแนะนำให้ต่ำกว่าที่คำตอบนี้ทำหรืออ้างอิงจากการพูดคุยกับ Mathieu Pavageau แนะนำ 5ms เป็นเป้าหมายในอุดมคติ ที่ดูเหมือนจะครอบคลุมขอบเขตของสิ่งที่มีอยู่ในคำตอบนี้เว้นแต่คุณต้องการขยายคำแนะนำหรือไม่ ตัวอย่างเช่นหากมีรายละเอียดจากลิงค์ Wikipedia ที่คุณรู้สึกว่าเกี่ยวข้องเป็นแนวทางปฏิบัติที่ดีที่อย่างน้อยสรุปให้พวกเขาในข้อความของคำตอบ (ในกรณีที่หน้าเชื่อมโยงมีการเปลี่ยนแปลงในอนาคต)
DMGregory

อาขอโทษด้วยที่เราไม่ได้อ่านคำตอบทั้งหมดที่เราแค่ข้ามไปไม่กี่คำแล้วเราพูดในสิ่งที่เรารู้และบังคับใช้ด้วยลิงค์วิกิพีเดียเรายังเป็นมือใหม่ในฟอรัมเราพยายามให้ความช่วยเหลือเกี่ยวกับเสียง ปัญหาที่เกี่ยวข้อง แต่เราพบไม่มากฮ่าฮ่า
X-Raysounds

ไม่ต้องห่วง. การฝึกผู้ใช้ใหม่เป็นหนึ่งในเหตุผลที่ความคิดเห็นเหล่านี้มีอยู่ :) คุณจะได้รับคำตอบที่รวดเร็วของ StackExchange นั่นหมายถึงการคิดถึงพวกเขาว่าเป็นแหล่งข้อมูลอ้างอิงในระยะยาวแทนที่จะตอบกลับฟอรัม
DMGregory
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.