จุดประสงค์ของการแก้ไขแกมม่าในหน้าจอของวันนี้คืออะไรและเกี่ยวข้องกับกราฟิกและการถ่ายภาพอย่างไร?


15

ฉันสับสนกับวัตถุประสงค์ของการแก้ไขแกมม่าและความสัมพันธ์ระหว่างรูปภาพแกมม่าที่ถูกแก้ไขและไม่ถูกแก้ไขในแง่ของกราฟิกและการถ่ายภาพรวมถึงการจัดการสีโดยทั่วไป (การแปลงจาก RGB เชิงเส้นเป็นพื้นที่ RGB ที่แก้ไขแกมม่าแล้วแสดงบน หน้าจอ)

จากหลายแหล่งส่วนใหญ่ส่วนใหญ่http://www.guillermoluijk.com/article/gamma/index.htmและคำถาม# 23026151 ที่ StackOverflow (ฉันจำเป็นต้องแกมม่าแก้ไขผลลัพธ์สีสุดท้ายบนคอมพิวเตอร์ / จอภาพที่ทันสมัยหรือไม่?)ฉัน ' เราได้ข้อสรุปว่า:

เดิมการแก้ไขแกมมาถูกออกแบบมาเพื่อชดเชยการตอบสนองที่ไม่ใช่เชิงเส้นของจอภาพ CRT กับสัญญาณอินพุต CRT ไม่สามารถขยายสัญญาณอินพุตได้ด้วยตนเองดังนั้นจึงต้องปรับสัญญาณเอาท์พุตจากพีซีทำให้เกิดแกมมา 2.2 มาตรฐานและการแก้ไขพื้นที่สี sRGB

หน้าจอที่ทันสมัยแต่ไม่ต้องทนทุกข์ทรมานกับการสูญเสียสัญญาณเช่นเดียวกับ CRT พวกเขาอาจแสดงบางอย่างที่ไม่ใช่เชิงเส้น แต่เนื่องจากสัญญาณอินพุตมักจะดำเนินการโดยเพียง 8 บิตต่อช่องสัญญาณ (256 เฉดสี) พวกเขาควรจะสามารถชดเชยการที่ไม่เป็นเส้นตรงบางอย่างในการทำสีของพวกเขาเอง ของการทำซ้ำมากกว่า 256 เฉดสีในหนึ่งช่อง นี่หมายความว่าการแก้ไขแกมม่าพร้อมกับ sRGB และพื้นที่สีที่แก้ไขด้วยแกมม่าทั้งหมดเป็นเพียงมรดกจากยุค CRT และจุดประสงค์เดียวของมันก็คือการแสดงสัญญาณอินพุตแบบเชิงเส้น

นอกจากนี้ยังมีบทความที่อ้างว่าการแก้ไขแกมม่าอยู่ที่นี่เพื่อชดเชยการไม่เป็นเส้นตรงของการมองเห็นของมนุษย์(CambridgeInColour.com - การทำความเข้าใจกับการแก้ไขแกมม่า) ซึ่งควรสอดคล้องกับเส้นโค้งแกมม่าเนื่องจากเราสามารถสังเกตเห็นความแตกต่างเล็ก ๆ ในเฉดสีเข้ม แต่ไม่ทำได้ดีกับความสว่าง (ความสว่างของจุดต้องเพิ่มขึ้นอย่างทวีคูณเพื่อ ปรากฏสว่างขึ้น) นี่ไม่ใช่วิธีที่เซ็นเซอร์กล้องบันทึกฉาก ข้อมูลดิบจากเซ็นเซอร์ได้รับในแบบ RGB เชิงเส้นและพัฒนาเป็นพื้นที่สี RGB ที่แก้ไขโดยแกมมา (เงาที่ยกขึ้นและแสงมืดลง) การแก้ไขแกมมานั้นมีขึ้นเพื่อชดเชยการสูญเสียสัญญาณขาออกดังนั้นสิ่งที่ฉันเชื่อว่าหน้าจอที่ทันสมัยทำคือพวกเขาเพียงจำลองพฤติกรรมของ CRTs เพื่อยกเลิกการแก้ไขแกมม่าออกมาและแสดงฉากเหมือนที่กล้องจับไว้ แรเงา 1: 1 ถึงหน้าจอ ดี,

หมายความว่าทุกเฉดสีในพื้นที่สี RGB ควรมีค่า RGB เท่ากันทุกพื้นที่ RGB อื่นรวมถึง RGB เชิงเส้น (เช่น # 010A1F ใน sRGB แปลตรงกับ # 010A1F ในเชิงเส้น RGB ในแง่ของการจัดเก็บในไฟล์บิตแมปด้วย 8bpc) และมันก็ขึ้นอยู่กับหน้าจอและอะแดปเตอร์กราฟิกว่าพวกเขาจัดการการถ่ายโอนสีและไม่ว่าทั้งสองฝ่ายจะต้องดำเนินการ recomputations เพิ่มเติมใด ๆ เพื่อแปลงภาพเป็นพื้นที่สีปลายทาง? กล่าวอีกนัยหนึ่งการเปลี่ยนพื้นที่สีในโปรแกรมแก้ไขกราฟิกไม่มีส่วนเกี่ยวข้องกับค่า RGB เอง รับทราบเฉพาะพื้นที่สีใหม่ในข้อมูลเมตาของภาพหรือไม่ ฉันเชื่อว่านี่ไม่ใช่กรณีเพราะการจัดการสีจะทำให้ไร้ประโยชน์เมื่อใช้กราฟิกอะแดปเตอร์ดิจิตอล / อินเตอร์เฟสของหน้าจอ - กราฟิกการ์ดสามารถส่งข้อมูล RGB ธรรมดาโดยไม่คำนึงถึงพื้นที่สีที่ใช้เป็นเกนแบบอะนาล็อก (แกมม่า) นำไปใช้กับค่าที่ไปในระดับเชิงเส้นจาก 0 ถึง 255 นอกจากนี้ขอบเขตของโปรไฟล์สีที่แตกต่างกันจะเหมือนกันหากไม่มีข้อผิดพลาดในการปัดเศษแนะนำหรือ?

ความสับสนเล็กน้อยสุดท้ายของฉันอาจมาจากความเข้าใจผิดของการแปลงโปรไฟล์สีและตารางระดับการรับแสง (อันแรก) ในบทความhttp://www.guillermoluijk.com/article/superhdr/index.htm (สามารถแปลได้โดยใช้ Google Translate) ฉันเข้าใจอย่างถูกต้องหรือไม่ว่าค่าเชิงเส้นถูกแปลงโดยใช้ฟังก์ชันเลขชี้กำลัง (หรือแกมมาผกผัน) ลดขนาดของโทนเสียงไปทางเงาและทำให้ภาพมืดลงหรือไม่ เกิดอะไรขึ้นถ้าเราบันทึก RGB เชิงเส้นและนำเสนอเป็นรูปภาพที่แก้ไขแกมม่าไปที่หน้าจอคอมพิวเตอร์หรือไม่

ฉันขอโทษที่ถามคำถามที่ซับซ้อนเช่นนี้ แต่มันพิสูจน์ได้ยากมากที่จะหาแหล่งข้อมูลที่ดีจริง ๆ ที่อธิบายถึงความไม่แน่นอนทั้งหมดที่เกิดขึ้น ขอบคุณล่วงหน้าสำหรับคำตอบใด ๆ ที่อาจช่วยแก้ไขความเข้าใจผิดของฉัน


4
คุณอาจต้องการลองย่อคำถามนี้ แม้ว่ามันจะเป็นไปได้ที่จะตอบจากชื่อเรื่องเพียงอย่างเดียว แต่ฉันคิดว่าการแก้ไขมันจะเป็นวิธีที่ดีในการช่วยให้คุณเข้าใจหัวข้อด้วยตนเอง
JenSCDC

1
ฉันเริ่มทำงานกับคำตอบไม่น้อยเพราะฉันรู้ว่าฉันลืมไปมากและการตอบคำถามของใครบางคนเป็นวิธีที่ดีในการเรียนรู้ใหม่
JenSCDC

เหตุผลหลักคือเพียงย้อนกลับเข้ากันได้ คุณต้องการใช้คอมพิวเตอร์เครื่องเดียวกันและซอฟต์แวร์เดียวกันกับจอภาพ CRT เก่าและจอภาพ LCD ที่ทันสมัย ซอฟแวร์ยังคงทำสิ่งเดียวกันกับที่เคยทำในสมัยก่อนมันสร้างภาพในพื้นที่สี sRGB แน่นอนว่านี่รวมถึงการแก้ไขแกมม่าตามปกติ จากนั้นจอภาพ CRT แบบเก่าจะใช้ภาพตามที่เป็นอยู่ในขณะที่จอแสดงผลที่ทันสมัยจะ "ยกเลิก" การแปลงจากพื้นที่สีเชิงเส้นเป็นพื้นที่สี sRGB
Jukka Suomela

และมันเกี่ยวข้องกับการถ่ายภาพอย่างไร: ด้วยเครื่องมือที่เหมาะสม การแก้ไขแกมม่า (และการแปลงโดยทั่วไประหว่างพื้นที่สีต่างๆ) จะเกิดขึ้นโดยอัตโนมัติ ผู้ใช้ปกติไม่ควรมองเห็นเลย เป็นเพียงเทคนิคที่โปรแกรมเมอร์คอมพิวเตอร์จะต้องระวัง แต่ผู้ใช้ไม่จำเป็นต้องรู้เกี่ยวกับมันเลย (ยกเว้นแน่นอนคุณต้องการป้อนค่าสีฐานสิบหกอย่างชัดเจนในปริภูมิสี sRGB ซึ่งในกรณีนี้คุณน่าจะรู้ว่าคุณกำลังทำอะไรอยู่)
Jukka Suomela

คำตอบ:


10

จากCharles Poynton "การฟื้นฟูสมรรถภาพของแกมม่า" :

ความเข้าใจผิด:ความไม่เชิงเส้นของจอภาพ CRT เป็นข้อบกพร่องที่จำเป็นต้องได้รับการแก้ไข

ความจริง:ความไม่เชิงเส้นของ CRT นั้นเกือบจะตรงกันข้ามกับความไวต่อแสงของการมองเห็นของมนุษย์ ความไม่เป็นเชิงเส้นทำให้การตอบสนองของ CRT มีความสม่ำเสมอโดยปริยาย คุณสมบัตินี้ยังเป็นที่ต้องการอย่างมาก

ความเข้าใจผิด:วัตถุประสงค์หลักของการแก้ไขแกมม่าคือการชดเชยความไม่เชิงเส้นของ CRT

ความจริง:วัตถุประสงค์หลักของการแก้ไขแกมม่าในวิดีโอ, เดสก์ท็อปกราฟิก, เตรียมพิมพ์, JPEG และ MPEG คือการใช้รหัสความสว่างหรือค่า tristimulus (สัดส่วนกับความเข้ม) ในโดเมนที่มีการรับรู้เหมือนกันเพื่อเพิ่มประสิทธิภาพการรับรู้ ในแต่ละองค์ประกอบ RGB (หรือ CMYK)

บทความที่เหลือก็ให้ความกระจ่างมากเช่นกัน :)


ฉากในธรรมชาติเป็นแบบแกมม่าเชิงเส้นและควรแสดงบนหน้าจอหรือบนกระดาษในลักษณะเดียวกันโดยมีแกมม่าเพิ่มขึ้นเล็กน้อยเพื่อชดเชยแสงแฟลร์ - โดยปกติคือแกมม่า 1.1 หรือ 1.2
Iliah Borg

1
วิทยานิพนธ์ปริญญาเอกดร. Poynton เป็นออนไลน์ขณะนี้: poynton.ca/PDFs/Poynton-2018-PhD.pdf บทที่ 3 และ 4 จัดการกับเส้นโค้งคลาสสิกบทที่ 8 แนะนำ "Barten Lightness" OETF ซึ่งมีรูปร่างเหมือนเส้นโค้ง Dolby PQ (SMPTE-2084) ในตอนท้ายของระดับสูงมันแปรผันจากแกมม่าไปสู่กราฟเส้นโค้งซึ่งเป็นสิ่งที่เราคาดหวัง หนังสือทั้งเล่มให้ความกระจ่างมาก!
Jeroen van Duyn

7

ลองพิจารณาตัวอย่างจากCambridge ใน Color :

ป้อนคำอธิบายรูปภาพที่นี่

ด้วยการใช้การเข้ารหัสแกมม่าเราสามารถแสดงภาพต้นฉบับได้แม่นยำมากขึ้นโดยมีความลึกบิตเท่ากัน (5 ในตัวอย่างนี้)

นี่คือความสำเร็จโดยใช้ 32 ระดับในลักษณะที่สอดคล้องกับตามนุษย์ มันเป็นรูปแบบหนึ่งของการบีบอัด ตัวอย่างเช่น JPEGs สามารถจัดเก็บช่วงไดนามิกได้ประมาณ11 สต็อปแม้ใช้เพียง 8 บิตต่อช่อง

และเช่นเดียวกับการบีบอัดรูปแบบอื่น ๆ มันไม่สำคัญว่าคุณจะไม่สนใจขนาดไฟล์ (และความเร็วที่ต่ำกว่าซึ่งคุณสามารถอ่านหรือเขียนไฟล์ขนาดใหญ่กว่า) ในทางทฤษฎีคุณสามารถใช้รูปแบบคล้าย JPEG ที่ใช้แกมมาเชิงเส้นหากคุณยินดีจัดสรร 11 บิตให้กับแต่ละช่องทางแทนที่จะเป็น 8

ดังนั้นเพื่อสรุปว่าแกมม่าเป็นเพียงรูปแบบของการบีบอัด: มันลดขนาดไฟล์ที่จำเป็นในการจัดเก็บข้อมูลจำนวนหนึ่งตามที่ตารับรู้ อีกทางหนึ่งคือช่วยให้คุณจัดเก็บการไล่สีที่ละเอียดยิ่งขึ้นในความลึกของบิตเดียวกัน


7

ฉันเป็นอดีตวิศวกรออกอากาศและตอนนี้ฉันทำงานด้านภาพยนตร์และโทรทัศน์ในฐานะบรรณาธิการและหัวหน้างาน VFX

ข้อความมากมายที่นี่ไม่ถูกต้อง แกมมาในเส้นทางสัญญาณเป็นประโยชน์ที่ต้องการและเป็นทางเลือกในการออกแบบโดยวิศวกรวิดีโอรุ่นแรกเพื่อลดเสียงที่รับรู้ในการส่งสัญญาณ

หลอดสูญญากาศ, CRT รวมอยู่ด้วย, แสดงความไม่เป็นเชิงเส้น (ดูกฎหมาย Langmuir - Child) CRTs อาจแตกต่างจาก "แกมม่า" ที่ 1.5 ถึงมากกว่า 3.5 (เมื่อขับด้วยสัญญาณแรงดันไฟฟ้า) ขึ้นอยู่กับความแตกต่างของการออกแบบ ความไม่เป็นเชิงเส้นนั้นมีปัญหาน้อยลงเกี่ยวกับโมโนโครม แต่มีความสำคัญกับสีมากขึ้นดังนั้น NTSC จึงระบุสัญญาณแกมม่าที่ 1 / 2.2 การออกแบบและสนับสนุนวงจรCRT ปรับแกมม่าที่เกิดขึ้นจริงจากกฎหมาย Langmuir-Child (เข้าใจกันโดยทั่วไปว่า 1.5 แต่โดยทั่วไปจะสูงกว่าด้วย CRTs เนื่องจากปัจจัยหลายประการ) เป็นระดับที่สอดคล้องกับการรับรู้ของมนุษย์ "แกมม่า" ประมาณ 2.5 สำหรับ NTSC โทรทัศน์จะสันนิษฐานว่ามีเป้าหมายแกมม่าที่ ~ 2.4, ** ในขณะที่ PAL ระบุ ~ 2.8

แกมม่าที่สูงขึ้นในมาตรฐานสัญญาณออกอากาศแบบแอนะล็อกเก่านั้นมีจุดประสงค์เพื่อลดเสียงรบกวนที่รับรู้โดยพิจารณาจากการรับรู้ของมนุษย์ที่ไม่ใช่แบบเส้น ในกรณีการใช้งานนี้ใช้ประโยชน์จากความไม่เป็นเชิงเส้นเพื่อซ่อนสัญญาณรบกวนโดยใช้ "การคอมไพล์" ของการเข้ารหัสสัญญาณแกมม่า นี่เป็นเรื่องทางวิชาการ

มีวิธีการบางอย่างที่การออกแบบ CRT TV & Monitor อาจถูกปรับเปลี่ยนเพื่อให้ได้เส้นตรงเมื่อเทียบกับกราฟแกมม่าชนิด แต่กราฟแกมม่าในการกระจายสัญญาณอะนาล็อกจะลดเสียงรบกวนได้ 30 เดซิเบล แกมมาเป็นที่น่าพอใจแล้วมันเป็นตอนนี้

จำเป็นต้องมีแกมม่าแม้ว่าจะสามารถใช้จอภาพ LCD ในลักษณะเชิงเส้น (แกมม่า 1.0) การอ้างสิทธิ์ในที่นี้ว่าแกมม่าไม่จำเป็นต้องใช้อีกต่อไปนั้นเป็นสองชั้นที่สมบูรณ์และไม่สามารถเข้าใจวัตถุประสงค์ปัจจุบันของการใช้เส้นโค้งที่เน้นก่อน

แกมมาคือสิ่งที่ทำให้ sRGB (หรือ Rec709) ดูดี "แม้ว่าความลึกของบิตจะเพียง 8 บิตต่อช่อง นี่คือตัวอย่าง:

นี่คือรูปภาพใน sRGB, 8 บิตพร้อมเน้นแกมม่าล่วงหน้า (เช่นรูปภาพบนเว็บปกติ) ปกติ

นี่คือลักษณะที่ภาพจะดูโดยไม่มีประโยชน์จากแกมม่า (เช่นถ้าเป็นค่าเชิงเส้นและการแสดงผลแบบเชิงเส้นไม่มีการเน้นแกมมาล่วงหน้า) ไม่ดี

แกมมาให้ BITS มากขึ้นในพื้นที่ที่มืดกว่าเพื่อการไล่ระดับสีที่นุ่มนวลขึ้นและลดเสียงรบกวน

หากคุณต้องการที่จะไปเป็นเส้นตรงทั้งหมดเส้นทางสัญญาณของคุณทั้งหมดจะต้องมีอย่างน้อย 12 บิตต่อช่อง 8 bpc ไม่เพียงพอ การเข้ารหัสด้วยส่วนโค้งและการถอดรหัสบนจอแสดงผลช่วยให้สามารถใช้กลุ่มข้อมูลขนาดเล็กลงหนึ่งไบต์ต่อช่องสี

ในภาพยนตร์ที่เราทำการใช้งานเชิงเส้นเป็นพื้นที่ทำงานแต่เมื่อทำงานกับเส้นตรงที่เราอยู่ใน32 บิตต่อช่องจุดลอย เมื่อเราแลกเปลี่ยนไฟล์ภาพเชิงเส้นเราใช้ EXR Half ซึ่งเป็น 16 บิตต่อหนึ่งช่องสัญญาณลอย (และถ้าเราใช้ไฟล์ DPX 10 บิตข้อมูลภาพจะถูกเข้ารหัสโดยใช้กราฟเส้นโค้ง)

แต่

หน้าจอคอมพิวเตอร์ที่เราใช้ยังคงอยู่ที่ 8 หรือ 10 บิตสำหรับการแสดงผลดังนั้นภาพเชิงเส้นทั้งหมดยังคงต้องมีการปรับแกมม่าก่อนที่จะถูกส่งไปยังจอภาพ ทำไม?

จอภาพ "ดี" ส่วนใหญ่มีเพียง 8 บิตต่อจังและส่วนใหญ่เป็นเพียงแค่ "6 บิตภายใน" หมายความว่าพวกเขาใช้ภาพ 8 บิตต่อจังและแสดงเป็น 6 บิตต่อช่อง พวกเขาจะสร้างภาพลักษณ์ที่ยอมรับได้อย่างไร

แกมมา!

จอมอนิเตอร์ 10 บิตต่อแชนเนลหายากและราคาแพง (เช่น NEX PA271W ของฉัน) NEC ของฉันสามารถรับสัญญาณได้ 10 บิตและใช้ LUT ภายใน 14 บิตสำหรับการทำโปรไฟล์ แต่ 10 บิตก็ยังไม่เพียงพอสำหรับการเชิงเส้น!

จำเป็นต้องใช้แกมมาหรือรูปแบบ preemph / deemph curve แม้แต่ 10 บิต 12 บิตเป็นค่าต่ำสุดเปลือยสำหรับการแสดงผลแบบเส้นตรงที่สมเหตุสมผลและถึงแม้จะไม่เป็นที่ยอมรับสำหรับอุตสาหกรรมภาพยนตร์สารคดี

เราใช้โปรเจ็คเตอร์ 12 บิตสำหรับ DCDM (Digital Cinema) และคาดเดาอะไร ไม่เพียง แต่ DCDM ที่ใช้ CIE X´Y´Z we เท่านั้นเรายังใช้แกมมาเครื่องฉายขนาด 2.6 !!!

DCI ถูกสร้างขึ้นสำหรับโรงภาพยนตร์และเป็นระบบนิเวศแบบปิดของตัวเองโดยไม่ต้องพึ่งพาเทคโนโลยีเก่า ๆ เช่น CRT หากมี "ความได้เปรียบ" บางอย่างในการใช้พื้นที่เชิงเส้น (แกมม่า 1.0) มันจะถูกนำมาใช้ แต่ไม่ใช่

เชิงเส้นไม่ได้ใช้ในโรงภาพยนตร์ดิจิตอลเพราะADVANTAGE ใช้เส้นโค้งแกมมา

ดังนั้นโปรดหยุดพูดว่าเราใช้แกมม่าเพื่อเหตุผลดั้งเดิมเท่านั้นเพราะนั่นเป็นเท็จ

โปรดอ่าน Poynton เกี่ยวกับเรื่องนี้เนื่องจากเขาชี้แจงปัญหาเหล่านี้ในลักษณะที่เข้าใจง่าย

ขอบคุณสำหรับการอ่าน.

เชิงอรรถ: ** ขณะที่ NTSC ระบุสัญญาณแกมม่าที่ 1 / 2.2 ทีวีคาดว่าจะมีแกมม่า 2.4 สำหรับการเพิ่มแกมม่าของระบบ มันมีประโยชน์ที่จะชี้ให้เห็นว่า Rec709 (HDTV) และ sRGB เหมือนกันยกเว้นสำหรับกราฟการถ่ายโอน และน่าสนใจ Rec709 (ผ่าน BT1886) ระบุ "แกมมาแสดงผลแบบฟิสิคัล" ที่ 2.4 (เช่นแกมม่าของจอภาพเอง) และจอภาพ sRGB มักตั้งไว้ที่ 2.4 หรือสูงกว่า (การสำรวจแสดงให้ผู้ใช้ส่วนใหญ่ตั้งค่า 2.5 ขึ้นไป) แต่แกมมาสัญญาณต่างกันประมาณ 1 / 2.2 สำหรับ sRGB และประมาณ 1 / 2.0 สำหรับ Rec709 ในทั้งสองกรณีมีการได้รับแกมม่าของระบบซึ่งเป็นไปตามเจตนาของสภาพแวดล้อมการรับชมที่คาดหวัง


ฉันมักจะสงสัยว่าทำไมไม่อุตสาหกรรมเสียงใช้วิธีการเดียวกัน แต่แทนที่จะพ่น 16+ บิตต่อตัวอย่างที่มัน ...
ซุส

สวัสดี @ Zeus มีเหตุผลหลายประการ (ถ้าคุณถามคำถามนี้ฉันสามารถให้คำตอบในเชิงลึกได้มากกว่านี้) โดยทั่วไปแม้ที่ 16 หรือ 24 บิตกระแสข้อมูลเสียงจะแบนด์วิดธ์ต่ำกว่าวิดีโอ (โดยทั่วไป) และใช้งานได้ง่ายกว่าในการคำนวณ อย่างไรก็ตามเสียงไม่ได้ใช้การเน้นล่วงหน้าและการเน้นเสียงในหลาย ๆ กรณี (โดยเฉพาะอัตราบิตต่ำ) และในความเป็นจริงการได้ยินก็ไม่ใช่แบบเส้นตรง (ตามการรับรู้ทั้งหมด) แต่เสียง 8 บิตคือ "การเรียงลำดับ" เช่นวิดีโอ 4 บิตต่อช่องสัญญาณ โปรดจำไว้ว่า 8 บิตต่อวิดีโอ chan ใช้ทั้งหมด 24 บิตต่อพิกเซลดังนั้นการเปรียบเทียบกับเสียง 16 บิตคือแอปเปิ้ล / ส้ม
Myndex

ขอบคุณ @Myndex แต่น่าเสียดายที่นี่ไม่ใช่คำถามที่นี่ ฉันแค่อยากรู้ว่าเหตุใดการไม่เน้นเสียงก่อน / ไม่เน้นเสียงตั้งแต่ต้นเนื่องจากมันเป็นเรื่องปกติสำหรับการได้ยิน โดยวิธีการที่ฉันหมายถึง 16 บิตต่อช่องแน่นอน (เช่นในแผ่นซีดี); linear 8-bit audio (ซึ่งมีอยู่อย่างเป็นทางการ) นั้นน่ากลัวกว่าวิดีโอเชิงเส้น 8 บิตจากตัวอย่างของคุณ (ซึ่งไม่มีอยู่ในมาตรฐาน) ฉันเข้าใจว่าการแลกเปลี่ยนลดลง แต่ผลประโยชน์สูง: สูญเสียความละเอียดครึ่งหนึ่งทุก ๆ 3 เดซิเบลรู้สึกวิกลจริต ...
Zeus

ฉันคิดว่ามีไซต์ที่เกี่ยวข้องกับการแลกเปลี่ยนสแต็กที่ยินดีต้อนรับคำถามเสียง คำนึงถึง: แต่ละบิตในเสียง 16 บิตเท่ากับ 6 เดซิเบล (แรงดันไฟฟ้า) ดังนั้นจึงมีช่วงไดนามิกทั้งหมด 96 เดซิเบล 6dB (แรงดันไฟฟ้า) คือ "สองเท่า" (หรือครึ่งหนึ่ง) ดัง ๆ ในแรงดันไฟฟ้า แต่มนุษย์มีแนวโน้มที่จะรับรู้ 10 เดซิเบลเป็นจำนวน "ครึ่งดัง" ตามตัวอักษร Pre / De focus ถูกนำมาใช้ในเสียงมาตั้งแต่ต้น บันทึกมีเส้นโค้ง RIAA เทปแม่เหล็กใช้เส้นโค้ง NAB ฯลฯ ฯลฯ คุณหมายถึงการสูญเสียความละเอียดครึ่งหนึ่งทุกๆ 3 เดซิเบล ???
Myndex

ในการเข้ารหัสเชิงเส้นดิจิตอลครึ่งหนึ่งของแรงดันคือครึ่งหนึ่งของช่วงดิจิตอล (ตามคำนิยาม) นั่นคือการสูญเสียความละเอียด 1 บิต นี่เป็นอะไรที่มากสำหรับบางสิ่งที่ถูกมองว่าเป็น 'นุ่มนวล' (-6dB นั่นคือตัวเลขที่ฉันหมายถึงไม่ใช่ 3) หากเราต้องการบันทึกอย่างน้อย 35dB ที่จำเป็น (สำหรับคำพูดหรือวงออเคสตรา) นั่นคือการสูญเสีย 6 บิตสำหรับเสียงที่เบาที่สุด (และแม้กระทั่งถ้าเป็นมาตรฐานอย่างถูกต้อง) ฉันรู้ของ 'อนาล็อก' เน้น (ซึ่งเป็นความแตกต่างกันเล็กน้อยและขึ้นอยู่กับความถี่) แต่ไม่เคยได้ยินของหนึ่งใช้สำหรับดิจิตอลดังนั้นคำถามของฉัน ...
ซุส

3

มีบทความที่สับสนมากมายเกี่ยวกับการแก้ไขแกมม่าที่มีการอ้างอิงที่คลุมเครือมากมายเกี่ยวกับแกมม่าและการมองเห็นของมนุษย์ เหตุผลสำหรับแกมม่านั้นเป็นสิ่งที่เกิดขึ้นในอดีตและเป็นผลมาจากกราฟการตอบสนองของจอภาพ CRT แบบเก่า (ไม่มีส่วนเกี่ยวข้องกับการมองเห็นของมนุษย์) ด้วยหน้าจอแบนวันที่ทันสมัยไม่มีเหตุผลเชิงตรรกะสำหรับการเข้ารหัสแกมม่าและการแก้ไขตามมา แต่มันได้กลายเป็นมาตรฐานอุตสาหกรรม

ความสัมพันธ์ที่คล้ายกันโดยบังเอิญระหว่างกราฟแกมม่ากับเส้นโค้งการตอบสนองของการมองเห็นของมนุษย์ทำให้เกิดข้อได้เปรียบในการช่วยลดขนาดไฟล์ลงเนื่องจากความลึกของภาพจะลดลงโดยไม่ส่งผลกระทบต่อคุณภาพของภาพที่รับรู้


1

OP ค่อนข้างถูกต้องทั้งหมดยกเว้นว่าแกมม่าทำให้โทนสีเข้มขึ้นไม่ใช่หรี่ สิ่งนี้มีอยู่ในไฟล์ไม่ใช่ในสายตา ข้อมูลจะถูกถอดรหัสกลับเป็นเส้นตรงเดิมก่อนที่ตาจะเห็น ความแตกต่างใด ๆ ในสายตาที่มองเห็นฉากดั้งเดิมและการเห็นข้อมูลถอดรหัสที่ทำซ้ำนั้นเป็นเพียงข้อผิดพลาดในการทำสำเนาที่ไม่พึงประสงค์

แกมมาทำเพื่อแก้ไขการสูญเสียอย่างรุนแรงของจอภาพ CRT เท่านั้น CRT ไม่ใช่แบบไม่เชิงเส้นจะแสดงโทนสว่าง แต่จะสูญเสียโทนสีเข้ม ดังนั้นแกมม่าทำให้โทนสีเข้มสว่างจนหวังว่าจะปรากฏขึ้นตามปกติอีกครั้ง (เชิงเส้น) หลังจากการสูญเสีย CRT อย่างไรก็ตามจอภาพ LCD มีลักษณะเป็นเส้นตรงและไม่จำเป็นต้องใช้แกมม่าอีกต่อไป แต่เพื่อรักษาความเข้ากันได้กับภาพ RGB แบบเก่าทั้งหมดในโลกมาตรฐานทั้งหมดจึงยังคงมีแกมม่าเดียวกัน มันง่ายสำหรับจอ LCD ที่จะถอดรหัสและทิ้งมันไป และข้อมูลยังคงทำงานบน CRT

แกมม่าไม่ได้อยู่ในสายตามนุษย์ .. นอกเหนือจากที่เราต้องการเห็นข้อมูลต้นฉบับเชิงเส้นที่ถูกต้อง ดวงตามีการตอบสนองแบบผกผันที่คล้ายคลึงกันซึ่งเป็นเรื่องบังเอิญล้วน แต่ดวงตามนุษย์ไม่เคยเห็นข้อมูลแกมม่า มันจะถูกถอดรหัสครั้งแรกเสมอ (โดยการสูญเสีย CRT หรือชิป LCD) และสายตามนุษย์จะเห็นเฉพาะข้อมูลเชิงเส้นอีกครั้ง (หวังว่า) เช่นเดียวกับที่เห็นฉากต้นฉบับไม่จำเป็นต้องมีแกมม่าในฉากดั้งเดิมด้วย ดวงตาไม่ต้องการความช่วยเหลือ ออกไปข้างนอกแล้วดูต้นไม้ ไม่มีแกมม่าอยู่ที่นั่น เราคิดว่าตาของเรามองไม่เห็นต้นไม้ดีหรือไม่? :) ลองคิดดูอีกสักหน่อย สมองถอดรหัสการตอบสนองของดวงตาและ CRT หรือ LCD ถอดรหัสการเข้ารหัสข้อมูล แกมม่าที่อ้างว่าเป็นเรื่องเกี่ยวกับดวงตาก็ไม่รู้เหมือนกันพวกเขาแค่ทำซ้ำสิ่งที่ผิดที่พวกเขาได้ยิน มันไม่ยากที่จะได้ยิน แต่มันผิดมาก พวกเหล่านี้ควรอธิบายว่าเมื่อใดและอย่างไรที่สายตาของมนุษย์มองเห็นแกมม่าที่พวกเขาจินตนาการว่าจำเป็น ไม่สามารถทำได้มันไม่มีโอกาส

แกมม่าไม่ได้เกี่ยวกับ 8 บิต .. ข้อมูลถูกเข้ารหัสแล้วถอดรหัสและหวังว่าจะเหมือนกันดังนั้นเราจึงสามารถเห็นการทำซ้ำฉากเชิงเส้นดั้งเดิมได้อย่างแม่นยำ แกมม่าถูกนำกลับมาใช้ในช่วงต้น NTSC TV (1940) ก่อนที่จะมีบิตใด ๆ แต่เรามี CRT :) Gamma เป็นเพียงการสูญเสีย CRT เท่านั้น บริสุทธิ์และเรียบง่าย และในสมัยของ CRT แกมมามีความจำเป็นอย่างยิ่ง

ข้อมูล RGB ถูกทำให้เป็นมาตรฐาน (เป็นค่าร้อยละ 0..1) ก่อนที่จะเพิ่มแกมม่าโดยทั่วไปจะมีเลข 1 / 2.2 (ประมาณรากที่สอง) 18% คือ (0.18 ^ 1 / 2.2) = 0.46 หรือ 46% บนฮิสโตแกรมหรือ 117 ในระดับ 0..255 (ภาพคน 18% ควรเป็น 50% ด้วยเช่นกัน) 18% คือ 18% แต่เราเห็นเกือบ 50% เท่านั้นเนื่องจากข้อมูลฮิสโตแกรมนั้นเข้ารหัสแกมมา) แต่โปรดทราบว่า 0 ถึงเลขชี้กำลังใด ๆ ยังคงเป็น 0 และ 1 ถึง เลขชี้กำลังใด ๆ ยังคงเป็น 1 ดังนั้นจึงไม่มีการเพิ่มช่วงไดนามิก และไม่มีการตัดเนื่องจากแกมมาจุดสิ้นสุดไม่สามารถเคลื่อนที่ได้ และแน่นอนเพราะข้อมูลถูกถอดรหัสก่อนใครเห็น สิ่งทั้งหมด (เข้ารหัสแล้วถอดรหัส) เป็นเพียง no-op หวังว่าจะไม่มีการเปลี่ยนแปลงในสายตา แต่ในไฟล์ข้อมูลปกติ (ซึ่งเป็น FRACTION) ไปยังเลขชี้กำลังจะกลายเป็นจำนวนที่มากขึ้นสว่างขึ้นยกเว้นไม่มีตาที่มองเห็นได้ในนั้น

แกมมาทำเพื่อแก้ไขการตอบสนองของจอภาพ CRT เท่านั้น


1

ฉันเชื่อว่าดวงตาของเรามีเส้นโค้งการตอบสนองนี้ แต่การตอบสนองต่อการเปลี่ยนแปลงอย่างฉับพลันของปริมาณแสงโดยเฉพาะอย่างยิ่งถ้ามันสูงขึ้น แต่ในเวลาเดียวกันสมองถอดรหัสการตอบสนองนั้นโดยการ จำกัด ม่านตาของเราให้คงเดิม มีในขณะที่อยู่ในสภาพการรับชมที่มั่นคงจนกว่าการเปลี่ยนเป็นเงื่อนไขการรับชมใหม่เกิดขึ้นอย่างราบรื่น

การแก้ไขแกมม่านั้นส่วนใหญ่มาจากปืน CRT อิเล็กตรอนแบบไม่เชิงเส้นซึ่งต้องการการเข้ารหัสเพิ่มเติม (เช่น. 45 แกมม่าที่ใช้) เพื่อส่งสัญญาณแบบสม่ำเสมอ (เอาท์พุตเชิงเส้น) เนื่องจากคุณสมบัติปืนอิเล็กตรอน CRT ทำให้สัญญาณราวกับว่ามันถูกถอดรหัส (เช่น 2.2 แกมมา ใช้เส้นโค้ง) ในวัน CRT พวกเขาเข้ารหัสข้อมูลดิจิตอลทั้งหมดเพื่อรักษาความสม่ำเสมอของการดูและแลกเปลี่ยนข้อมูลบนอินเทอร์เน็ตดังนั้นรูปแบบไฟล์ภาพส่วนใหญ่เข้ารหัสด้วย Gamma Curve ของ sRGB ซึ่งคล้ายกับ. 45455 Gamma Curve) และยกเลิกปืน CRT .

หลังจากข้อมูลทั้งหมดในอินเทอร์เน็ตถูกเข้ารหัสและเนื่องจากพฤติกรรมเชิงเส้นของเทคโนโลยี LCD (นั่นคือสัญญาณอินพุต = ค่าเอาต์พุต) พวกเขาพบว่ามันสายเกินไปที่จะถอดรหัสข้อมูลดิจิตอลทั้งหมดอีกครั้งหลังจากที่มันกลายเป็นมาตรฐานดังนั้นพวกเขาจึงมาพร้อม วิธีการแก้ปัญหาตรรกะ! และมันก็เพื่อเลียนแบบข้อบกพร่องของ CRT อีกครั้งและพวกมันผลิต LCD ที่มีชิปที่ถอดรหัสสัญญาณ (เช่นใช้ 2.2 gamma curve) เหมือนกับระบบเดิม :) ไม่เช่นนั้นพวกเขาควรถอดรหัสข้อมูลทั้งหมดบนอินเทอร์เน็ต

ดังนั้นอย่าติดอยู่ในความสับสนของสายตาแบบไม่เชิงเส้นนี้คุณจะมีวงกลมแห่งการคิดที่ไม่มีที่สิ้นสุด

และนี่คือความสัมพันธ์กับแกมม่าและดวงตาของเรา

ข้อมูลภาพเชิงเส้นที่ผลิตโดยเซ็นเซอร์กล้อง RAW ไฟล์ที่มีค่าเริ่มต้นแกมม่า = 1.00 (ธรรมชาติเซ็นเซอร์กล้อง) คือ (ไม่มีการถอดรหัสหรือการเข้ารหัส = ไม่แก้ไข) เมื่อไฟล์ Raw "แสดง" บนหน้าจอมันมืด "ดูมืด" เท่านั้น & 12 บิตต่อช่องเป็นไฟล์ขนาดใหญ่ แต่น่าเศร้าที่เราไม่ได้รับประโยชน์จากความลึกนี้เลยเพราะดวงตาของเราไม่ไวต่อค่าความสว่างเท่าที่ไวต่อค่ามืดมากเกินไปและสามารถแยกแยะการเปลี่ยนแปลงเล็กน้อยในความมืด (และฉันจะ อธิบายด้านล่าง)

เนื่องจากภาพคือ "ดูมืด" เนื่องจากจอภาพธรรมชาติระดับความสว่างจะสูญเสียไปกับค่าความสว่างมากกว่าเสียงกลางและค่าความมืด (เพราะหน้าจอแกมม่าดูเสียงกลางดึงลง "ดังนั้นเราจะได้รับประโยชน์มากขึ้นถ้ามืด คุณค่ามีโอกาสเดียวกัน

ดังนั้นพวกเขาจึงพบว่าการใช้การแก้ไขแกมม่า (เช่นการเข้ารหัสข้อมูลดิบในรูปแบบบางอย่างเช่น JPEG ที่มี. 45455 แกมม่าของ sRGB) โดยโชคแปลงเป็น 8 บิตต่อช่องสัญญาณซึ่งหมายถึงขนาดไฟล์ที่ต่ำกว่านอกเหนือจากการดูหรือแสดงค่าความสว่างที่เหมาะสม คือ (ซึ่งก็คือการทำให้แกมมาที่เผาไหม้. 45455 เป็นพิกเซล) และการมีความมืดและโทนกลางขึ้นมาอีกครั้ง) นั้นสอดคล้องกับธรรมชาติของดวงตามาก

คำอธิบายของฉันเป็นเพราะเซลล์ Rod ในดวงตาเรามีความสามารถในการมองเห็นในเวลากลางคืนและธรรมชาติที่มีความละเอียดอ่อนเกินไปของการแยกค่าความมืด >> เรามีเซลล์ Rod 120 ล้าน Vs ประมาณ 6 หรือล้านเท่านั้นสำหรับเซลล์ Cones ที่ไวต่อสีโมโนโครมและ ความยาวคลื่น

ฉันคิดว่ามันไม่ใช่ Eye Response Curve ที่รับผิดชอบและไม่พยายามเชื่อมโยงระหว่าง Eye's Gamma กับ Monitor Gamma ด้วยวิธีอื่นและโปรดแก้ไขให้ฉันด้วยถ้าฉันผิด :) ฉันพยายามดิ้นรนในการทำความเข้าใจปัญหาแกมม่าเพื่อที่ฉันจะได้มีทุกอย่างเกี่ยวกับมัน

สิ่งนี้อ้างอิงที่ดีที่สุดเกี่ยวกับเหตุผลและวิธีแก้ปัญหารังสีแกมมา

http://www.w3.org/TR/PNG-GammaAppendix.html


0

นี่คือร่างคำตอบแรกของฉัน - ฉันจะอธิบายรายละเอียดให้มากขึ้นตามเวลาที่กำหนด แต่ฉันต้องการให้ OP คำตอบบางอย่าง ความคิดเห็นเป็นมากกว่าการต้อนรับ

เนื้อหาเกี่ยวกับ CRT ไม่ได้ใช้จริงอีกต่อไป แต่มีเหตุผลเชิงปฏิบัติที่ดีมากที่จะใช้ภาพที่เข้ารหัสด้วยแกมม่าต่อไป การใช้การเข้ารหัสแกมม่าทำให้การแก้ไขเหมือนกับเส้นโค้งดูเป็น "ปกติ" เพราะดวงตาไม่ตอบสนองเชิงเส้นตรงเพื่อค้นหาการสร้างพื้นที่ LAB ในลักษณะเส้นตรง

ตัวอย่างเช่นดูภาพหน้าจอนี้:ป้อนคำอธิบายรูปภาพที่นี่

ภาพด้านซ้ายเป็นต้นฉบับภาพกลางคัดลอกในแกมม่า 2.2 และภาพด้านขวาคัดลอกในแกมม่า 1.0 สามารถมองเห็นเส้นโค้งที่ใช้กับสำเนาแต่ละชุดได้ เมื่อพิจารณาถึงรูปร่างของส่วนโค้งเวอร์ชัน 2.2 หรือ 1.0 จะมีลักษณะเหมือนที่คุณคาดหวังหรือไม่


0

ตามความเป็นจริงแล้วแกมม่าไม่จำเป็นในปัจจุบันโดยเฉพาะอย่างยิ่งเมื่อทำงานในการแสดงภาพระดับสูง อย่างไรก็ตามนั่นหมายถึงว่าซอฟต์แวร์ที่สมบูรณ์เขียนใหม่ในหลายกรณีมากเกินไป - หรือการเปลี่ยนแปลงนั้นอยู่ไกลจากที่ไร้รอยต่อ (พูดว่าเส้นโค้งที่คุ้นเคยเปลี่ยนรูปร่างได้อย่างสมบูรณ์ตามที่นาย Blankertz เพิ่งพูดถึง)


-1

จอภาพ LCD เป็นแบบ "เชิงเส้น" และไม่ต้องการแกมม่าในวันนี้ แต่จอภาพ CRT นั้นไม่เชิงเส้นและยังคงทำเช่นนั้น และคลังเก็บโลกทั้งหมดของรูปภาพที่มีอยู่มีแกมม่าสำหรับ CRT ดังนั้นจึงง่ายต่อการเพิ่มแกมมาต่อไปกว่าที่จะเปลี่ยนซอฟต์แวร์ทั้งหมดและล้าสมัยภาพที่มีอยู่ทั้งหมด

ดวงตามนุษย์ไม่มีประโยชน์สำหรับแกมมา ดวงตามองเห็นฉากดั้งเดิมได้ดีโดยไม่มีแกมม่า แกมมาเท่านั้นที่จะแก้ไขการสูญเสียที่คาดหวังของจอภาพ CRT (ดังนั้นเราจะเห็นการทำซ้ำของฉากต้นฉบับ) จอ LED รู้แค่ถอดรหัสแกมม่าแล้วละก็ไม่มีเรื่องใหญ่ (เพราะสายตาของมนุษย์คาดว่าจะเห็นการทำสำเนาข้อมูลฉากต้นฉบับโดยไม่ต้องใช้แกมม่าโดยสุจริตจึงควรมีลักษณะเหมือนกัน) มันจะเป็นสิ่งที่ไม่ดีที่เห็นว่าเป็นข้อมูลแกมม่า โชคดีที่สายตามนุษย์ไม่มีโอกาสที่จะได้เห็นข้อมูลแกมม่าใด ๆ เว็บไซต์ที่บอกเราว่าต้องการแกมม่าโดยไม่รู้ว่านูตินเกี่ยวกับแกมม่า

ฮิสโตแกรมของเรานั้นถูกเข้ารหัสด้วยแกมม่าเนื่องจากข้อมูลถูกเข้ารหัส (ด้วยเหตุผลด้านบน) จนถึงก่อนที่มันจะปรากฏต่อสายตามนุษย์ จุดกึ่งกลางของข้อมูลที่เข้ารหัสของเราคือไม่ใช่ 50% แต่ประมาณ 73% ในข้อมูลแกมม่า (การปรับกล้องเช่นสมดุลสีขาวและความคมชัดจะเพิ่มขึ้นเล็กน้อย) หากคุณยกเลิกการเปิดรับแสงของภาพหนึ่งจุด 255 จุดจะเลื่อนไปที่ระดับ 3/4 และไม่ใช่ระดับ 50% บัตรสีเทา 18% นั้นเป็นข้อมูลซับใน 18% แต่ข้อมูลแกมม่าประมาณ 46% ผู้คนสมมติว่าไม่ถูกต้องจะต้องเป็น 50% อย่างใดแม้กระทั่งอาจคิดว่าปรับเทียบมาตรวัดแสงของพวกเขาไป :) แต่ดวงตาไม่เคยเห็นข้อมูลแกมม่ามันถูกถอดรหัสก่อนเสมอไม่ทางใดก็ทางหนึ่ง ดวงตาหวังว่าจะได้เห็นภาพต้นฉบับที่ซื่อสัตย์

แต่ FWIW เครื่องพิมพ์ก็ต้องการแกมม่าส่วนใหญ่เช่นกัน ไม่ใช่ค่า 2.2 แต่ไม่ไกลเกินไป (เนื่องจากจุดได้รับ ฯลฯ ) Apple สังเกตมาตรฐานโลก 2.2 ตอนนี้ แต่เราทุกคนรู้ว่าคอมพิวเตอร์ Mac ยุคแรก ๆ เคยใช้แกมม่า 1.8 นี่ไม่ใช่สำหรับจอภาพพวกเขาใช้จอภาพเดียวกับที่ใช้ Windows (จอภาพสามารถใช้แทนกันได้) แต่ก่อนหน้านี้ Apple เคยขายเครื่องพิมพ์เลเซอร์และแกมม่า 1.8 นั้นสำหรับเครื่องพิมพ์ของพวกเขา จากนั้นฮาร์ดแวร์วิดีโอของ Mac ได้เพิ่มอีกเล็กน้อยเพื่อนำไปสู่ ​​2.2 ที่ CRT ต้องการ วันนี้เครื่องพิมพ์ต้องปรับลดลงเล็กน้อยจากข้อมูล 2.2 ที่พวกเขาได้รับ แต่พวกเขายังคงต้องการมาก

วันนี้มาตรฐานคือ gamma 2.2 ดังนั้นข้อมูล RGB ที่มีอยู่ในโลกทั้งหมดจึงยังคงใช้งานได้


1
LED เป็นประเภทแบ็คไลท์ เหตุผลหลักสำหรับการแก้ไขแกมม่าไม่ได้ปรับให้เหมาะสำหรับ CRT แม้ว่าจะเคยเป็นมา
Euri Pinhollow
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.