ทำความเข้าใจเกี่ยวกับองค์ประกอบ Cb และ Cr ของ YCbCr Color Space


11

ฉันคุ้นเคยกับการเพิ่มเติม (RGB), substractive (CMYK), และ coloraces เหมือน HSV แต่บทความที่ฉันพยายามจะเข้าใจในขณะนี้ดำเนินการในพื้นที่สีYCbCrสำหรับการแบ่งส่วนภาพ / ความหมายของวัตถุ

ฉันใช้เวลาส่วนใหญ่ในตอนเช้าเพื่อหาสิ่งที่จะอธิบาย YCbCr ตามธรรมชาติ แต่ฉันก็ไม่เข้าใจ ฉันได้รับคำอธิบายที่ดีและเข้าใจง่ายเกี่ยวกับแนวคิดทั่วไปที่อยู่เบื้องหลังพื้นที่สีนี้ ที่นี่และคำอธิบายว่ามันถูกใช้สำหรับการเข้ารหัส / บีบอัดภาพจากพวกเหล่านี้ได้อย่างไร (ทั้งหมดบนภาพถ่าย)

สูตรสำหรับการคำนวณจาก YCbCr RGB เป็นมั่นเหมาะสามารถเข้าถึงได้บนวิกิพีเดีย

ฉันได้รับแรงจูงใจสำหรับการเป็นตัวแทนนี้ฉันได้รับองค์ประกอบ Y ที่มีข้อมูลระดับสีเทาที่สำคัญที่สุด (ต่อสายตามนุษย์) เกี่ยวกับภาพ

ฉันได้รับ Cb และ Cr นำข้อมูลเกี่ยวกับสีและ (เนื่องจากความรู้สึกของคน (ใน) ความรู้สึก) พวกเขาสามารถบีบอัดได้โดยไม่สูญเสียคุณภาพที่มองเห็นได้ แต่องค์ประกอบ Chrominance แต่ละอันนั้นแสดงถึงอะไร?

ในขณะที่ผู้เขียนบทความกล่าวว่า "ข้อมูล chrominance เป็นสิ่งสำคัญที่สุดในการกำหนดวัตถุ" ในวิธีการของพวกเขาและฉันไม่สามารถเข้าใจสิ่งที่ฉันกำลังอ่านกับ "Y คือความเข้ม Cb และ Cr พกข้อมูลสีในระดับใด" ความเข้าใจ YCbCr

ฉันกำลังค้นหาคำตอบตามบรรทัด "Cb คือ ... ในขณะที่ Cr คือ ... " หรือ "ถ้าคุณจินตนาการถึงการมองผ่าน / ด้วย XY คุณกำลังดูองค์ประกอบ Cb จริง ๆ ... " หรือบางส่วน อีกวิธีหนึ่งที่จะช่วยให้ฉันเข้าใจข้อมูลที่ดำเนินการโดยแต่ละส่วนประกอบแยกจากกันไม่เพียง แต่พวกเขารวมกันนำข้อมูลสีมาด้วย

แก้ไข

ฉันขอยกตัวอย่างคำอธิบายที่ใช้งานง่ายสำหรับช่องว่างสีอื่น ๆ ของประเภทที่ฉันกำลังมองหา:

RGB : เหมือนกับส่องไฟฉายสีบนผนังสีดำ: หากคุณส่องแสงด้วยไฟฉายสีฟ้าคุณจะเห็นภาพสะท้อนสีน้ำเงิน หากคุณเพิ่มไฟฉายสีแดงมันจะแสดงการสะท้อนสีม่วงแดงซึ่งเป็นส่วนผสมของสีน้ำเงินและสีแดง

CMYK : เช่นเดียวกับการผสมสีน้ำคุณ "เพิ่มสีที่สะท้อนพื้นผิว" (เช่นลบสีจากพื้นหลัง) ดังนั้นหากคุณผสมสีเหลืองกับสีฟ้าถ้าจะสะท้อนสีเขียวและคุณจะได้สีเขียว

HSV : เด็กเล็ก ๆ ถูกดึงดูดไปยังวัตถุที่มีความอิ่มตัวสูงไม่สว่าง (ค่า) องค์ประกอบเว้คือสิ่งที่ "ให้สี" ในขณะที่ความอิ่มตัวต่ำหมายถึงสีที่ "เจือจาง" สีขาว การเปลี่ยนแปลงมูลค่าทำให้สิ่งต่าง ๆ สว่างหรือมืดกว่า

ด้วยคำจำกัดความนี้ฉันสามารถรับความรู้สึกที่เข้าใจได้ง่ายเกี่ยวกับความหมายของสีในแต่ละพื้นที่สีโดยไม่ต้องจดจำแผนภูมิสำหรับแต่ละสี

คำตอบ:


7

YUV (หรือ YCbCr) เหมือน HSV แต่ในพิกัดที่ต่างกัน (ความแตกต่างระหว่าง YUV และ YCbCr นั้นเป็นเพียงเล็กน้อย - ส่วนใหญ่เกี่ยวข้องกับสูตรที่แน่นอน)

V องค์ประกอบเหมือนกัน (S,H) สามารถนึกได้ว่าเป็นพิกัดเชิงขั้วและ (U,V) เป็นคาร์ทีเซียน H คือมุมและ Sคือรัศมี การแปลงคร่าวๆจะเป็น:

U=Scos(H)

V=Ssin(H)

คุณสามารถดูลิงค์นี้สำหรับข้อมูลเพิ่มเติม

อีกสิ่งหนึ่งที่จะเพิ่มในรายการปรีชาของคุณ:

ความอิ่มตัวเป็นวิธีการที่บริสุทธิ์เป็นสีจากจุดสเปกตรัมของมุมมอง ตัวอย่างเช่นเลเซอร์มีสเปกตรัมที่แคบมากซึ่งแสดงถึงความอิ่มตัวสูง


คุณสามารถเพิ่มคำอธิบายของความแตกต่างระหว่าง YUV และ YCbCr เพื่อความสมบูรณ์ได้หรือไม่?
penelope

@Andrey Rubshtein หากเลเซอร์มีความอิ่มตัวสูงการสนทนาจะเป็นจริงหรือไม่? กล่าวอีกนัยหนึ่งถ้าฉันวัด RGB และแปลงเป็น HSV ความอิ่มตัวของสีสูงหมายความว่าต้องมาจากแหล่งกำเนิดเลเซอร์ที่สอดคล้องกันหรือไม่? ขอบคุณ.
แฟรงก์

@ Frank ไม่จำเป็นต้องเป็นเลเซอร์ แต่มันยากที่จะมีสีอิ่มตัวที่มีสเปกตรัมกว้างเนื่องจากยิ่งกว้างก็ยิ่งยากที่จะมีการตอบสนองสูงในองค์ประกอบเดียวเท่านั้น
Andrey Rubshtein

@Andrey Rubshtein ขอบคุณสำหรับคำตอบของคุณ mks หน่วยของ Saturation Intensity คือพลังงานต่อหน่วยเวลาต่อหน่วยพื้นที่ . mks หน่วยของพลังงานความอิ่มตัวของพลังงานคือพลังงานต่อหน่วยพื้นที่ ที่สถานะของแสงเลเซอร์แบบทึบยาว 10 ถึง 50 ns (nanoseconds) ความอิ่มตัวสูงที่มีสเปกตรัมแคบ ๆ บ่งบอกว่ามันต้องกำเนิดจากแหล่งกำเนิดเลเซอร์ที่สอดคล้องกันหรือไม่?
แฟรงค์

@Andrey Rubshein คุณถูกต้องทั้งหมด .. ฉันเพิ่งค้นพบว่าไฟ LED ส่องแสงที่เปล่งแสงสีเดียวสีเดียวเช่นเดียวกับไฟโซเดียมความดันต่ำ มีลักษณะที่แตกต่างกันของพอยน์เตอร์เลเซอร์ที่เชื่อมโยงกันซึ่งสามารถใช้บอกลำแสงเลเซอร์นอกเหนือจากภาพรวมที่สังเกตผ่านหน้าต่างห้องนักบินของเครื่องบินโบอิ้ง 737 ได้หรือไม่?
แฟรงก์

2

ไม่แน่ใจว่าสิ่งที่คุณหมายถึงโดย "จริง" เป็นตัวแทนเพราะ RGB หรือ YUV ไม่ได้เป็นตัวแทนของความถี่โฟตอนหรือการตอบสนองของก้านตา / กรวยของมนุษย์โดยทั่วไป แต่คุณสามารถดูว่าพวกเขามีลักษณะอย่างไรกับคุณโดยการสังเคราะห์แผ่นสี YCrCb บางอย่างเช่น (1,1,0), (1, -1,0), (1,0,1), (1,0, - 1) ฯลฯ

นี่คือหน้า Wikipedia ซึ่งมีแผนภูมิ:

http://en.wikipedia.org/wiki/File:YCbCr-CbCr_Scaled_Y50.png

เพิ่ม: RGB และเช่นนั้นถูกออกแบบมาเกือบ (หรือวิวัฒนาการ) เพื่อให้ตรงกับความเข้าใจในการรับรู้ของมนุษย์ (และชื่อสีกลายเป็นสิ่งที่เรียนรู้ทางวัฒนธรรม) YUV เป็นตรงกันข้ามการออกแบบดังกล่าวว่าเสียงรบกวนในพื้นที่รังสียูวี (เพิ่มลงใน subband ที่มีเสียงดัง NTSC) จะมองเห็นได้ยากและยากที่จะอธิบาย YCrCb คือรูปแบบที่เปลี่ยนแปลงในการจับคู่สีเดียวกัน ดังนั้นอย่าค้นหาข้อมูลเชิงลึกที่ "ใช้งานง่าย" ที่มีอยู่ซึ่งอาจไม่มีอยู่ บางทีสร้างของคุณเองโดย "เรียนรู้" แผนภูมิและสร้างการเชื่อมต่อประสาทใหม่ล่าสุดที่อาจไม่มีอยู่ในสมองของคุณ (หรืออะไรทำนองนั้น)


ฉันเพิ่มตัวอย่างสำหรับช่องว่างสีอื่น ๆ ของประเภทที่ฉันต้องการสำหรับ YCbCr หวังว่านี่จะทำให้คำอธิบายประเภทที่ฉันต้องการชัดเจนยิ่งขึ้น
Penelope

0

เมื่อคุณเข้าใจ HSV / HSB ไม่ควรยากที่จะเข้าใจ YCbCr ช่อง B ใน HSB สอดคล้องกับ chroma (chroma = saturation http://vident.com/products/shade-management/color-theory/understanding-color-overview/hue-value-and-chroma/) คุณสามารถถ่ายภาพ rgb และแปลงเป็นสีเทาหรือคุณสามารถแปลงทุกช่องของ RGB เป็นโทนสีเทาและรวมเข้าเป็นหนึ่งช่อง เพื่อความเรียบง่ายเราจะมีพิกเซลที่มีสีแดง 100% สีเขียว 100% และสีฟ้า 70% คุณจะคำนวณค่าเฉลี่ย ... (100 + 100 + 70) / 3 และคุณจะได้รับค่า 90% ซึ่งหมายถึง 90% ของความสว่าง ดังนั้นในระดับสีเทามันเป็นสีเทาอ่อนมาก ตอนนี้ถ้าเราต้องการที่จะแสดงสีดั้งเดิมไปยังช่องสีเทาเราจะต้อง 3 สูตรสำหรับทุกสี (แดง, เขียว, น้ำเงิน) คุณจะคำนวณความแตกต่างของค่า R กับสีเทา, G กับสีเทาและ B กับสีเทา ต้องมี 4 ช่องสัญญาณ (RGB + chroma) แต่เราสามารถทำเช่นเดียวกันกับ 3 ช่อง เราสามารถทำการแก้ไขเล็กน้อยกับช่องสีเขียว ลองคำนวณความแตกต่างกับช่องสีเขียว สีเขียวดั้งเดิมคือ 100% ค่าใหม่ของสีเขียวเปลี่ยนเป็นสีเทาคือ 90% ความแตกต่างคือ -10% งั้นลองเปลี่ยนช่อง R และ B ของพิกเซลนี้ด้วยความแตกต่างนี้ เราเพิ่งแก้ไขแกมมาหรือทุกช่อง ค่าช่องสีเขียวจะเหมือนกับภาพสีเทา ดังนั้นเราจึงไม่คำนวณด้วยช่องสีเขียวอีกต่อไป สีเขียวคือ "เข้ารหัส" ในช่อง Y ... Chroma ส่วนที่เหลือของสี (R, B) จะถูกปรับด้วย R` = 90% ของต้นฉบับหรือ 100% ของ Y เพราะ R และ B เท่ากันในตัวอย่างนี้ สารประกอบ B มีความแตกต่าง + 20% ไปยังต้นฉบับ แต่หลังจากเปลี่ยนไปด้วยการแก้ไขแกมม่าจะมีความแตกต่าง + 30% ไปยัง Y เพื่อให้ง่ายขึ้นมากขึ้นมันก็เหมือนกับสูตรที่คุณต้องเพิ่มสารประกอบทั้งสามนี้ ความแตกต่างที่คุณได้รับสำหรับสีแดงและสีน้ำเงินคือ Cb และ Cr ตัวละครเพิ่งบอกว่าคุณเปรียบเทียบช่องสีน้ำเงินกับ Chroma Channel และช่องสีแดงกับช่อง Chromma ดังนั้น Cb และ Cr

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.