ฉันเขียนโปรแกรมคอมพิวเตอร์ที่สามารถตรวจจับเหรียญในรูปภาพนิ่ง (.jpeg, .png ฯลฯ ) โดยใช้เทคนิคมาตรฐานสำหรับการมองเห็นคอมพิวเตอร์ (Gaussian Blur, thresholding, Hough-Transform เป็นต้น) ด้วยการใช้อัตราส่วนของเหรียญที่หยิบขึ้นมาจากภาพที่กำหนดฉันสามารถสร้างด้วยความมั่นใจที่ดีว่าเหรียญใด อย่างไรก็ตามฉันต้องการเพิ่มระดับความมั่นใจของฉันและกำหนดด้วยว่าเหรียญที่ฉันอนุมานว่าเป็นประเภท A (จากอัตราส่วนรัศมี) ก็เป็นของ colo ที่ถูกต้องเช่นกัน ปัญหาคือว่าสำหรับเหรียญอังกฤษและคณะ (ทองแดง, เงิน, ทองคำ) สีที่เกี่ยวข้อง (โดยเฉพาะทองแดงกับทอง) มีความคล้ายคลึงกันมาก
ฉันมีงานประจำที่แยกสีค่าเฉลี่ยของเหรียญที่กำหนดในรูปของ 'color-space' RedGreenBlue (RGB) และรูทีนการแปลงสีนี้เป็น HueSaturationBrightness (HSB หรือ HSV) 'color-space'
RGB ไม่ค่อยดีในการพยายามแยกแยะความแตกต่างระหว่างสีเหรียญสามสี (ดูตัวอย่าง [พื้นฐาน] ที่แนบมา) ฉันมีช่วงต่อไปนี้และค่าทั่วไปสำหรับสีของเหรียญประเภทต่างๆ:
หมายเหตุ: ค่าทั่วไปที่นี่คือค่าที่เลือกโดยใช้ 'พิกเซลที่ชาญฉลาด' หมายถึงภาพจริง
**Copper RGB/HSB:** typicalRGB = (153, 117, 89)/(26, 0.42, 0.60).
**Silver RGB/HSB:** typicalRGB = (174, 176, 180)/(220, 0.03, 0.71).
**Gold RGB/HSB:** typicalRGB = (220, 205, 160)/(45, 0.27, 0.86)
ฉันพยายามใช้ 'ระยะทางยูคลิดลิตร' เป็นครั้งแรกระหว่างสีเหรียญหมายถึงที่กำหนด (ใช้ RGB) และค่าทั่วไปสำหรับเหรียญแต่ละประเภทที่ให้ไว้ด้านบนรักษาค่า RGB เป็นเวกเตอร์ สำหรับทองแดงเราจะมี:
โดยที่ค่าความแตกต่างน้อยที่สุด ( ) จะบอกเราว่าประเภทเหรียญที่ให้นั้นน่าจะเป็นอะไรมากที่สุด วิธีนี้แสดงให้เห็นว่าตัวเองไม่ถูกต้องมาก
ฉันได้ลองเปรียบเทียบสีสันของเหรียญกับค่าทั่วไปของประเภทที่ให้ไว้ข้างต้น แม้ว่าในทางทฤษฎีแล้วสิ่งนี้จะให้ 'พื้นที่สี' ที่ดีกว่ามากเพื่อจัดการกับความสว่างและระดับความอิ่มตัวของภาพที่แตกต่างกัน แต่ก็ไม่แม่นยำพอ
คำถาม:วิธีที่ดีที่สุดในการกำหนดประเภทเหรียญขึ้นอยู่กับสี (จากภาพคงที่) คืออะไร?
ขอบคุณมากสำหรับเวลาของคุณ
แก้ไข 1
หมายเหตุ: ฉันได้ลองใช้ความคิดทั้งหมดที่กล่าวถึงด้านล่างและประสบความสำเร็จโดยไม่ทำอะไรเลย ความแปรปรวนของสภาพแสง (แม้ในภาพเดียวกัน) ทำให้ปัญหานี้ยากมากและควรนำมาพิจารณาด้วย
แก้ไข 2 (Summery of Outcome)
ขอบคุณสำหรับคำตอบ การวิจัยเพิ่มเติมของฉันเอง (รวมถึงคำตอบและความคิดเห็นของคุณ) ได้เน้นว่าปัญหานี้ยากเพียงใดที่จะจัดการกับในกรณีทั่วไปของแสงตามอำเภอใจ, กล้องโดยพลการ (อุปกรณ์เคลื่อนที่), ความผันผวนของสีเหรียญ (แม้แต่ชนิด / ชนิดเดียวกัน) ฯลฯ ฉันแรกดูที่การรับรู้สีผิว (เขตการวิจัยที่ใช้งานมาก) เป็นจุดเริ่มต้นและยังคงมีปัญหามากมายแม้จะมีการรับรู้ของสีผิวสำหรับคนผิวขาวคนเดียว (ดูบทความนี้เพื่อทบทวนเทคนิคในปัจจุบัน) และความจริงที่ว่าปัญหานี้มีวัตถุสีที่แตกต่างกันสามแบบซึ่งทั้งหมดสามารถมีสีที่ต่อเนื่องและแตกต่างกันทำให้หัวข้อของการมองเห็นคอมพิวเตอร์นี้เป็นเรื่องยากมากที่จะจำแนกและจัดการกับมัน (ในความเป็นจริงคุณสามารถทำปริญญาเอก !)
ฉันตรวจสอบวิธีการ จำกัด ขอบเขตจากโพสต์ DW ที่เป็นประโยชน์มากด้านล่าง นี่เป็นครั้งแรกที่มีแนวโน้มว่าจะเป็นขั้นตอนก่อนการประมวลผลเพื่อแปลงภาพและวัตถุเหรียญแยกเป็นสีที่เป็นอิสระจากสภาพแสง อย่างไรก็ตามถึงกระนั้นเทคนิคนี้ก็ใช้งานไม่ได้อย่างสมบูรณ์ (และเกี่ยวข้องกับไลบรารีของรูปภาพ / ฮิสโตแกรมสำหรับการแมป - ซึ่งฉันไม่ต้องการเข้าไป) และไม่ใช้วิธีการของโครงข่ายประสาทเทียมที่ซับซ้อนมากขึ้น ในความเป็นจริงกระดาษนี้ระบุในนามธรรมที่:
"current machine colour constancy algorithms are not good enough for colour-based
object recognition.".
ไม่ใช่เพื่อบอกว่าไม่มีเอกสารที่ทันสมัยมากขึ้นในหัวข้อนี้ แต่ฉันหามันไม่พบและดูเหมือนจะไม่เป็นงานวิจัยที่จริงจังมากในเวลานี้
คำตอบโดย AVB ก็ยังเป็นประโยชน์และฉันได้มองเข้าไปใน L B * เวลาสั้น ๆ
"The nonlinear relations for L*, a*, and b* are intended to mimic the nonlinear
response of the eye. Furthermore, uniform changes of components in the L*a*b* colour
space aim to correspond to uniform changes in perceived colour, so the relative
perceptual differences between any two colours in L*a*b* can be approximated by
treating each colour as a point in a three dimensional space."
จากสิ่งที่ฉันได้อ่านการแปลงไปสู่พื้นที่สีนี้สำหรับรูปภาพที่ขึ้นกับอุปกรณ์ของฉันจะยุ่งยาก - แต่ฉันจะดูรายละเอียดในเรื่องนี้ (ดูการใช้งานบางอย่าง) เมื่อฉันมีเวลามากขึ้น
ฉันไม่ได้กลั้นลมหายใจสำหรับการแก้ปัญหาที่เป็นรูปธรรมสำหรับปัญหานี้และหลังจากความพยายามกับ L A B * ฉันจะละเลยสีเหรียญและมองเพื่อให้แน่ใจว่าอัลกอริทึมการตรวจจับทางเรขาคณิตของฉันในปัจจุบัน
ขอบคุณทุกท่าน และเพื่อเป็นข้อสังเกตสำหรับคำถามนี้นี่คือภาพเดียวกันกับอัลกอริทึมการตรวจจับรูปทรงเรขาคณิตใหม่ซึ่งไม่มีการรับรู้สี: