เส้น A (ชัดเจน) ระหว่างการมองเห็นของคอมพิวเตอร์กับการประมวลผลภาพ


14

ฉันทำงานและเรียนรู้เกี่ยวกับการมองเห็นคอมพิวเตอร์และการประมวลผลภาพมาหลายปีแล้วและฉันเชื่อว่าฉันไม่ได้เป็นผู้เริ่มต้นที่สมบูรณ์อีกต่อไป

ยังคงหลังจากที่ทุกปีเหล่านี้มันเป็นเรื่องยากสำหรับผมที่จะบอกส่วนใดส่วนหนึ่งโดยเฉพาะอย่างยิ่งการทำงานของผมไม่ว่าจะเป็นส่วนใหญ่วิสัยทัศน์เกี่ยวกับคอมพิวเตอร์, หรือถ้ามันเป็นการประมวลผลภาพ ฉันไม่เห็นบรรทัด - เมื่อฉันทำงานการศึกษาและการวิจัยฉันอ่านเอกสารอ้างอิงด้วยคำหลักทั้งสอง

ดังนั้นฉันสนใจในความหมายของวิสัยทัศน์คอมพิวเตอร์และการประมวลผลภาพทุ่งนาให้ความสำคัญกับการเปรียบเทียบ (ความแตกต่างเช่นเดียวกับการทับซ้อน) ของฟิลด์

นอกจากนี้ฉันคิดว่ามันจะมีค่าหากมีตัวอย่างของแอปพลิเคชัน (แนวความคิดหรือที่มีอยู่) ในทางปฏิบัติโครงการและงานที่เกี่ยวข้องกับ / ใช้ประโยชน์:

  • แต่เพียงผู้เดียว (หรือส่วนใหญ่) เครื่องมือและแนวคิดเกี่ยวกับการมองเห็นของคอมพิวเตอร์
  • แต่เพียงผู้เดียว (หรือส่วนใหญ่) เครื่องมือและแนวคิดในการประมวลผลภาพ
  • การรวมกันของเครื่องมือและแนวคิดจากทั้งสองฟิลด์

ด้วยความเอาใจใส่เป็นพิเศษที่จ่ายให้กับสิ่งที่ทำให้เป็นหนึ่งและไม่ใช่ที่อื่นหรือทำให้ทั้งสองอย่าง

ฉันเข้าใจว่าฟิลด์เหล่านี้มีความเกี่ยวข้องสูงและ "บรรทัด" อาจไม่ชัดเจนเหมือนคำถามที่ถาม แต่ฉันหวังว่าคุณเข้าใจว่าประเด็นของคำถามนี้ไม่ได้ออกแบบกฎการตัดสินใจแบบง่าย ๆ สำหรับการจำแนก (ของฉัน) ทำงานได้ แต่ควรมีความเข้าใจที่ดีขึ้นเกี่ยวกับโฟกัสและเป้าหมายของสาขาเหล่านี้ นอกจากนี้ยังยินดีต้อนรับข้อมูลเพิ่มเติมใด ๆ ที่ปรากฏในหัวข้อด้วยคำถามของฉันแม้ว่าฉันจะไม่ได้ขอเป็นพิเศษ


สิ่งที่เกี่ยวกับ "Machine Vision" คุณคิดว่ามันเป็นคำพ้องสำหรับ "Computer Vision" หรือไม่?
Alessandro Jacopson

@uvts_cvs บอกตามตรงฉันไม่เคยสอน "Machine Vision" ... อาจจะมีความหมายว่า "เครื่องจักร (พร้อมกับระบบฝังตัว) ซึ่งเชี่ยวชาญในการ preform งาน Computer Vision บางอย่าง" เช่นฉันอ่านกล้องเกี่ยวกับความสามารถในการรับรู้ใบอนุญาต แผ่น แต่แล้วอีกครั้งผมอาจจะผิดเกี่ยวกับเรื่องนี้ :)
Penelope

คำตอบ:


12

ฉันเชื่อว่าGonzalez and Woodsมีความสามารถพอที่จะพึ่งพาความเห็นของพวกเขาได้:

ไม่มีข้อตกลงทั่วไปในหมู่ผู้เขียนเกี่ยวกับสถานที่หยุดการประมวลผลภาพและพื้นที่อื่น ๆ ที่เกี่ยวข้องเช่นการวิเคราะห์ภาพและการมองเห็นคอมพิวเตอร์เริ่ม บางครั้งความแตกต่างที่จะทำโดยการกำหนดการประมวลผลภาพเป็นวินัยซึ่งทั้งสองเข้าและส่งออกของกระบวนการมีภาพเราเชื่อว่านี่จะเป็นข้อ จำกัดและค่อนข้างเขตแดนเทียม ตัวอย่างเช่นภายใต้คำจำกัดความนี้แม้แต่งานที่ไม่สำคัญของการคำนวณความเข้มเฉลี่ยของภาพ (ซึ่งให้ผลเป็นตัวเลขเดียว) จะไม่ถือว่าเป็นการดำเนินการประมวลผลภาพ ในอีกด้านหนึ่งมีสาขาต่าง ๆ เช่นการมองเห็นคอมพิวเตอร์ที่มีเป้าหมายสูงสุดคือการใช้คอมพิวเตอร์เพื่อเลียนแบบการมองเห็นของมนุษย์รวมถึงการเรียนรู้และความสามารถในการอนุมานและดำเนินการตามอินพุตภาพ พื้นที่นี้เป็นสาขาของปัญญาประดิษฐ์ (AI) ที่มีวัตถุประสงค์เพื่อเลียนแบบความฉลาดของมนุษย์ สนามของ AI อยู่ในช่วงเริ่มแรกของวัยเด็กในแง่ของการพัฒนาโดยมีความคืบหน้าช้ากว่าที่คาดไว้มาก พื้นที่ของการวิเคราะห์ภาพ (ที่เรียกว่าเข้าใจภาพ) อยู่ในระหว่างการประมวลผลภาพและวิสัยทัศน์คอมพิวเตอร์

ดังนั้นฉันจะบอกว่าความแตกต่างหลักอยู่ในเป้าหมายไม่ใช่วิธีการ ตัวอย่างเช่นหากเป้าหมายคือเพื่อปรับปรุงภาพเพื่อใช้ในภายหลังโดยมนุษย์มากกว่าสิ่งนี้อาจเรียกว่าการประมวลผลภาพ และหากเป้าหมายคือการเลียนแบบการมองเห็นของมนุษย์ (ไม่ว่าจะเป็นการรับรู้วัตถุ, การตรวจจับข้อบกพร่องหรือการขับขี่อัตโนมัติ) ก็จะใกล้เคียงกับการมองเห็นของคอมพิวเตอร์ แต่โปรดทราบว่าการลอกเลียนแบบวิสัยทัศน์ของมนุษย์โดยความหมายก็อาจจำเป็นต้องมีการเพิ่มประสิทธิภาพของภาพดังนั้นในกรณีจริงมากที่สุดวิสัยทัศน์คอมพิวเตอร์ต้องอาศัยการประมวลผลภาพ

ความเข้าใจเกี่ยวกับภาพ (การดึงคุณสมบัติ) อาจนำมาใช้อย่างเท่าเทียมกันในการประมวลผลภาพล้วนๆและการมองเห็นด้วยคอมพิวเตอร์


จุดดี ..
Spacey

คำตอบที่ดีมาก เพียงอัตราส่วนที่สมบูรณ์แบบของวัสดุอ้างอิงและการตีความจากประสบการณ์ ขอบคุณ
penelope

10

วิธีที่ฉันเข้าใจวัตถุประสงค์ของการประมวลผลภาพคือเพื่อให้ได้ภาพ (เปลี่ยนไป) วัตถุประสงค์ของการมองเห็นคอมพิวเตอร์คือการค้นหาบางสิ่งเกี่ยวกับสิ่งต่าง ๆในภาพ (เช่นคนที่อยู่ในภาพมีความสุขหรือเศร้ามีรถยนต์กี่คันในภาพและพวกเขากำลังขับรถไปทางไหน)

แต่เพียงผู้เดียว (หรือส่วนใหญ่) เครื่องมือและแนวคิดเกี่ยวกับการมองเห็นของคอมพิวเตอร์

ฉันไม่คิดว่าเป็นไปได้ไม่ใช่วิธีที่ฉันเข้าใจเงื่อนไข

แต่เพียงผู้เดียว (หรือส่วนใหญ่) เครื่องมือและแนวคิดในการประมวลผลภาพ

ยกตัวอย่าง Adobe Photoshop: มันสามารถถ่ายภาพและแปลงให้เป็นภาพของคนที่ผอมกว่าที่มีผิวที่ดีกว่า แต่มันไม่ "รู้" อะไรเกี่ยวกับวัตถุที่ปรากฎในภาพ


ให้ฉันยกตัวอย่างให้ฉัน: ฉันกำลังทำงานกับการดึงภาพตามเนื้อหา คนส่วนใหญ่ยืนยันว่าเป็นการประมวลผลภาพ ฉันไม่แน่ใจว่ามันเหมาะกับคำตอบของคุณ (ไม่ได้บอกว่ามันเป็นคำตอบที่ไม่ดีเพียงแค่สงสัย)
penelope

ตัวบ่งชี้หนึ่งคือ: เป็นผลงานของคุณรูปภาพ (IP) หรือโครงสร้างข้อมูลอื่น ๆ (CV) ใน CBIR ผลที่ได้คือโครงสร้างข้อมูลอื่น ๆ (เช่นการวัดความคล้ายคลึงกันระหว่างภาพ) ดังนั้นฉันจึงบอกว่ามันเป็นคอมพิวเตอร์วิสัยทัศน์ Wikipedia บอกว่ามันเป็นคอมพิวเตอร์วิสัยทัศน์เช่นกัน
Niki Estner

ที่นั่นฉันทำ googling ด้วยตัวเองแล้วและฉันได้พบบทความภาพรวมนี้แล้วและฉันพูดว่า: "ในระบบเหล่านี้อัลกอริทึมการประมวลผลภาพ (โดยปกติจะเป็นแบบอัตโนมัติ) ถูกใช้เพื่อแยกเวกเตอร์คุณสมบัติที่แสดงคุณสมบัติของภาพเช่นสี พื้นผิวและรูปร่าง " บทความดูค่อนข้างแน่นหนาสำหรับฉัน ...
penelope

2
ใช่ระบบการมองเห็นของคอมพิวเตอร์ทุกเครื่องใช้อัลกอริธึมการประมวลผลภาพ
Niki Estner

ฉันไม่เห็นด้วยกับประเด็นเฉพาะใด ๆ ในคำตอบและ / หรือคำอธิบายของคุณ ... มันไม่ใช่ ... เหมาะสมในแบบที่ฉันต้องการฉันเดา แต่สิ่งนี้กลับกลายเป็นการถกเถียงกันและนั่นก็เป็นการต่อต้าน ดังนั้นฉันแค่หวังว่าจะมีผลงานอื่น ๆ กับคำถามที่หวังจะให้แตกต่างกัน / มุมมองที่ชัดเจน;)
Penelope
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.