เหล่านี้เป็นเพียงความคิดที่ฉันคิดเกี่ยวกับปัญหาไม่เคยลอง แต่ฉันชอบคิดเกี่ยวกับปัญหาเช่นนี้!
ก่อนที่จะเริ่ม
พิจารณาการทำให้รูปภาพเป็นปกติหากมีความละเอียดสูงกว่าภาพอื่นให้พิจารณาตัวเลือกว่าหนึ่งในนั้นเป็นรุ่นที่บีบอัดของอีกภาพดังนั้นการลดความละเอียดลงอาจทำให้ได้ผลลัพธ์ที่แม่นยำยิ่งขึ้น
พิจารณาการสแกนในบริเวณที่มีโอกาสต่าง ๆ ของภาพที่สามารถแสดงส่วนที่ซูมของภาพและตำแหน่งและการหมุนต่างๆ มันเริ่มยากหากภาพหนึ่งเป็นภาพเอียงอีกภาพหนึ่งเป็นข้อ จำกัด ที่คุณควรระบุและประนีประนอม
Matlabเป็นเครื่องมือที่ยอดเยี่ยมสำหรับการทดสอบและประเมินภาพ
ทดสอบอัลกอริทึม
คุณควรทดสอบ (อย่างน้อยที่สุด) ชุดข้อมูลทดสอบที่วิเคราะห์โดยมนุษย์ขนาดใหญ่ซึ่งเป็นที่รู้จักกันล่วงหน้า หากตัวอย่างในข้อมูลการทดสอบของคุณมี 1,000 ภาพที่ 5% ของภาพตรงกันตอนนี้คุณมีเกณฑ์มาตรฐานที่เชื่อถือได้อย่างสมเหตุสมผล อัลกอริทึมที่พบผลบวก 10% นั้นไม่ดีเท่าที่พบ 4% ของผลบวกในข้อมูลการทดสอบของเรา อย่างไรก็ตามอัลกอริทึมหนึ่งอาจพบการแข่งขันทั้งหมด แต่ก็มีอัตราบวกปลอมที่มีขนาดใหญ่ 20% ดังนั้นจึงมีหลายวิธีในการให้คะแนนอัลกอริทึมของคุณ
ข้อมูลการทดสอบควรพยายามออกแบบให้ครอบคลุมพลวัตหลายประเภทมากที่สุดเท่าที่จะเป็นไปได้ในโลกแห่งความเป็นจริง
เป็นสิ่งสำคัญที่จะต้องทราบว่าอัลกอริทึมแต่ละอย่างที่มีประโยชน์จะต้องทำงานได้ดีกว่าการคาดเดาแบบสุ่มไม่อย่างนั้นมันไร้ประโยชน์สำหรับเรา!
จากนั้นคุณสามารถนำซอฟต์แวร์ของคุณไปใช้ในโลกแห่งความเป็นจริงด้วยวิธีการควบคุมและเริ่มวิเคราะห์ผลลัพธ์ที่เกิดขึ้น นี่เป็นโครงการซอฟต์แวร์ประเภทหนึ่งที่สามารถดำเนินการต่อไปได้โดยมีการปรับแต่งและการปรับปรุงที่คุณสามารถทำได้เสมอเป็นสิ่งสำคัญที่ต้องคำนึงว่าเมื่อออกแบบมันเป็นเรื่องง่ายที่จะตกหลุมพรางของโครงการที่ไม่มีที่สิ้นสุด
ถังสี
ด้วยภาพสองภาพสแกนแต่ละพิกเซลและนับจำนวนสี ตัวอย่างเช่นคุณอาจมี 'ถัง':
white
red
blue
green
black
(เห็นได้ชัดว่าคุณจะมีความละเอียดสูงกว่าของเคาน์เตอร์) ทุกครั้งที่คุณพบพิกเซล 'สีแดง' คุณจะเพิ่มตัวนับสีแดง ถังแต่ละใบสามารถเป็นตัวแทนของสเปกตรัมของสีความละเอียดสูงขึ้นแม่นยำยิ่งขึ้น แต่คุณควรทดสอบด้วยอัตราความแตกต่างที่ยอมรับได้
เมื่อคุณมีผลรวมแล้วให้เปรียบเทียบกับผลรวมสำหรับภาพที่สอง คุณอาจพบว่าแต่ละภาพมีรอยเท้าที่ไม่ซ้ำกันพอที่จะระบุการแข่งขัน
การตรวจจับขอบ
วิธีการเกี่ยวกับการใช้ขอบตรวจสอบ
(ที่มา: wikimedia.org )
ด้วยการตรวจจับขอบภาพสองภาพที่คล้ายกันจะช่วยให้คุณใช้งานได้จริงและเชื่อถือได้
ถ่ายภาพทั้งสองและใช้การตรวจจับขอบ อาจวัดความหนาเฉลี่ยของขอบแล้วคำนวณความน่าจะเป็นที่ภาพจะถูกลดขนาดแล้วลดขนาดลงถ้าจำเป็น ด้านล่างเป็นตัวอย่างของตัวกรอง Gabor ที่ใช้(การตรวจจับขอบชนิด) ในการหมุนแบบต่างๆ
เปรียบเทียบพิกเซลรูปภาพสำหรับพิกเซลนับการแข่งขันและไม่ตรงกัน หากพวกเขาอยู่ในเกณฑ์ข้อผิดพลาดคุณจะมีการแข่งขัน มิฉะนั้นคุณสามารถลองลดความละเอียดได้ถึงจุดหนึ่งและดูว่าความน่าจะเป็นของการจับคู่ดีขึ้นหรือไม่
ภูมิภาคที่น่าสนใจ
ภาพบางภาพอาจมีกลุ่ม / ภูมิภาคที่น่าสนใจ ภูมิภาคเหล่านี้อาจแตกต่างอย่างมากกับภาพส่วนที่เหลือและเป็นรายการที่ดีในการค้นหาในภาพอื่น ๆ ของคุณเพื่อค้นหารายการที่ตรงกัน ถ่ายภาพนี้เป็นตัวอย่าง:
(ที่มา: meetthegimp.org )
คนงานก่อสร้างสีฟ้าเป็นภูมิภาคที่น่าสนใจและสามารถใช้เป็นวัตถุค้นหาได้ อาจมีหลายวิธีที่คุณสามารถดึงคุณสมบัติ / ข้อมูลจากพื้นที่ที่น่าสนใจนี้และใช้เพื่อค้นหาชุดข้อมูลของคุณ
หากคุณมีความสนใจมากกว่า 2 ภูมิภาคคุณสามารถวัดระยะทางระหว่างพวกเขาได้ ทำตัวอย่างง่าย ๆ นี้:
(ที่มา: per2000.eu )
เรามีจุดสนใจที่ชัดเจน 3 ภูมิภาค ระยะห่างระหว่างภูมิภาค 1 และ 2 อาจเป็น 200 พิกเซลระหว่าง 1 และ 3 400 พิกเซลและ 2 และ 3 200 พิกเซล
ค้นหาภาพอื่น ๆ สำหรับภูมิภาคที่น่าสนใจที่คล้ายกันทำให้ค่าระยะทางเป็นปกติและดูว่าคุณมีการจับคู่ที่เป็นไปได้หรือไม่ เทคนิคนี้สามารถทำงานได้ดีสำหรับภาพที่หมุนและปรับขนาด ยิ่งคุณมีพื้นที่น่าสนใจมากเท่าใดความน่าจะเป็นของการแข่งขันจะเพิ่มขึ้นตามการวัดระยะทางแต่ละครั้ง
สิ่งสำคัญคือต้องคำนึงถึงบริบทของชุดข้อมูลของคุณ หากตัวอย่างเช่นชุดข้อมูลของคุณเป็นศิลปะสมัยใหม่พื้นที่ที่น่าสนใจจะทำงานได้ค่อนข้างดีเนื่องจากพื้นที่ที่น่าสนใจนั้นอาจถูกออกแบบให้เป็นส่วนพื้นฐานของภาพสุดท้าย หากคุณกำลังจัดการกับภาพของสถานที่ก่อสร้างพื้นที่ที่น่าสนใจอาจถูกตีความโดยผู้ถ่ายเอกสารที่ผิดกฎหมายว่าน่าเกลียดและอาจถูกตัด / แก้ไขโดยเสรี โปรดทราบถึงคุณสมบัติทั่วไปของชุดข้อมูลของคุณและพยายามใช้ประโยชน์จากความรู้นั้น
morphing
Morphingสองภาพเป็นกระบวนการของการเปลี่ยนภาพหนึ่งภาพในอื่น ๆ ผ่านชุดของขั้นตอนนี้:
หมายเหตุนี่แตกต่างจากการซีดจางภาพหนึ่งไปอีกภาพหนึ่ง!
มีชุดซอฟต์แวร์มากมายที่สามารถเปลี่ยนภาพ มันเป็นประเพณีที่ใช้เป็นเอฟเฟ็กต์การนำส่งภาพสองภาพไม่ได้แปรเปลี่ยนไปตามปกติโดยทั่วไปแล้วหนึ่งภาพสุดขั้วไปสู่อีกขั้วหนึ่งเป็นผลลัพธ์สุดท้าย
ทำไมสิ่งนี้ถึงมีประโยชน์ ขึ้นอยู่กับอัลกอริทึม morphing ที่คุณใช้อาจมีความสัมพันธ์ระหว่างความคล้ายคลึงกันของภาพและพารามิเตอร์บางอย่างของอัลกอริทึม morphing
ในตัวอย่างที่เรียบง่ายอย่างไม่มีการลดขั้นตอนวิธีหนึ่งอาจทำงานได้เร็วขึ้นเมื่อมีการเปลี่ยนแปลงน้อยลง จากนั้นเรารู้ว่ามีความเป็นไปได้สูงกว่าที่ภาพทั้งสองนี้จะแบ่งปันคุณสมบัติซึ่งกันและกัน
เทคนิคนี้สามารถใช้งานได้ดีกับภาพที่หมุน, บิดเบี้ยว, บิดเบี้ยว, เบลอ, ซูมทุกประเภท อีกครั้งนี้เป็นเพียงความคิดที่ฉันมีมันไม่ได้ขึ้นอยู่กับสถาบันการศึกษาวิจัยใด ๆ เท่าที่ฉันรู้ (ฉันไม่ได้ดูยากเลย) ดังนั้นมันอาจจะเป็นงานจำนวนมากสำหรับคุณที่มีผลลัพธ์ จำกัด / ไม่มี
ซิป
จากคำตอบของคำถามนี้ยอดเยี่ยมมากฉันจำได้ว่าได้อ่านเกี่ยวกับเทคนิคการศึกษา AI มันค่อนข้างมีประสิทธิภาพในการเปรียบเทียบคลังศัพท์
การเพิ่มประสิทธิภาพที่น่าสนใจอย่างหนึ่งเมื่อทำการเปรียบเทียบคลังข้อมูลคือคุณสามารถลบคำที่ถือว่าเป็นคำที่ธรรมดาเกินไปเช่น 'The', 'A', 'และ' ฯลฯ คำเหล่านี้ทำให้เจือจางผลลัพธ์ของเราเราต้องการหาว่าคลังข้อมูลทั้งสองนั้นแตกต่างกันอย่างไร ดังนั้นสิ่งเหล่านี้สามารถลบออกได้ก่อนการประมวลผล บางทีอาจมีสัญญาณทั่วไปที่คล้ายกันในภาพที่สามารถถอดได้ก่อนการบีบอัด? มันอาจคุ้มค่าที่จะดู
อัตราส่วนการบีบอัดเป็นวิธีที่รวดเร็วและมีประสิทธิภาพมากในการพิจารณาว่าชุดข้อมูลสองชุดที่คล้ายกันเป็นอย่างไร การอ่านเกี่ยวกับวิธีการบีบอัดจะช่วยให้คุณมีความคิดที่ดีว่าเหตุใดจึงมีประสิทธิภาพ สำหรับอัลกอริทึมที่รวดเร็วในการปล่อยนี่อาจเป็นจุดเริ่มต้นที่ดี
ความโปร่งใส
ฉันไม่แน่ใจอีกครั้งว่าข้อมูลความโปร่งใสถูกเก็บไว้สำหรับภาพบางประเภท, gif png ฯลฯ แต่จะแยกออกได้และจะทำหน้าที่เป็นตัวย่อที่มีประสิทธิภาพตัดออกมาเพื่อเปรียบเทียบกับชุดข้อมูลของคุณโปร่งใส
สัญญาณอินเวอร์เตอร์
ภาพเป็นเพียงสัญญาณ หากคุณเล่นเสียงรบกวนจากลำโพงและคุณเล่นเสียงตรงกันข้ามในลำโพงอื่นด้วยการซิงค์ที่สมบูรณ์แบบในระดับเสียงเดียวกันพวกเขาจะยกเลิกซึ่งกันและกัน
(ที่มา: themotorreport.com.au )
กลับภาพและเพิ่มลงในภาพอื่นของคุณ ขยาย / วางตำแหน่งวนซ้ำจนกว่าคุณจะพบภาพผลลัพธ์ที่มีพิกเซลมากพอที่เป็นสีขาว (หรือดำฉันจะเรียกมันว่าเป็นผืนผ้าใบที่เป็นกลาง) เพื่อให้คุณได้คู่ที่เป็นบวกหรือจับคู่บางส่วน
อย่างไรก็ตามให้พิจารณาสองภาพที่มีความเท่าเทียมกันยกเว้นหนึ่งในนั้นมีเอฟเฟกต์ที่สว่างขึ้นมาใช้กับมัน:
(ที่มา: mcburrz.com )
การอินเวอร์เตอร์อันใดอันหนึ่งจากนั้นการเพิ่มเข้าไปในส่วนอื่น ๆ จะไม่ส่งผลให้เกิดผืนผ้าใบที่เป็นกลาง อย่างไรก็ตามเมื่อเปรียบเทียบพิกเซลจากภาพต้นฉบับทั้งสองเราสามารถเห็นความสัมพันธ์ที่ชัดเจนระหว่างทั้งสอง
ฉันไม่ได้ศึกษาสีมาหลายปีแล้วและไม่แน่ใจว่าสเปกตรัมสีอยู่ในระดับเชิงเส้น แต่ถ้าคุณกำหนดค่าเฉลี่ยของความแตกต่างของสีระหว่างรูปภาพทั้งสองคุณสามารถใช้ค่านี้เพื่อทำให้ข้อมูลเป็นปกติก่อนประมวลผลด้วย เทคนิคนี้
โครงสร้างข้อมูลต้นไม้
ตอนแรกสิ่งเหล่านี้ดูเหมือนจะไม่เหมาะกับปัญหา แต่ฉันคิดว่าพวกเขาสามารถทำงานได้
คุณสามารถคิดเกี่ยวกับการแยกคุณสมบัติบางอย่างของภาพ (เช่นถังขยะสี) และสร้างต้นไม้ huffmanหรือโครงสร้างข้อมูลที่คล้ายกัน คุณอาจเปรียบเทียบต้นไม้สองต้นเพื่อความคล้ายคลึงกัน สิ่งนี้จะไม่ทำงานได้ดีสำหรับข้อมูลการถ่ายภาพเช่นสีที่มีขนาดใหญ่ แต่การ์ตูนหรือภาพชุดสีที่ลดลงอื่น ๆ ที่อาจใช้งานได้
สิ่งนี้อาจใช้ไม่ได้ แต่เป็นแนวคิด โครงสร้างข้อมูลtrieนั้นยอดเยี่ยมในการจัดเก็บ lexicons เช่น dictionarty มันเป็นต้นไม้คำนำหน้า บางทีมันอาจเป็นไปได้ที่จะสร้างภาพที่เทียบเท่ากับพจนานุกรม (อีกครั้งที่ฉันสามารถนึกถึงสี) เพื่อสร้างคู่ชีวิต หากคุณลดขนาดรูปภาพขนาด 300x300 ลงเป็น 5x5 สี่เหลี่ยมแล้วให้ย่อยแต่ละตาราง 5x5 ลงในลำดับสีที่คุณสามารถสร้าง trie จากข้อมูลที่ได้ หากจตุรัส 2x2 มี:
FFFFFF|000000|FDFD44|FFFFFF
เรามีรหัส trie ที่ไม่เหมือนใครซึ่งขยายได้ 24 ระดับการเพิ่ม / ลดระดับ (IE การลด / เพิ่มขนาดของตารางย่อยของเรา) อาจให้ผลลัพธ์ที่แม่นยำยิ่งขึ้น
การเปรียบเทียบต้นไม้ทั้งสองควรง่ายพอสมควรและเป็นไปได้ที่จะให้ผลลัพธ์ที่มีประสิทธิภาพ
แนวคิดเพิ่มเติม
ฉันพบสิ่งที่น่าสนใจเกี่ยวกับการจัดประเภทของภาพถ่ายดาวเทียมโดยสรุป:
การวัดพื้นผิวที่พิจารณาคือ: เมทริกซ์ cooccurrence, ความแตกต่างระดับสีเทา, การวิเคราะห์พื้นผิวโทน, คุณสมบัติที่ได้จากสเปกตรัมฟูริเยร์และตัวกรอง Gabor คุณลักษณะของฟูเรียร์และตัวกรอง Gabor บางตัวพบว่าเป็นตัวเลือกที่ดีโดยเฉพาะเมื่อมีการใช้แถบความถี่เดียวสำหรับการจำแนกประเภท
อาจเป็นประโยชน์ในการตรวจสอบการวัดเหล่านั้นในรายละเอียดเพิ่มเติมแม้ว่าบางส่วนอาจไม่เกี่ยวข้องกับชุดข้อมูลของคุณ
สิ่งอื่นที่ต้องพิจารณา
อาจมีเอกสารจำนวนมากในเรื่องแบบนี้ดังนั้นการอ่านบางเรื่องควรช่วยแม้ว่าพวกเขาจะเป็นเรื่องเทคนิค มันเป็นพื้นที่ที่ยากลำบากอย่างยิ่งในการคำนวณด้วยจำนวนชั่วโมงที่ไร้ผลของการใช้จ่ายโดยคนจำนวนมากที่พยายามทำสิ่งที่คล้ายกัน การทำให้มันง่ายและสร้างความคิดเหล่านั้นจะเป็นวิธีที่ดีที่สุด มันควรจะเป็นความท้าทายที่ยากพอสมควรในการสร้างอัลกอริทึมที่มีอัตราการจับคู่แบบสุ่มที่ดีกว่าและเพื่อเริ่มต้นการปรับปรุงที่เริ่มต้นยากที่จะประสบความสำเร็จ
แต่ละวิธีอาจจะต้องมีการทดสอบและปรับแต่งอย่างละเอียดถี่ถ้วนหากคุณมีข้อมูลเกี่ยวกับประเภทของภาพที่คุณจะตรวจสอบเช่นนี้จะเป็นประโยชน์ ตัวอย่างเช่นโฆษณาหลาย ๆ อันจะมีข้อความอยู่ในตัวดังนั้นการจดจำข้อความจึงเป็นวิธีที่ง่ายและน่าเชื่อถือมากในการค้นหาการจับคู่โดยเฉพาะเมื่อรวมกับโซลูชันอื่น ๆ ตามที่กล่าวไว้ก่อนหน้านี้พยายามใช้ประโยชน์จากคุณสมบัติทั่วไปของชุดข้อมูลของคุณ
การรวมการวัดและเทคนิคทางเลือกเข้าด้วยกันซึ่งสามารถมีการลงคะแนนถ่วงน้ำหนัก (ขึ้นอยู่กับประสิทธิผล) จะเป็นวิธีหนึ่งที่คุณสามารถสร้างระบบที่สร้างผลลัพธ์ที่แม่นยำยิ่งขึ้น
หากใช้อัลกอริทึมหลายตัวดังที่กล่าวไว้ในตอนต้นของคำตอบนี้อาจพบว่าผลบวกทั้งหมด แต่มีอัตราบวกเป็นเท็จ 20% มันจะเป็นที่สนใจในการศึกษาคุณสมบัติ / จุดแข็ง / จุดอ่อนของอัลกอริทึมอื่น ๆ มีประสิทธิภาพในการกำจัดผลบวกปลอมที่ส่งคืนจากที่อื่น
ระวังอย่าให้ตกอยู่ในความพยายามที่จะทำโครงการที่ไม่มีวันจบขอให้โชคดี!