คำถามติดแท็ก image-processing

โดยทั่วไปแล้วการประมวลผลภาพเป็นรูปแบบของการประมวลผลสัญญาณใด ๆ ที่อินพุตเป็นรูปภาพเช่นกรอบรูปหรือวิดีโอ

1
ขจัดเสียงรบกวนจากการถ่ายภาพรังสีทันตกรรม
ฉันกำลังทำงานในโครงการของการใช้รูปแบบการใช้งานรูปร่าง เพื่อหาฟันในภาพรังสีของฟัน สำหรับผู้ที่คุ้นเคยกับเทคนิคฉันกำลังพยายามที่จะสุ่มตัวอย่างตามเวกเตอร์ปกติสำหรับแต่ละจุดสังเกต กระดาษแนะนำให้ใช้อนุพันธ์ของพิกเซลตัวอย่าง: "เพื่อลดผลกระทบของการเปลี่ยนแปลงความเข้มทั่วโลกเราจะสุ่มตัวอย่างอนุพันธ์ตามโปรไฟล์แทนที่จะเป็นค่าระดับสีเทาแน่นอน" ดังนั้นปัญหาของฉันคือวิธีกรองภาพรังสีด้วยวิธีที่ดีที่สุดในการเตรียมพวกเขาสำหรับการใช้ผู้ประกอบการอนุพันธ์ ขณะนี้ฉันกำลังใช้การผสมผสานของตัวกรองมัธยฐานเพื่อลบสิ่งที่ฉันคิดว่าส่วนใหญ่เป็นเสียงควอนตัม (mottle) มันตามมาด้วยตัวกรองทวิภาคี จากนั้นฉันก็ใช้โอเปอเรเตอร์ Scharrเพื่อคำนวณการไล่ระดับสีจริงซึ่งควรจะสุ่มตัวอย่าง ผลลัพธ์จะแสดงด้านล่าง: ภาพแรกแสดงข้อมูลต้นฉบับ ในภาพที่สองและสามข้อมูลที่ถูกกรองจะถูกนำเสนอก่อนเป็นขนาดของสเปกตรัมหลังจาก FFT และจากนั้นเป็นข้อมูลภาพที่ถูกกรอง ภาพที่สี่แสดงผลลัพธ์ของการใช้ตัวดำเนินการ Scharr กับภาพที่สาม คำถามของฉันคือ: มีวิธีการที่รู้จักกันดีในการลดเสียงรบกวนในภาพรังสีด้วยวิธีทันตกรรมที่จะแตกต่างจากวิธีการของฉันหรือไม่? อะไรทำให้เกิดลักษณะ "ควัน" ของขอบและพื้นที่ "แบน" (ไม่ใช่ขอบ)? มันเป็นสัญญาณรบกวนที่เหลืออยู่ในภาพที่ถูกกรองหรือมันมีอยู่ในตัวดำเนินการไล่ระดับสี ถ้าเป็นเสียงตัวกรองใดที่เหมาะสมที่สุดที่จะใช้ ค่ามัธยฐานตัวกรองดีในการลบ blobs ที่มีเสียงดังขนาดเล็ก แต่เคอร์เนลขนาดใหญ่ทำให้ขอบเบลอมากเกินไป ดังนั้นตัวกรองทวิภาคีจะใช้ในการกรอง blobs ขนาดใหญ่ขึ้นและทำให้สีเท่ากันทั่วบริเวณโดยไม่ทำอันตรายต่อขอบ แต่ไม่สามารถกรองโครงสร้างควันนี้ได้ มีตัวเลือกที่ดีกว่าตัวดำเนินการ Scharr เพื่อสร้างการไล่ระดับสีในกรณีนี้หรือไม่? โบนัส: สิ่งนี้จะได้รับการพิจารณาว่าเป็นอินพุตที่ดีสำหรับ Active Shape Model หรือไม่? ฉันยังไม่ทราบว่ามันแข็งแกร่งแค่ไหน


2
เหตุใดการตรวจจับขอบ Canny จึงถูกใช้แทนการตรวจจับขอบ Sobel / Prewitt ก่อนการแปลงที่หนักหน่วง?
ฉันรู้ว่าสำหรับ Hough Transform เพื่อทำงานกับรูปภาพมันต้องเป็นภาพไบนารี ในการแปลงจากภาพระดับสีเทาควรใช้อัลกอริธึมการตรวจจับขอบ ฉันสังเกตเห็นว่าผู้คนมักใช้การตรวจจับขอบของ Canny แทนคนอื่น ๆ (Sobel ฯลฯ ) ทำไมถึงเป็นอย่างนั้น?

1
ลบสิ่งประดิษฐ์ออกจากอิมเมจโพรบ Space
นี่คือภาพถ่ายของโฮมเวิร์ลดของเราซึ่งถ่ายโดยยานจูโนเมื่อไม่นานมานี้โดยมีการยิงสลิงไปถึงจูปิเตอร์ สิ่งที่ได้รับในความเร็วเราสูญเสียในของเราอย่างไรก็ตามโชคดีที่เราจะไม่ตกอยู่ในดวงอาทิตย์ ฉันคิดว่าทวีปอเมริกาใต้อยู่ทางซ้าย อย่างไรก็ตามเราสามารถสังเกตเห็นได้ว่ามีสิ่งประดิษฐ์อยู่ทั่วทั้งภาพแถบสีฟ้าจาง ๆ ที่มีอยู่ทั่วทั้งภาพ ฉันอยากรู้ว่าสิ่งที่อาจทำให้เกิด สิ่งที่ฉันอยากรู้จริงๆคือเทคนิคการประมวลผลภาพใดที่เราลงโทษมนุษย์อาจรวมตัวกันเพื่อลบสิ่งประดิษฐ์นี้

2
ทำความเข้าใจเกี่ยวกับกระบวนการคำนวณคุณสมบัติของ SURF
ดังนั้นฉันกำลังอ่านกระดาษบนSURF (Bay, Ess, Tuytelaars, Van Gool: คุณสมบัติที่แข็งแกร่งขึ้นอย่างรวดเร็ว (SURF) )และฉันไม่สามารถเข้าใจย่อหน้านี้ด้านล่าง: เนื่องจากการใช้ตัวกรองกล่องและรูปภาพที่เป็นส่วนประกอบเราไม่จำเป็นต้องใช้ตัวกรองซ้ำกับผลลัพธ์ของเลเยอร์ที่กรองก่อนหน้านี้ แต่สามารถใช้ตัวกรองกล่องขนาดใดก็ได้ที่ความเร็วเดียวกันกับภาพต้นฉบับโดยตรงและ แม้ในแบบคู่ขนาน (แม้ว่าจะไม่ได้ใช้ประโยชน์ที่นี่) ดังนั้นการวิเคราะห์ขนาดพื้นที่โดยการปรับขนาดตัวกรองมากกว่าการลดขนาดภาพซ้ำรูปที่ 4 This is figure 4 in question. ป.ล. : บทความนี้มีคำอธิบายเกี่ยวกับภาพรวม แต่เนื้อหาทั้งหมดของบทความจะขึ้นอยู่กับย่อหน้าเฉพาะด้านบน หากใครอ่านบทความนี้คุณช่วยพูดสั้น ๆ ว่าเกิดอะไรขึ้นที่นี่ คำอธิบายทางคณิตศาสตร์ทั้งหมดนั้นค่อนข้างซับซ้อนที่จะเข้าใจก่อนดีดังนั้นฉันต้องการความช่วยเหลือ ขอบคุณ แก้ไขสองประเด็น: 1 แต่ละคู่จะแบ่งออกเป็นระดับมาตราส่วนคงที่ เนื่องจากลักษณะที่ไม่ต่อเนื่องของภาพที่เป็นส่วนประกอบความแตกต่างของสเกลขั้นต่ำระหว่าง 2 สเกลที่ตามมานั้นขึ้นอยู่กับความยาวแท้จริงของ lobes บวกหรือลบของอนุพันธ์อันดับสองบางส่วนในทิศทางของการสืบทอด (x หรือ y) ซึ่งตั้งค่าเป็น สามของความยาวขนาดตัวกรอง สำหรับตัวกรอง 9x9 ความยาวแท้จริงคือ 3 สำหรับสองระดับต่อเนื่องเราจะต้องเพิ่มขนาดนี้อย่างน้อย 2 พิกเซล …

2
The Parameter Devil - วิธีการตั้งค่าเมื่อไม่มีการตรวจสอบความถูกต้องกับความจริงของพื้นดิน [ปิด]
ปิด คำถามนี้จะต้องมีมากขึ้นมุ่งเน้น ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้มุ่งเน้นที่ปัญหาเดียวโดยแก้ไขโพสต์นี้ ปิดให้บริการใน6 ปีที่ผ่านมา คำถาม: ฉันต้องการพูดคุยเกี่ยวกับวิธีที่ผู้คนตั้งค่าพารามิเตอร์อัลกอริทึมเมื่อไม่มีการตรวจสอบความถูกต้องกับความจริงของพื้นดิน (อาจเป็นเพราะความจริงไม่สามารถรับได้หรือเป็นเรื่องยาก / น่าเบื่อมากที่จะได้รับ) ฉันได้อ่านเอกสารจำนวนมากและใช้อัลกอริธึมพื้นฐานซึ่งในนั้นมีชุดของพารามิเตอร์ที่ได้รับการตั้งค่าว่า "สังเกตุ" - และบ่อยครั้งที่ฉันพบว่าสิ่งเหล่านี้เป็นสิ่งที่ส่งผลกระทบต่อ ทฤษฏีที่เป็นรากฐานของวิธีการนั้นสง่างามล่อลวงและเสียง ฉันจะขอบคุณถ้าคุณสามารถแบ่งปันความคิดของคุณ และไม่มีคำตอบที่ถูกหรือผิดสำหรับคำถามนี้ ฉันแค่อยากรู้ว่าคนอื่น ๆ เกี่ยวข้องกับเรื่องนี้อย่างไร ประวัติความเป็นมา / ที่มาของคำถาม: ฉันเป็นนักวิทยาศาสตร์คอมพิวเตอร์ที่ทำงานในด้านการวิเคราะห์ภาพการมองเห็นคอมพิวเตอร์และการเรียนรู้ของเครื่องและคำถามนี้อยู่ในใจของฉันมาระยะหนึ่งแล้วเมื่อฉันต้องเผชิญกับภาวะที่กลืนไม่เข้าคายไม่ออกครั้งนี้และอีกครั้งเมื่อใดก็ตามที่ฉันออกแบบอัลกอริทึมใหม่ พบว่าตัวเองใช้เวลามากในการปรับพารามิเตอร์ นอกจากนี้ฉันคิดว่าคำถามของฉันที่นี่เป็นเรื่องทั่วไปมากขึ้นในพื้นที่ใด ๆ ที่มีอัลกอริทึมการคำนวณเกี่ยวข้องกันอย่างหนักและฉันต้องการเชิญความคิดของผู้คนจากทุกพื้นที่ที่เกี่ยวข้อง ฉันต้องการให้คุณเป็นตัวอย่างที่เป็นรูปธรรมเพียงเพื่อช่วยให้คุณคิดว่า: --- ใช้กรณีของการตรวจจับคุณสมบัติ (สมมติว่า blobs แบบวงกลมหรือจุดสำคัญ) คุณรันตัวกรองบางตัว (ต้องการพารามิเตอร์) ในระดับที่แตกต่างกัน (พารามิเตอร์มาตราส่วน) และอาจเป็นขีด จำกัด การตอบสนอง (พารามิเตอร์ขีด จำกัด ) มันเป็นไปไม่ได้ที่จะได้รับความจริงที่จะตรวจสอบและปรับพารามิเตอร์ของคุณโดยอัตโนมัติในสถานการณ์ดังกล่าว --- ใช้กรอบการคำนวณใด ๆ …

1
การนับ vechicles ในภาพ
ฉันพยายามใช้อัลกอริทึมสำหรับการนับจำนวนรถยนต์เป็นภาพเรียบร้อยแล้ว ฉันได้ลองใช้วิธีการสำหรับการนับยานพาหนะในการแสดงตนของยานพาหนะหลายภาพในภาพการจราจร มันประเมินพื้นหลังจากชุดของภาพต่าง ๆ ฉันได้ดูเทคนิคอื่น ๆ เพื่อจุดประสงค์นี้และสิ่งเหล่านี้ในทางเดียวหรืออื่น ๆ ใช้การประเมินพื้นหลังทั้งจากชุดภาพหรือต้องการวิดีโอ ฉันมีภาพอินพุตภาพจราจรที่พื้นหลัง (อาจเป็นถนนในเอกสารส่วนใหญ่) แทบจะมองไม่เห็น ยิ่งไปกว่านั้นภาพนั้นมาจากพื้นที่ที่แตกต่างกันดังนั้นจึงไม่มีพื้นหลังเหมือนกัน ฉันควรดำเนินการอย่างไรในกรณีนั้น ฉันคิดว่าถ้าอย่างใดฉันสามารถตรงกับโครงสร้างของยานพาหนะ (รถยนต์) แล้วพวกเขาอาจจะสามารถจับคู่ แต่ฉันไม่รู้ว่าสิ่งนี้เป็นไปได้หรือไม่และเป็นวิธีการดำเนินการต่อเนื่องจากภาพมียานพาหนะที่ถูกบดบังหลายคันเช่นกัน คำแนะนำใด ๆ หรือแม้กระทั่งงานวิจัยก็ยินดีต้อนรับ ภาพตัวอย่างมีดังนี้:

1
ลบเสียงรบกวนบนขอบ (deffects การบีบอัด)
ฉันมีรูปการ์ตูนที่ถูกบีบอัด ตัวอย่าง: พวกเขามีเสียงดังซึ่งไม่ง่ายที่จะลบ แม้ว่าพิกเซลจะอยู่บนพื้นหลังสีเทา แต่พิกเซลของเสียงนั้นอาจมีสีที่แตกต่างกันมากและถ้าฉันดูที่ฮิสโตแกรม (ของภาพระดับสีเทา) ของภาพเหล่านั้น แต่ฉันไม่สามารถลบสีที่มีค่าซึ่งไม่ใช่สีหลักเพราะมีความเสี่ยงที่จะลบคุณลักษณะที่สำคัญบางอย่าง (เช่นตา) นอกจากนี้ฉันพยายามที่จะทำให้ภาพโปสเตอร์ (ตัวอย่างนำเสนอ 8 สี) แต่บางพิกเซลยังคงอยู่ นอกจากนี้ฉันได้ลองใช้ตัวกรองแบบกลาง แต่ไม่สามารถขจัดเสียงรบกวนที่หนักหน่วง (ฉันใช้ตัวกรอง 3 * 3) โปรดให้วิธีการบางอย่างที่สามารถกำจัดเสียงรบกวนได้อย่างมีประสิทธิภาพในกรณีนี้ ฉันจะขอบคุณสำหรับความช่วยเหลือใด ๆ !

1
หมุนภาพ 3 มิติ
ฉันมีภาพสามมิติของอ๊อกซิเจนที่ไม่ใช่ isotropic ซึ่งฉันใช้การหมุนทั่วไป ฉันจะกำหนดขนาดวอกเซลที่เหมาะสมสำหรับภาพที่หมุนได้อย่างไร ฉันต้องการลดการสูญเสียข้อมูลให้น้อยที่สุด แต่หลีกเลี่ยงการสุ่มตัวอย่างมากเกินไปเพื่อป้องกันไม่ให้ภาพใหญ่เกินไป

2
ช่วงเวลาภาพดิจิตอลเป็นภาษาอังกฤษธรรมดา
ฉันกำลังศึกษา OpenCV และในการมองเห็นคอมพิวเตอร์และการประมวลผลภาพผู้คนพูดถึง blobs, contours, พื้นที่ที่เชื่อมต่อกันและบางครั้งฉันก็ได้ยินวลี "ช่วงเวลาภาพ" ฉันรู้บทความเกี่ยวกับ Wikipedia เกี่ยวกับเรื่องนี้แต่ฉันคิดว่ามันเป็นเทคนิคเกินไป ฉันไม่ต้องการเจาะลึกลงไปในพื้นหลังของคณิตศาสตร์ แต่ฉันอยากรู้ว่าฉันกำลังพูดถึงอะไร ใครช่วยอธิบายให้ฉันรู้ว่าช่วงเวลาภาพเป็นภาษาอังกฤษธรรมดา

2
รูปทรงและพื้นที่ช่วงเวลาของภาพดิบ (เชิงพื้นที่) และศูนย์กลาง
ฉันเพิ่งเริ่มใช้ช่วงเวลาภาพสำหรับการประมวลผลภาพของภาพไบนารี ผมอ่านว่าเพื่อรูปร่างช่วงเวลาที่เป็นปริมณฑลและเพื่อพื้นที่ขณะนี้เป็นพื้นที่ ช่วงเวลาดิบเหล่านี้มีให้โดย:0t h0th0^{th}0t h0th0^{th} Mฉันเจ=ΣxΣYxผมYJMij=∑x∑yxiyjM_{ij} = \sum_{x}\sum_{y}x^iy^jเจ ซึ่งหมายความว่าหากฉันมีภาพเช่นนี้ (แต่เป็นเลขฐานสอง, พิกเซลด้านหน้าที่แสดงเป็นสีน้ำเงิน) ช่วงเวลาจะสอดคล้องกับเส้นรอบรูปเนื่องจากมันเป็นภาพของรูปร่าง :0t h0th0^{th} ในทางกลับกันถ้าฉันมีภาพเช่นนี้ (เบื้องหน้าแสดงในขณะที่) ฉันจะได้พื้นที่ของวัตถุเป็นช่วงเวลา :0t h0th0^{th} เนื่องจากฉันต้องการใช้รูปทรงเพื่อให้ได้คุณสมบัติมากขึ้นฉันจึงคำนวณลำดับที่สูงขึ้น ( , ,ลำดับ) ช่วงเวลาที่เป็นรูปแบบดิบ ฉันต้องการใช้สิ่งเหล่านี้เพื่อรับช่วงเวลาสำคัญ1s T1st1^{st}2ไม่มีวัน2nd2^{nd}3R d3rd3^{rd} สูตรที่ฉันใช้เพื่อให้ได้ช่วงเวลากลางคือ: μ00=M00μ00=M00\mu_{00} = M_{00} μ01= 0μ01=0\mu_{01} = 0 μ10= 0μ10=0\mu_{10} = 0 μ11=M11M00-xค* * * *Yค=M11M00- (M10M00) ∗ (M01M00)μ11=M11M00−xc∗yc=M11M00−(M10M00)∗(M01M00)\mu_{11} = \frac{M_{11}}{M_{00}} - x_c*y_c …

2
วิธีการวัดปมปอดในภาพ CT Scan DICOM
ในคำถามนี้ฉันต้องการเน้นที่ค่าความเข้มของ CT Scan ก่อนอื่นให้ดูภาพด้านล่าง: ภาพด้านบนเป็นภาพต้นฉบับในขณะที่ภาพด้านล่างเป็นรุ่นที่ จำกัด ในการวัดปริมาณของรูปร่างใด ๆ ในทางทฤษฎีมันเป็นไปได้ที่จะนับจำนวน voxels ในภาพ อย่างไรก็ตามชั้นนอกสุดของวัตถุ (เช่นก้อนกลม) แสดงความเข้มที่เข้มกว่าในขณะที่ voxels ทั้งหมดภายในวัตถุนั้นมีความเข้มสูงมาก ถ้าฉันนับ voxels ในเวอร์ชันที่ จำกัด ฉันมีแนวโน้มสูงที่จะได้รับปริมาณผลลัพธ์ที่ใหญ่กว่าปริมาตรที่แท้จริงสำหรับโหนปอด ฉันยังเห็นว่ามีตัวแปรเช่น window center (ระดับ) และความกว้างของหน้าต่างซึ่งสามารถใช้เพื่อปรับข้อมูลความเข้มของภาพ DICOM ความเข้มต่างกันสามารถเปลี่ยนแปลงปริมาณผลลัพธ์ ดังนั้นนี่คือคำถาม: ถ้าฉันจะวัดปมปอดใด ๆ ที่ฉันควรทำเพื่อให้บรรลุความแม่นยำที่ดีที่สุดที่เป็นไปได้? เมื่อใดที่เราควรมองข้าม voxels ที่มีความเข้มต่ำกว่า หรือฉันต้องทำสิ่งนี้ด้วยวิธีอื่น?

2
การประมวลผลภาพก่อนการตรวจจับคุณสมบัติ
ฉันได้ดำเนินการตรวจจับคุณลักษณะที่ใช้มุมแฮร์ริส ทำงานได้ดีเกือบทุกครั้ง แต่มีบางกรณีที่ทำงานได้ไม่ดี ฉันต้องทำให้มันใช้งานได้กับหลาย ๆ ภาพโดยไม่ต้องตั้งค่าทีละตัว ปัญหาเกิดขึ้นกับค่าเกณฑ์ตรวจจับ หากตั้งค่าต่ำเกินไปเครื่องตรวจจับจะยิงหลายครั้งเกินไปทำให้มีคุณสมบัติจำนวนมาก หากตั้งค่าสูงเกินไปจะมีคุณสมบัติน้อยเกินไป ฉันได้แก้ไขบางส่วนโดยANMS (Adaptive Non-Maximal Suppression) เพื่อลดจำนวนฟีเจอร์ก่อนที่จะกำหนดเวกเตอร์ตัวบอกให้พวกเขา อย่างไรก็ตามภาพเช่นนี้เป็นปัญหา: พวกเขามีคอนทราสต์ต่ำและฉันไม่สามารถ "ตั้ง" เกณฑ์การตั้งค่าต่ำเกินไปสำหรับรูปภาพทั้งหมด มันจะทำให้เครื่องมือตรวจจับทำงานกับรูปภาพเหล่านี้ แต่รูปภาพอื่น ๆ จะมีคุณสมบัติมากมายกว่าพันคุณสมบัติซึ่งจะช้าในการกรองด้วย ANMS และสิ่งนี้จะเป็นอันตรายต่อประสิทธิภาพโดยรวม ฉันคิดว่าจะปรับภาพก่อนการตรวจจับคุณสมบัติ บางทีการทำให้เท่าเทียมกันฮิสโตแกรมจะทำงาน นี่อาจเป็นการดำเนินการที่ถูกต้องเนื่องจากการเปลี่ยนแปลงความคมชัดระดับโลกไม่มีผลต่อตัวบอกคุณลักษณะ อาจทำงานร่วมกับเกณฑ์การปรับตัวหรือการแก้ปัญหาบางอย่างจะทำงานได้ดีขึ้น ข้อเสนอแนะอื่น ๆ ?

1
จะขยายและเพิ่มทักษะพื้นฐานที่กำหนดไว้สำหรับการประมวลผลภาพ / วิดีโอได้อย่างไร
ฉันไม่ได้เรียนวิชาประมวลผลภาพ แต่ฉันเรียนวิชาตามบันทึกการบรรยายและหนังสือสำคัญในช่วงสามเดือนที่ผ่านมา ดังนั้น ณ จุดนี้ฉันต้องการที่จะเพิ่มพูนทักษะการประมวลผลภาพของฉัน แน่นอนฉันกำลังฝึกการประมวลผลภาพจำนวนมาก แต่งานดูเหมือนจะคล้ายกันมาก ในฐานะโปรแกรมเมอร์ฉันเรียนรู้มากมายจาก coder ชั้นนำหรือที่คล้ายกันซึ่งคุณสามารถแข่งขันกันเองเพื่อการเขียนโปรแกรมที่ดีขึ้น มีเว็บไซต์ใดบ้างที่ฉันสามารถแข่งขันกับปัญหาการประมวลผลภาพได้ยาก

2
วิธีประมาณค่าอ็อกเทฟและขนาดสำหรับคุณลักษณะด้านภาพที่วางไว้ที่มุมของแฮร์ริส
ขณะนี้ฉันกำลังทำงานกับและเปรียบเทียบประสิทธิภาพของตัวตรวจจับคุณลักษณะหลายตัวที่ OpenCV ใช้เป็นพื้นฐานสำหรับการจับคู่คุณลักษณะทางภาพ ฉันใช้คำอธิบายSIFT ผมได้ประสบความสำเร็จการจับคู่ที่น่าพอใจ (หลังจากปฏิเสธการแข่งขันที่ไม่ดี) เมื่อตรวจสอบMSERและหมา (ร่อน)คุณสมบัติ ขณะนี้ฉันกำลังทดสอบโค้ดของฉันกับGFTT (ฟีเจอร์ที่ดีในการติดตาม - มุมแฮร์ริส)เพื่อรับการเปรียบเทียบและเนื่องจากในขั้นตอนสุดท้ายชุดของฟีเจอร์ GFTT จะพร้อมใช้งานจากกระบวนการติดตามคุณลักษณะที่มองเห็น ฉันใช้cv::FeatureDetector::detect(...)ซึ่งให้ฉันด้วยstd::vector<cv::KeyPoint>ที่เต็มไปด้วยการตรวจพบคุณลักษณะ / keypoints / ภูมิภาคที่น่าสนใจ โครงสร้างcv::KeyPointประกอบด้วยข้อมูลพื้นฐานเกี่ยวกับตำแหน่งของสถานที่รวมถึงข้อมูลเกี่ยวกับsizeและoctaveที่ตรวจพบจุดสำคัญ ผลลัพธ์แรกของฉันกับGFTTนั้นแย่มากจนกระทั่งฉันเปรียบเทียบค่าทั่วไปsizeและoctaveพารามิเตอร์ในคุณสมบัติที่แตกต่างกัน: MSERตั้งค่าขนาด (ระหว่าง 10 ถึง 40px) และทำให้อ็อกเทฟเป็น 0 DoG (SIFT)ตั้งค่าทั้งขนาดและอัตราส่วนคู่ ( ขนาด /อัตราส่วนคู่ระหว่าง 20 และ 40) GFTTพารามิเตอร์อยู่เสมอ : size = 3 , octave = 0 ฉันเข้าใจว่าเป็นเพราะวัตถุประสงค์หลักของฟีเจอร์ GFTTไม่ได้ถูกใช้ในการจับคู่ แต่ใช้เพื่อการติดตามเท่านั้น สิ่งนี้อธิบายคุณภาพของผลลัพธ์การจับคู่ต่ำเนื่องจากตัวอธิบายที่ดึงออกมาจากคุณสมบัติเล็ก ๆ …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.