คำถามติดแท็ก image-processing

โดยทั่วไปแล้วการประมวลผลภาพเป็นรูปแบบของการประมวลผลสัญญาณใด ๆ ที่อินพุตเป็นรูปภาพเช่นกรอบรูปหรือวิดีโอ

3
การจำแนกพื้นผิวด้วย DCT
มันจะทำงานได้อย่างไรในการจำแนกพื้นผิวของภาพโดยใช้คุณสมบัติจากการแปลงโคไซน์แบบแยก? Googling "การจำแนกพื้นผิว dct" จะพบรายงานทางวิชาการเพียงเรื่องเดียวในหัวข้อนี้โดยใช้เครือข่ายประสาท สำหรับแอปพลิเคชันของฉันฉันมีคลังข้อมูลขนาดใหญ่ของภาพซึ่งในภาพทั้งหมดเป็นพื้นผิวที่สอดคล้องกัน (เช่นภาพโคลสอัพของผ้าห่มเปลือกไม้ต้นไม้ทุ่งหญ้า ฯลฯ ) ได้รับแรงบันดาลใจจากการตอบคำถามก่อนหน้านี้ฉันกำลังพิจารณาแนวทางต่อไปนี้: แยกแต่ละภาพออกเป็นบล็อก NxN ของพิกเซล ใช้ DCT ของแต่ละบล็อก บีบ DCT แต่ละอันให้เป็นอาร์เรย์ 1xM และป้อนเข้ากับอัลกอริทึมการจัดกลุ่ม K-Means และรับฉลากคลัสเตอร์สำหรับ DCT แต่ละตัว คำนวณฮิสโตแกรมของการทำคลัสเตอร์ป้ายสำหรับแต่ละภาพโดยการนับแต่ละป้ายต่อภาพจาก # 3 ฝึกอบรมตัวจําแนก SVM โดยป้อนชุด [(ฮิสโตแกรม, ป้ายรูปภาพ) มันจะทำงานได้ดีแค่ไหน? ฉันใช้ระบบที่คล้ายกันโดยใช้คุณสมบัติที่แยกผ่านอัลกอริทึม SIFT / SURF แต่ฉันสามารถได้รับความแม่นยำประมาณ 60% เท่านั้น ฉันสามารถใช้ DCT ในวิธีอื่นในการจำแนกพื้นผิวได้อย่างไร?

2
การแปลงรูปภาพขาวดำ (1 บิตดำและขาว)
เมื่อแปลงข้อความที่สแกนเป็นภาพขาวดำ 1 บิตตัวกรองบางตัวที่สามารถนำไปใช้ในกระบวนการเพื่อปรับปรุงผลลัพธ์คืออะไร ตอนนี้ฉันกำลังเจอปัญหาที่ข้อผิดพลาดในการทำให้ภาพดูแย่มาก อัปเดต: ฉันคิดว่าการพยายามเลิกทำ dithering นั้นเป็นปัญหาที่ยากกว่ามาก ฉันจะแปลงภาพแรกเป็นภาพขาวดำได้อย่างไร วิธีการเริ่มต้นconvert -monochrome img1 img2แสดงอยู่ด้านล่าง ฉันยังได้ลองวิธีสองขั้นตอน: 1) ลดความลึก (จานสี) และแกมม่า 2) แปลงเป็นรูปภาพแบบ bilevel (ไม่แสดง) สิ่งอื่น ๆ ที่ฉันเล่นด้วยซึ่งรวมถึงคำสั่ง ditherของ imagemagick (ในการตั้งค่าต่าง ๆ ) แต่มันก็ไม่ดีเท่าวิธีสองขั้นตอน

1
ทำไมรูปแบบMoiréนี้มีลักษณะเช่นนี้?
ฉันกำลังทำการแปลง gifs ของ Mobius ใน Matlab และรูปแบบแปลก ๆ บางอย่างก็เริ่มปรากฏขึ้น ฉันไม่แน่ใจว่าจำเป็นต้องมีความรู้ลึกเกี่ยวกับประเภทไฟล์ / อัลกอริทึมเพื่อเข้าใจปรากฏการณ์นี้หรือไม่ แต่ฉันคิดว่าอาจมีคำอธิบายทางคณิตศาสตร์อย่างแท้จริง ภาพที่ได้มาจากการระบายสีระนาบที่ซับซ้อนเหมือนกระดานหมากรุกแล้วกลับหัวกลับหางโดยการใช้ส่วนร่วมของคอนจูเกตที่ซับซ้อน นี่คือ psuedocode คณิตศาสตร์สำหรับภาพที่มีการซูม :kkk checkerboard:C→{black,white}checkerboard(z):={blackwhiteif ⌊I(z)⌋+⌊R(z)⌋≡0mod2if ⌊I(z)⌋+⌊R(z)⌋≡1mod2image={z∈C:|R(z)|,|I(z)|≤1}color:image→{black,white}color(z):=checkerboard(k/z¯¯¯)checkerboard:C→{black,white}checkerboard(z):={blackif ⌊ℑ(z)⌋+⌊ℜ(z)⌋≡0mod2whiteif ⌊ℑ(z)⌋+⌊ℜ(z)⌋≡1mod2image={z∈C:|ℜ(z)|,|ℑ(z)|≤1}color:image→{black,white}color(z):=checkerboard(k/z¯)\begin{align} &\mbox{checkerboard}:\mathbb C \to\{\mbox{black},\mbox{white}\}\\ &\mbox{checkerboard}(z):=\begin{cases} \mbox{black} & \mbox{if }\lfloor\Im(z)\rfloor+\lfloor\Re(z)\rfloor\equiv 0\mod 2\\ \mbox{white} & \mbox{if }\lfloor\Im(z)\rfloor+\lfloor\Re(z)\rfloor\equiv 1\mod 2 \end{cases}\\ &\mbox{image} = \{z\in\mathbb C:|\Re(z)|,|\Im(z)|\leq 1\}\\ &\mbox{color}:\mbox{image}\to\{\mbox{black},\mbox{white}\}\\ &\mbox{color}(z):=\mbox{checkerboard}(k/\overline{z}) \end{align} และนี่คือภาพเพื่อk=1k=1k=1 , …

2
การสร้างภาพใหม่: เฟสเทียบกับขนาด
รูปที่ 1 (c) แสดงภาพทดสอบที่สร้างจากสเปกตรัม MAGNITUDE เท่านั้น เราสามารถพูดได้ว่าค่าความเข้มของพิกเซลความถี่ต่ำนั้นมากกว่าพิกเซลความถี่สูง รูปที่ 1 (d) แสดงภาพทดสอบที่สร้างขึ้นใหม่จากช่วงสเปกตรัมเท่านั้น เราสามารถพูดได้ว่าค่าความเข้มของพิกเซลความถี่สูง (ขอบเส้น) มีค่ามากกว่าพิกเซลความถี่ต่ำ เหตุใดความแตกต่างที่น่าอัศจรรย์ของการเปลี่ยนแปลงความเข้ม (หรือการแลกเปลี่ยน) จึงเกิดขึ้นระหว่างภาพการทดสอบที่สร้างขึ้นใหม่จากสเปกตรัม MAGNITUDE เท่านั้นและภาพการทดสอบที่สร้างขึ้นใหม่จากสเปกตรัม PHASE เท่านั้นซึ่งเมื่อรวมเข้าด้วยกันเป็นภาพทดสอบต้นฉบับ clc; clear all; close all; i1=imread('C:\Users\Admin\Desktop\rough\Capture1.png'); i1=rgb2gray(i1); f1=fftn(i1); mag1=abs(f1); s=log(1+fftshift(f1)); phase1=angle(f1); r1=ifftshift(ifftn(mag1)); r2=ifftn(exp(1i*phase1)); figure,imshow(i1); figure,imshow(s,[]); figure,imshow(uint8(r1)); figure,imshow(r2,[]); r2=histeq(r2); r3=histeq(uint8(r2)); figure,imshow(r2); figure,imshow(r3);

2
ใช้ตัวกรอง Gabor กับภาพอินพุต
ฉันพยายามใช้ตัวกรอง Gabor ที่มีสเกลเฉพาะ (ตามค่าของแลมบ์ดาและซิกมาดังนั้นจึงเป็น ( 7x7 ) และสำหรับการหมุน 4 ทิศทาง (0, ,และ ) ไปยังอิมเมจสเกลสีเทาอินพุตπ4π4\frac{\pi}{4}π2π2\frac{\pi}{2}3π43π4\frac{3\pi}{4} ในรหัสของฉันประสบความสำเร็จในสามขั้นตอน: สร้างตัวกรอง Gabor อ่านภาพ RGB จากนั้นแปลงเป็นระดับสีเทาและสุดท้ายเป็นสองเท่า ใช้ gabor ที่สร้างขึ้นกับภาพอินพุต ( ที่นี่ฉันไม่แน่ใจว่ารหัสของฉันเป็นจริงหรือไม่นั่นเป็นเหตุผลที่ฉันต้องการความเห็นของคุณ ) 1) -------------- สร้างตัวกรอง Gabor (ขนาด = 7x7 และ 4 การหมุน) %define the five parameters theta=....; %either 0 or pi/4 or pi/2 or 3pi/4 lambda=3.5; …

2
ศูนย์ที่ศูนย์ความถี่สำหรับการแปลงฟูริเยร์แบบไม่ต่อเนื่อง
ฉันกำลังทำงานกับแอปพลิเคชั่นการประมวลผลภาพซึ่งใช้การแปลงฟูริเยร์แบบแยกเพื่อใช้การเบลอ / การลับภาพ แอปพลิเคชันทำงานได้ไม่มากก็น้อย แต่สิ่งที่เกี่ยวกับกลไกยังทำให้ฉันสับสน โดยเฉพาะอย่างยิ่งมันเป็นวิธีการที่กระบวนการของการศูนย์ความถี่ศูนย์จะถูกทำ ตัวอย่างที่ฉันได้เห็นก่อนการประมวลผลภาพอินพุต (ของความเข้ม greyscale) โดยการคูณมันด้วยเมทริกซ์ขนาดเท่ากับภาพอินพุตที่มีค่าเป็นโดยที่คือแถว,คือ คอลัมน์ดังนั้นรูปแบบสลับและ x y 1 - 1( - 1 )x + y(−1)x+y(-1)^{x+y}xxxYyy111−1−1-1 ตามหมายเหตุนี้เทียบเท่ากับการสลับจตุภาคของเมทริกซ์โดยการพลิกข้ามแกนและyxxxyyy ฉันเข้าใจว่าทำไมสิ่งนี้ถึงเกิดขึ้นและฉันอยากจะเครียดฉันเข้าใจว่าฉันมีโค้ด / ฟูริเยร์ทำงานฉันก็ไม่เข้าใจว่าทำไมการคูณเมทริกซ์อินพุทด้วย 1 / -1 นั้นจบลงที่กึ่งกลางองค์ประกอบศูนย์ 0 รอบ ขอบคุณ

3
เทคนิคการแบ่งส่วนภาพวันที่ทันสมัยที่สุด
ฉันกำลังอ่านข้อมูลเกี่ยวกับเทคนิคการแบ่งส่วนภาพและฉันก็สงสัยเกี่ยวกับยุคปัจจุบันอัลกอริทึมการแบ่งส่วนที่ล้ำสมัย เทคนิคการแบ่งส่วนปัจจุบันใดที่เป็น 'ต้องอ่าน' เช่นปัจจุบันใช้กันมากที่สุดในชุมชน คุณใช้เทคนิคใดในการติดต่อและพบว่ามีประสิทธิภาพและมีประโยชน์มากที่สุด (และแอปพลิเคชันใด)

3
การตรวจจับขอบสามารถทำได้ในโดเมนความถี่หรือไม่
เราสามารถใช้ประโยชน์จากข้อเท็จจริงที่ว่าส่วนประกอบความถี่สูงใน FFT ของภาพโดยทั่วไปสอดคล้องกับขอบเพื่อใช้อัลกอริทึมตรวจจับขอบในโดเมนฟูริเยร์? ฉันลองคูณตัวกรองความถี่สูงผ่านด้วย FFT ของรูปภาพ แม้ว่าการเรียงลำดับภาพที่เป็นผลลัพธ์จะตรงกับขอบ แต่ก็ไม่ได้เป็นการตรวจจับขอบที่สร้างขึ้นโดยใช้เมทริกซ์ convolution อย่างแน่นอน ดังนั้นมีวิธีใดที่คุณสามารถทำการตรวจจับขอบในโดเมนฟูริเยร์หรือเป็นไปไม่ได้เลย?

1
กู้คืนส่วนโค้งจากการรวบรวมคะแนนที่มีเสียงดัง
พื้นหลัง: ฉันพยายามสร้างระบบที่ติดตามฟองอากาศจำนวนหนึ่งในวิดีโอ ฉันกำลังใช้การตรวจจับฟองในกรณีภาพเดียวโดยใช้การแปลงแบบ Hough เนื่องจากการบดเคี้ยวเบลอและปัจจัยอื่น ๆ การตรวจจับนี้จะไม่แม่นยำ 100% ฉันกำลังปรับขั้นตอนการตรวจจับสำหรับการเรียกคืนสูงอาจมีค่าใช้จ่ายของความแม่นยำ เมื่อดำเนินการเสร็จแล้วและนำไปใช้กับลำดับของเฟรมจากวิดีโอฉันจะมีจำนวนการตรวจจับที่สามารถกำหนดลักษณะเป็นจุดในพื้นที่ 4D - ตำแหน่ง x, ตำแหน่ง y, ตำแหน่งรัศมีและดัชนีเฟรม มีขั้นตอนที่สามารถกู้โค้งจากคลาวด์ 4D point นี้ได้หรือไม่?

1
วิธีการประมวลผลภาพสำหรับการเลือกแหลมคม
ฉันมีอินพุตเป็นภาพไบนารี 3Dและผลลัพธ์ที่ต้องการด้านล่าง: การป้อนข้อมูล: ผลลัพธ์ที่ต้องการ: ฉันควรมองหาวิธีการประมวลผลภาพแบบใดหากฉันมีเพียงวัตถุแหลมคมเหลืออยู่เช่นเดียวกับผลลัพธ์ที่ต้องการด้านบน

2
ตัวชี้วัดที่ดีสำหรับการเปรียบเทียบแพทช์ภาพในเชิงคุณภาพ
ฉันพยายามที่จะ "จับคู่" แพทช์สี่เหลี่ยมเล็ก ๆ ในภาพ เมื่อดูอย่างรวดเร็วครั้งแรกดูเหมือนว่ามีเหตุผลที่จะทำการเปรียบเทียบรูปแบบระยะทางแบบยุคลิดของสองอาร์เรย์เพื่อรับค่า "ความคล้ายคลึงกัน" วิธีนี้ใช้งานได้ดีในหลายกรณี (ตัวแก้ไข "ที่ดีที่สุด" (ค่าต่ำสุด) ตามตัวชี้วัดนี้จะมีลักษณะคล้ายกับตัวแก้ไขแบบสอบถาม) อย่างไรก็ตามมีหลายกรณีที่ทำให้เกิดการแข่งขันที่แย่มาก ตัวอย่างเช่นใช้แพทช์คู่เหล่านี้: กำแพงอิฐสองแผ่นคะแนน 134 (นี่คือผลรวมของส่วนประกอบของความแตกต่างของพิกเซลแบบสัมบูรณ์เฉลี่ย): หนึ่งชิ้นของกำแพงอิฐ, หนึ่งหญ้าเต็มไปด้วยคะแนน 123! สำหรับมนุษย์ "ชัดเจน" หญ้าไม่ตรงกับอิฐ แต่ตัวชี้วัดนี้พูดเป็นอย่างอื่น ปัญหาอยู่ในรูปแบบสถิติท้องถิ่น ถ้าฉันใช้บางอย่างเช่นการเปรียบเทียบฮิสโตแกรมฉันจะสูญเสียข้อมูลเชิงพื้นที่ทั้งหมด - เช่นถ้าแพทช์เป็นหญ้าที่ด้านบนและอิฐที่ด้านล่างมันจะจับคู่กับแพทช์ที่มีหญ้าอยู่ด้านล่างและอิฐที่ด้านบน การแข่งขันอื่น "ผิดปกติอย่างเห็นได้ชัด") มีตัวชี้วัดที่ผสมผสานแนวคิดทั้งสองนี้เข้ากับค่าที่สมเหตุสมผลซึ่งจะประเมินว่า "คล้ายกัน" สำหรับคู่ที่ 1 ข้างต้น แต่ไม่เหมือนกันสำหรับตัวอย่างของแพทช์และกระจกแนวตั้งของฉันหรือไม่ ข้อเสนอแนะใด ๆ ที่ได้รับการชื่นชม!

4
การจดจำรูปภาพ
กำลังมองหาระบบโอเพนซอร์ซที่อนุญาตให้ใช้ในเชิงพาณิชย์เพื่อทำการจดจำรูปภาพในคอลเล็กชั่นภาพขนาดใหญ่และเติบโตแบบออร์แกนิกของภาพสองมิติ ปรับขนาดของภาพ มุมที่ใช้ในการถ่ายภาพ การซิงค์สีออฟเซ็ตหมายความว่าเนื่องจากความผิดปกติในการจับภาพและการแสดงผลสีของภาพต้นฉบับนั้นแตกต่างกันไปในแต่ละอินสแตนซ์ การครอบตัดภาพ การเพิ่มลายน้ำหรือข้อความ รูปแบบการโฟกัสที่เป็นไปได้ซึ่งหมายความว่าการจับภาพไม่ได้อยู่ในโฟกัสไม่ใช่ว่ามีการใช้ตัวกรองการปรับแต่งภาพ ฉันโอเคกับการต้องฝึกอบรมแอปพลิเคชันตราบใดที่ผลตอบแทนจากการทำเช่นนั้นจะลดลง - กล่าวว่าในระยะยาวฉันคาดว่าจำนวนอินสแตนซ์ 2-D จะเติบโตมากกว่าสองสามพันครั้งแรกถึงร้อย จากหลายพัน แต่นั่นเป็นระยะยาวและฉันมีความสุขที่จะมีวิธีแก้ปัญหาที่ใช้งานได้ดีกับชุดฝึกอบรม 1,000 ตัวอย่างและ 10 ตัวอย่างต่อตัวอย่าง UPDATE:สิทธิ์ใช้งานจะต้องสามารถใช้สำหรับการแจกจ่ายภายในเชิงพาณิชย์โดยไม่ต้องปล่อยซอร์สโค้ดแม้แต่ภายในสำหรับผู้ที่มีไบนารี รหัสจะไม่ถูกขายเพียงใช้ภายใน แต่ไม่ใช่ผู้ใช้ทุกคนจะสามารถเข้าถึงซอร์สโค้ดได้เพียงแค่ส่วนต่อประสาน

3
วิธีการลบพื้นหลังบางอย่างจากภาพ?
นี่เป็นภาพที่ได้จากการกรองกาบอร์ ... มีวิธีลบเส้นข้างในภาพบ้างยกเว้นความคลาดเคลื่อนสีขาวนวล ลองการวางแนวของตัวกรอง gabor อื่นแล้วให้ทำตามผลลัพธ์ต่อไปนี้: หลังจากการนวดแป้ง: พอใช้ได้ แต่ไม่ดี หลังจากมัธยฐานกรอง: ขอบคุณล่วงหน้า

3
การวิเคราะห์ภาพ - การรับรู้เส้นใย
ฉันยังใหม่กับการวิเคราะห์ภาพอย่างสมบูรณ์ คุณรู้วิธีการจำแนกภาพนี้ในลักษณะที่จะได้รับเส้นใยเท่านั้นหรือไม่? ขั้นตอนเป็นขั้นตอนจะยอดเยี่ยม แต่คำแนะนำใด ๆ ก็ชื่นชมเช่นกัน ฉันสามารถใช้ Matlab, .NET และฉันเปิดให้เครื่องมืออื่น ๆ PS: ตอนนี้อยู่คุณสามารถหาคำถามเดียวกัน

5
พารามิเตอร์ตัวกรอง Low-pass สำหรับการสุ่มตัวอย่างภาพ
ฉันต้องลดขนาดรูปภาพในปัจจัยของแนวนอนและแนวตั้ง ( , < )s y s x s y 1sxsxs_xsysys_ysxsxs_xsysys_y111 ฉันต้องการใช้ตัวกรองความถี่ต่ำก่อนการสุ่มตัวอย่างn×mn×mn\times m ฉันควรตรวจสอบพารามิเตอร์ low-pass filter (และแบบเกาส์ ) จะได้รับมันเป็นหน้าที่ของและ ?σ s x s yn,mn,mn, mσσ\sigmasxsxs_xsysys_y โดยเฉพาะผมที่น่าสนใจในกรณีที่{2}sx=sy=1/2–√sx=sy=1/2s_x=s_y=1/\sqrt{2}

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.