คำถามติดแท็ก image-processing

โดยทั่วไปแล้วการประมวลผลภาพเป็นรูปแบบของการประมวลผลสัญญาณใด ๆ ที่อินพุตเป็นรูปภาพเช่นกรอบรูปหรือวิดีโอ

2
ตัวอย่างของแอปพลิเคชันการถดถอยเชิงเส้น / โลจิสติก
ฉันสงสัยเกี่ยวกับแอพพลิเคชั่นที่เรียบง่ายเป็นพิเศษของการถดถอยเชิงเส้นหรือลอจิสติกในการประมวลผลสัญญาณ ฉันเป็นผู้ชายคณิตศาสตร์ที่ถูกขอให้อธิบายวิธีการทางคณิตศาสตร์ให้กับผู้ประมวลผลสัญญาณ / ภาพและฉันต้องการใช้ตัวอย่างง่ายๆสองสามอย่างที่เกี่ยวข้องกับฟิลด์ของพวกเขา แต่ฉันรู้เพียงเล็กน้อยเกี่ยวกับการประมวลผลภาพ ดังนั้นฉันไม่ได้มองหาสิ่งที่ซับซ้อน (ฉันไม่รู้เรื่องดังนั้นเรื่องที่ง่ายกว่าดีกว่า; ฉันแค่หวังที่จะหาสิ่งที่แสดงให้เห็นถึงการบังคับใช้อัลกอริธึมเหล่านี้) ขอขอบคุณสำหรับความช่วยเหลือของคุณ!

2
การแปลงเวฟเล็ต
ฉันต้องการที่จะทำการแปลงเวฟเล็ตแบบไม่ต่อเนื่อง Haar 2D และผกผัน DWT บนภาพ คุณช่วยอธิบายการแปลงเวฟเล็ตฮาร์ตแบบไม่ต่อเนื่อง 2D และ DWT แบบผกผันในภาษาง่าย ๆ และอัลกอริทึมที่ใช้ซึ่งฉันสามารถเขียนโค้ดสำหรับ 2D haar dwt ได้ไหมข้อมูลที่ให้ใน google นั้นมีเทคนิคเกินไปฉันเข้าใจสิ่งพื้นฐานเช่นการแบ่งภาพเป็น 4 วงย่อย: LL, LH, HL, HH แต่ฉันไม่เข้าใจวิธีการเขียนโปรแกรมเพื่อดำเนินการ DWT และ IDWT ฉันยังอ่านว่า DWT นั้นดีกว่า DCT เนื่องจากมันทำกับรูปภาพโดยรวมแล้วมีคำอธิบายบางอย่างที่ข้ามส่วนหัวของฉันฉันอาจผิดที่นี่ แต่ฉันคิดว่าเทคนิคการบีบอัด DWT และ DCT เพราะขนาดภาพจะลดลงเมื่อดำเนินการ DWT หรือ DCT กับพวกเขาพวกคุณแบ่งปันส่วนหนึ่งของความรู้ของคุณและปรับปรุงความรู้ของฉัน ขอบคุณ Re: มีอะไรที่เกี่ยวข้องกับรูปแบบภาพ "ค่าของพิกเซล" ที่ใช้ใน DWT คืออะไรฉันคิดว่ามันเป็นค่า …

4
วิธีการรับรู้สีจากแผนภูมิสี?
ฉันกำลังพัฒนาแอปพลิเคชันการมองเห็นที่ใช้แผนภูมิสีด้านล่างและกล้องเพื่อแยกสีของแต่ละแพทช์ในแผนภูมิ ในการทำเช่นนั้นฉันต้องตรวจจับพื้นที่แผนภูมิในภาพก่อนและจับคู่พื้นที่กับเทมเพลตที่มีอยู่ซึ่งมีตำแหน่งของแพตช์ คำถามของฉัน: ฉันต้องตรวจจับบริเวณที่มีการแก้ไขสีโดยการจำมุมทั้งสี่ของแผนภูมิ คุณสามารถเห็นมุมที่สี่เหลี่ยมเล็ก ๆ ของสิ่งที่ใส่เข้าไประบุในภาพด้านล่าง ฉันรู้วิธีหนึ่งในการดำเนินการคือให้ผู้ใช้เลือกมุมเหล่านั้นด้วยการคลิก แต่จะมีวิธีใดในการตรวจจับมุมทั้งสี่โดยอัตโนมัติจากภาพ

4
การไหลของแสง / การเปลี่ยนภาพโดยประมาณอย่างรวดเร็ว
ฉันต้องการตรวจสอบความเร็วของกล้องที่แพนกล้อง (ทั้งแนวนอน / แนวตั้ง) เพื่อเตือนผู้ปฏิบัติงานให้ชะลอตัวลง ภาพทั้งหมดกำลังเคลื่อนไหวเป็นบล็อกฉันไม่ต้องการทิศทางที่แท้จริง (แม้ว่า H หรือ V จะเป็นโบนัส) และฉันต้องการเพียงขนาดโดยประมาณ - เช่น ทริกเกอร์ถ้ามากกว่า 'N' พิกเซลเปลี่ยนระหว่างเฟรม ภาพมีขนาดใหญ่และโดยทั่วไปจะมีฉากที่มีคอนทราสต์ต่ำที่สม่ำเสมอฉันไม่มีไฮไลท์ที่ชัดเจนในการติดตาม ฉันต้องทำแบบเรียลไทม์ (60fps) และไม่ต้องใช้ CPU ทั้งหมด วิธีแก้ปัญหาของ Niave คือเลือก RoI ที่กึ่งกลางหาขอบคำนวณความคล้ายคลึงกันระหว่างคู่ของเฟรมเลื่อนหนึ่งในเฟรมซ้าย / ขวา / ขึ้น / ลงทีละพิกเซลทำซ้ำ - ค้นหาขั้นต่ำ ฉันสงสัยว่ามีวิธีการที่ชาญฉลาดกว่านี้หรือไม่?

4
วิธีทำ De-Houghing ของรูปภาพที่แปลงสภาพ Hough
ฉันทำงานกับรหัสที่พบในรหัส Rosettaเพื่อสร้างการแปลง Hough ตอนนี้ฉันต้องการค้นหาทุกบรรทัดในภาพ ในการทำเช่นนั้นฉันต้องการค่าρและθของแต่ละจุดสูงสุดในพื้นที่ Hough ผลลัพธ์ตัวอย่างสำหรับรูปห้าเหลี่ยมมีลักษณะดังนี้: ฉันจะหาพิกัด [θ, ρ] เดี่ยวสำหรับ 'ฮอตสปอต' ที่มองเห็นได้ในพื้นที่ Hough ได้อย่างไร

1
อะไรคือความเชื่อมโยงระหว่าง homography ที่คำนวณจาก 2 ภาพและ homography ที่คำนวณเหนือรูปภาพเดียวกันคว่ำ?
ด้วยOpenCVฉันคำนวณการถ่ายภาพระหว่างพูดภาพสองภาพนี้: และ ไม่ต้องกังวลกับสีขาวแปลก ๆ ทางด้านขวามันเป็นเพราะตัวยึดสมาร์ทโฟนที่ฉันใช้ homography ที่กำหนดโดยfindHomography ()ฟังก์ชั่น (ใช้คะแนนที่ตรวจพบกับตัวตรวจจับคุณลักษณะอย่างรวดเร็วและตัวจับคำอธิบาย HammingLUT ) คือ: A = [ 1.412817430564191, 0.0684947165270289, -517.7751355800591; -0.002927297251810, 1.210310757993256, 39.56631316477566; 0.000290600259844, -9.348301989015293e-05, 1] ตอนนี้ฉันใช้กระบวนการเดียวกันเพื่อคำนวณ homography ระหว่างภาพเดียวกันที่หมุนไป 180 องศา (กลับหัว) โดยใช้imagemagick (ตามความเป็นจริงฉันสนใจที่จะทราบความสัมพันธ์ของการหมุน 90 หรือ 270 องศา ... ) ที่นี่พวกเขาคือ: และ ด้วยภาพเหล่านี้การทำตัวพิมพ์จะกลายเป็น: B = [ 0.7148688519736168, 0.01978048500375845, 325.8330631554814; -0.1706219498833541, 0.8666521745094313, 64.72944905752504; …

2
การค้นหารัศมี r ของทรงกลมที่ทับซ้อนกันในภาพ 3 มิติ
ปัญหาปัจจุบันของฉัน: ฉันมีอิมเมจไบนารีอินพุท 3D (เมทริกซ์สามมิติที่มีเพียง 0 และ 1) ที่ประกอบด้วยจำนวนสุ่มของทรงกลมที่มีรัศมี r เราไม่ทราบว่ามีทรงกลมจำนวนเท่าใดในภาพ ทรงกลมทั้งหมดมีรัศมี r เท่ากัน แต่เราไม่รู้รัศมี r ทรงกลมอยู่ทั่วในภาพและสามารถซ้อนทับกันได้ ภาพตัวอย่างได้รับด้านล่าง ความต้องการของฉัน: รัศมี r คืออะไร? ขณะนี้ฉันเพิ่งเรียบภาพเพื่อกำจัดแกน z และทำการตรวจจับขอบและฉันพยายามแปลง Hough โดยใช้: http://rsbweb.nih.gov/ij/plugins/hough-circles.html อย่างไรก็ตามด้วยการแปลงแบบ Hough ฉันเห็นว่าต้องระบุรัศมีต่ำสุดของรัศมีสูงสุดและจำนวนวงกลม ฉันได้ลองสองสามครั้งด้านล่าง: ด้วยพารามิเตอร์ที่ถูกต้อง Hough Transform สามารถตรวจจับวงกลมได้ดี แต่ในการประยุกต์ใช้จริงผมไม่ทราบว่าหลายทรงกลมมีและทำให้โปรแกรมพยายามที่จะคาดเดาต่ำสุดและสูงสุดรัศมีดูเหมือนว่าไม่เป็นไปได้ มีวิธีอื่นในการทำสิ่งนี้ให้สำเร็จหรือไม่? Cross-link: /math/118815/finding-radius-r-of-the-overlappable-spheres-in-3d-image

2
ค้นหาบรรทัดที่ระบุในรูปภาพ
ฉันต้องการค้นหาเส้นแบ่งระหว่างสีฟ้าและเทาในภาพต่อไปนี้: ยิ่งไปกว่านั้นจุดสิ้นสุดของบรรทัดนั้น Hough เปลี่ยนเป็นตัวเลือกหรือไม่? ถ้าใช่ฉันจะตั้งค่ารูปภาพก่อนใช้ Hough ได้อย่างไร วิธีแก้ปัญหานี้จะเป็นประโยชน์

1
คุณสมบัติการตรวจจับพื้นผิวและภูมิภาคบนภาพ
ฉันมีปัญหาที่น่าสนใจที่ฉันพยายามแก้ไข ตัวอย่างเช่นถ้าเรามีภาพขาวดำที่มีพื้นผิวสองแบบ (A และ B) ฉันสนใจที่จะรู้ค่าพิกเซลของขอบเขตที่จะครอบคลุมพื้นผิวแต่ละรายการอย่างสมบูรณ์ ฉันคิดว่าการใช้ความสัมพันธ์ข้ามซึ่งจะทำให้ฉันเป็นกลุ่มของตำแหน่งของแม่แบบ (ตำนาน) ในภาพ แต่มีวิธีการที่จะใช้เพื่อให้ได้ค่าพิกเซลของขอบเขต (ปกติเหล่านี้จะผิดปกติ)? นอกจากนี้ยังมีวิธีอื่นที่ดีกว่าในการทำเช่นนี้? ตัวอย่างในโลกแห่งความเป็นจริงในการตรวจจับภูมิภาคของปริมาณน้ำฝนบนแผนที่แสดงปริมาณน้ำฝนสามระดับในหนึ่งปี แต่ละระดับจะถูกกำหนดพื้นผิวที่มีอยู่ในตำนานซึ่งจะใช้สำหรับการจับคู่พื้นผิวในภาพเดียวกัน

2
การตรวจจับพื้นผิว
ส่วนหนึ่งของพื้นที่ขนาดใหญ่ของสีเทา (ตั้งแต่สีขาวเป็นสีดำ) จากภาพเป็นอย่างไร (ถ้าคุณรู้สิ่งนี้ใน opencv คุณอาจตอบโดยพูดว่าคุณจะทำอะไรใน opencv) ตัวอย่างเช่นให้ภาพนี้: คุณเห็นว่านี่เป็นพื้นที่สีเทาขนาดใหญ่และเห็นได้อย่างชัดเจนจากส่วนที่เหลือ คุณจะแบ่งส่วนนี้ได้อย่างไรหากพื้นที่นี้มีเฉดสีเทาและต้องทำงานแบบเรียลไทม์ ขอบคุณล่วงหน้า

1
เมทริกซ์ความสัมพันธ์ข้าม
ในกลุ่มของฉันเราได้พัฒนาอัลกอริทึมที่แสดงข้อมูลนามธรรมจากระบบกลไกควอนตัมเป็นภาพ ด้วยวิธีนี้เราได้ภาพที่เกี่ยวข้องซึ่งมีข้อมูลเดียวกันและทำให้คุณสมบัติบางอย่างสามารถมองเห็นได้ด้วยระบบควอนตัม หนึ่งในคุณสมบัติที่สำคัญนั้นได้มาจาก "cross-correlation matrix": เราแบ่งภาพออกเป็น L × LL×LL\times Lภาพย่อยและค้นหา "เหลื่อม" ระหว่างคู่ทั้งหมด ดังนั้นรายการสำหรับรูปภาพย่อยผมii และ Jjj, Aฉัน, JAi,jA_{i,j}เป็นตัวเลขที่ระบุว่ามีความคล้ายคลึงกันอย่างไร มิติของเมทริกซ์คือL2×L2L2×L2L^2\times L^2. คำถามคือ: เป็นเมทริกซ์นี้หรือญาติสนิทที่ใช้ในการประมวลผลภาพ? ถ้ามีจะมีชื่อหรือไม่? มันมีคุณสมบัติที่น่าสนใจหรือช่วยอัลกอริทึมที่เป็นประโยชน์หรือไม่?

2
วิธีการใช้การแปลง Hough แบบไล่ระดับสี
ฉันพยายามใช้การแปลง Hough สำหรับการตรวจจับขอบและต้องการใช้ภาพไล่ระดับสีเป็นพื้นฐาน สิ่งที่ฉันได้ทำเพื่อให้ห่างไกลได้รับภาพIที่มีขนาด[M,N]และอนุพันธ์บางส่วนของมันgx, คือการคำนวณมุมการไล่ระดับสีในแต่ละพิกเซลgy ในทำนองเดียวกันผมคำนวณขนาดการไล่ระดับสีเป็นthetas = atan(gy(x,y) ./ gxmagnitudes = sqrt(gx.^2+gy.^2) เพื่อสร้างการแปลง Hough ฉันใช้รหัส MATLAB ต่อไปนี้: max_rho = ceil(sqrt(M^2 + N^2)); hough = zeros(2*max_rho, 101); for x=1:M for y=1:N theta = thetas(x,y); rho = x*cos(theta) + y*sin(theta); rho_idx = round(rho)+max_rho; theta_idx = floor((theta + pi/2) / pi * 100) …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.