คำถามติดแท็ก image-processing

โดยทั่วไปแล้วการประมวลผลภาพเป็นรูปแบบของการประมวลผลสัญญาณใด ๆ ที่อินพุตเป็นรูปภาพเช่นกรอบรูปหรือวิดีโอ

2
ภาพพิกเซลย่อยขยับโดยใช้ DFT อย่างไร
ฉันพยายามประเมินคุณภาพของวิธีการแก้ไขภาพหลายวิธีสำหรับแอปพลิเคชันที่เกี่ยวข้องกับการสร้างภาพที่เลื่อนพิกเซลย่อย ฉันคิดว่าฉันสามารถเปรียบเทียบผลลัพธ์ของการเลื่อนระดับพิกเซลย่อยโดยใช้ตัวแปรการประมาณค่าเหล่านี้ทั้งหมดกับภาพที่เลื่อนได้อย่างสมบูรณ์ แต่อาจเป็นไปไม่ได้ที่จะได้รับมัน (สิ่งใดที่จำเป็นสำหรับการแก้ไข) ฉันกำลังคิดเกี่ยวกับการใช้ DFT + ในโดเมนความถี่และฉันไม่แน่ใจว่ามันใช้งานได้จริงอย่างไรเมื่อเปรียบเทียบกับการสอดแทรกภาพอย่างชัดเจน (โดยใช้ bilinear, bicubic ฯลฯ ... ) ฉันแน่ใจว่ามันไม่สามารถสร้างภาพที่เลื่อนได้อย่างสมบูรณ์แต่ฉันไม่สามารถวางนิ้วลงบนมันได้ พิกเซลย่อยขยับด้วย DFT เทียบเท่ากับการใช้การประมาณค่าและถ้าใช่ใช้อันไหน อคติของค่าพิกเซลในภาพที่ได้รับโดยใช้วิธีนี้คืออะไร? ขอบคุณ! แก้ไข: หลังจากคิดเรื่องไปแล้วฉันคิดว่าเนื่องจาก FFT เป็นการประมาณ (ยิ่ง DFT) ของฟังก์ชันดั้งเดิมในแง่ของฮาร์โมนิก (ฟังก์ชันไซน์) ว่ามันจะเท่ากับการประมาณตรีโกณมิติบางประเภท ฉันจำสูตร "การแก้ไขอนุกรมฟูริเยร์" สำหรับข้อมูลที่ไม่ต่อเนื่องซึ่งเป็นการแก้ไขตรีโกณมิติ แต่ไม่แน่ใจว่ามันเชื่อมต่ออยู่หรือไม่

1
ความสัมพันธ์ระหว่าง DCT และ PCA
ฉันมีความรู้การใช้งานพื้นฐานของ 2D 8x8 DCT ที่ใช้ในการบีบอัดภาพและวิดีโอ ในขณะที่อ่านเกี่ยวกับการวิเคราะห์องค์ประกอบหลักการฉันสามารถเห็นความคล้ายคลึงกันได้มากมายแม้ว่า PCA จะเป็นแบบทั่วไปที่ชัดเจนกว่า เมื่อฉันอ่านเกี่ยวกับ DCT ก่อนหน้านี้มันถูกนำเสนอเสมอเกี่ยวกับ DFT ดังนั้นคำถามของฉันคือ DCT จะได้มาจากมุมมอง PCA ได้อย่างไร (แม้คำอธิบายคลื่นมือก็เพียงพอ) ขอบคุณมาก

4
การอ้างอิงใด ๆ สำหรับการแลกเปลี่ยนระหว่างซอฟต์แวร์และกลไก / เลนส์ในระบบวิชันซิสเต็มอุตสาหกรรม
ฉันอธิบายคำถามของฉันด้วยตัวอย่างง่าย ๆ ฉันสามารถออกแบบระบบวิชันซิสเต็มสำหรับการตรวจสอบสินค้าโดยอัตโนมัติด้วยข้อกำหนดหลักเหล่านี้: รูปภาพของชิ้นส่วนที่ดีจะต้องเป็นพื้นหลังสีดำและชิ้นส่วนต้องเป็นสีเทา ข้อบกพร่องจะต้องปรากฏเป็นพื้นที่สีขาวภายในพื้นที่สีเทา ความต้องการเหล่านี้ทำให้ส่วนซอฟต์แวร์ของระบบง่ายขึ้น: เพื่อจัดประเภทรายการเป็นอัลกอริธึมที่บกพร่องเพียงแค่นับพิกเซลสีขาว แต่เพื่อให้ได้อัลกอริธึมที่ตรงไปตรงมานี้ฉันจะต้องมีความสามารถในการออกแบบส่วนแสง / ออปติคอล / กลไกของระบบและส่วนนั้นอาจมีค่าใช้จ่ายมากกว่าซอฟต์แวร์ ในอดีตฉันอาจจะอ่านประโยคอย่าง"ทำมากที่สุดเท่าที่จะทำได้ด้วยกลไกและซอฟต์แวร์ให้น้อยที่สุด" ; ดูเหมือนว่าฉันจะอยู่ในหนังสือของปี 1990 (หรือ 1980) เกี่ยวกับการมองเห็นเครื่องจักรที่ใช้งานได้จริง แต่ฉันไม่พบการอ้างอิง / การอ้างอิงที่เหมาะสม

2
การคำนวณ homography ตามบรรทัดที่ตรวจพบ
ฉันรู้ว่าคุณสามารถคำนวณ homographies จากภาพไปยังระนาบกล้องโดยใช้จุดการติดต่อระหว่าง "โมเดลที่สมบูรณ์แบบ" และจุดภาพ ฉันทำเพื่อสนามฟุตบอล / และใช้การตรวจจับขอบเพื่อค้นหาเส้นสีขาวในสนาม แต่กล้องไม่ได้ครอบคลุมทุกสนามดังนั้นฉันไม่สามารถมองเห็นมุมทั้งหมดได้และฉันมีเพียงมุมเท่านั้นที่เป็นที่รู้จัก 100% ในโมเดล (ไม่มีจุดที่แตกต่างอื่น ๆ ) ดังนั้นปัญหาก็คือถ้าหากเส้นตัดกับอีกเส้นหนึ่งและทำมุมฉันก็รู้จุดภาพของเส้นไม่ใช่พิกัด "เพอร์เฟ็ค / โลกแห่งความเป็นจริง" ที่สอดคล้องกันในโมเดล มีวิธีใดบ้างที่ฉันสามารถใช้บรรทัดที่ตรวจพบเพื่อคำนวณ homography หรือแม้แต่แค่ชุดของ homographies ที่มีผู้สมัครแม้ว่าเส้นที่ตรวจพบจะไม่ตัดกันและสร้างมุม? ภาพตัวอย่างการแสดงระดับเสียงมุมมองของเราและจุดที่ระดับเสียงซึ่งฉันสามารถทราบพิกัดโลก / โมเดลที่สอดคล้องกัน (วงกลมสีเขียว) และตัวอย่างของ 2 บรรทัดที่อาจไร้ประโยชน์อย่างสมบูรณ์ตั้งแต่ในมุมมองของเรา ฉันไม่มีเงื่อนงำตรงจุดที่พวกเขาเริ่มหรือหยุดในโลกแห่งความจริง / แบบจำลองของสนาม: เส้นสีแดงเป็นตัวอย่างของเส้นที่ฉันต้องการใช้ แต่ฉันไม่ทราบพิกัดของโลกแห่งความจริงและมันก็ยากที่จะประเมินเพราะมันขึ้นอยู่กับรูปแบบของกล้อง

3
การเพิ่มความละเอียดของภาพ
ฉันรู้ว่ามีออสซิลโลสโคป ( DSA8300 ) บางตัวอย่างที่ความถี่ไม่กี่ร้อย kS / s เพื่อสร้างสัญญาณ GHz ขึ้นมาใหม่ ฉันสงสัยว่าสิ่งนี้สามารถขยายไปยังสัญญาณ 2D (รูปถ่าย) ได้หรือไม่ ฉันสามารถถ่ายภาพนิ่งเป็นชุด (เช่น 4) โดยใช้กล้อง 16MP เชิงพาณิชย์เพื่อสร้างภาพ 32MP ใหม่ได้หรือไม่? การทำสิ่งนี้จะลบนามแฝงที่ฉันมีจากแต่ละภาพหรือไม่ หากมีสิ่งใดที่พยายามทำเช่นนี้จากภาพเดียวมันจะไม่ทำงานอย่างแน่นอนเนื่องจากไม่มีการแนะนำข้อมูลใหม่ หากภาพทั้งหมดที่ถ่ายนั้นเหมือนกันฉันจะยังคงอยู่ที่จุดเดียวกับภาพหนึ่งภาพหรือไม่? ดังนั้นรูปแบบต่าง ๆ จำเป็นหรือไม่ เสียงรบกวนแบบ CCD / CMOS นั้นมีความผันแปรเพียงพอที่จะทำให้สิ่งต่าง ๆ ใช้งานได้หรือไม่? มีชื่อสำหรับเทคนิคหรืออัลกอริทึมดังกล่าวหรือไม่? ฉันควรมองหาอะไร

4
การค้นหาลวดลายเหมือนม้าลายในภาพ (การตรวจจับกึ่งกลางขอบแสงแบบมีโครงสร้างจากภาพถ่าย)
ฉันกำลังทำงานในโครงการที่มีการฉายบริเวณขอบภาพกับเรื่องและถ่ายภาพ ภารกิจคือการหาเส้นกลางของขอบซึ่งเป็นตัวแทนทางคณิตศาสตร์, เส้นโค้ง 3 มิติของการแยกระหว่างระนาบขอบและพื้นผิวของเรื่อง ภาพถ่ายเป็น PNG (RGB) และความพยายามในอดีตเคยใช้การไล่ระดับสีเทาจากนั้นจึงปรับความแตกต่างของภาพเพื่อให้ได้ภาพถ่ายขาวดำที่มีลักษณะคล้ายม้าลายซึ่งง่ายต่อการค้นหาจุดกึ่งกลางของแต่ละพิกเซลของแต่ละขอบ ปัญหาคือโดยการกำหนดค่าใหม่และด้วยการใช้ความสูงเฉลี่ยของคอลัมน์พิกเซลแยกเรามีการสูญเสียและความแม่นยำเชิงปริมาณบางอย่างซึ่งไม่ต้องการเลย ความประทับใจของฉันจากการดูภาพคือเส้นกลางอาจต่อเนื่องได้มากกว่า (มีจุดมากขึ้น) และนุ่มนวลขึ้น (ไม่นับจำนวน) หากตรวจพบได้โดยตรงจากภาพที่ไม่ผ่านเกณฑ์ (เช่น RGB หรือโทนสีเทา) โดยวิธีการทางสถิติ (น้ำท่วม / วนซ้ำวนซ้ำอะไรก็ตาม) ด้านล่างเป็นภาพตัวอย่างจริง: ข้อเสนอแนะใด ๆ ที่จะได้รับการชื่นชมมาก!

2
การตรวจจับจำนวนเส้นด้ายในภาพผ้า
ฉันเป็นผู้ใช้งานมือใหม่ในการประมวลผลภาพและทำงานในโครงการเพื่อกำหนดจำนวนเส้นด้ายในภาพสิ่งทอเช่น warps และ wefts (ตั้งฉากและเส้นด้ายขนานกับแกน x) ฉันพยายามตรวจสอบเส้นด้ายด้วยการหาผลรวมของคอลัมน์และแถวสำหรับการแปรปรวนและผ้าตามลำดับ แต่ดูเหมือนจะไม่ทำงานเพราะภาพไม่ได้โฟกัสและคมชัดมาก นอกจากนี้วิธีการนี้ยังไวต่อการจัดเรียงของเส้นด้ายในเนื้อผ้า กรุณาเสนออัลกอริทึมที่ดีกว่าถ้าเป็นไปได้สำหรับการตรวจสอบเส้นด้าย นอกจากนี้หากมีความเป็นไปได้ที่จะทำให้เส้นด้ายตรงสำหรับภาพที่จับทุก ฉันลอง IMROTATE แต่สร้างพื้นที่สีดำในภาพซึ่งรบกวนผลรวมของแถวและอัลกอริทึมที่ล้มเหลว ความช่วยเหลือใด ๆ ในเรื่องนี้จะมีค่ามากสำหรับฉัน ขอบคุณ

2
ความสัมพันธ์ระหว่างซิกมาใน Laplacian ของ Gaussian กับซิกมาสทั้งสองในความแตกต่างของเกาส์คืออะไร?
ฉันเข้าใจว่าตัวกรอง Laplacian-of-Gaussian สามารถประมาณได้โดยตัวกรอง Difference-of-Gaussians และอัตราส่วนของซิกมาสทั้งสองสำหรับหลังควรเป็น 1: 1.6 สำหรับการประมาณที่ดีที่สุด อย่างไรก็ตามฉันไม่แน่ใจว่า sigmas ทั้งสองในความแตกต่างของ Gaussians เกี่ยวข้องกับ sigma สำหรับ Laplacian ของ Gaussian ได้อย่างไร sigma ที่เล็กกว่าในอดีตเท่ากับ sigma ของยุคหลังหรือไม่? ซิกม่าที่ใหญ่กว่านี้ไหม? หรือความสัมพันธ์เป็นอย่างอื่น?

2
การประมาณโฟกัสอัตโนมัติ?
การวิเคราะห์แบบใดที่อาจใช้กับชุดการฝึกอบรมภาพสองมิติขาวดำหรือบิตแมปเพื่อประเมินหรือเปรียบเทียบคุณภาพสัมพัทธ์ของการเป็น "อยู่ในโฟกัส" มีวิธีที่มีประสิทธิภาพในการคำนวณมาตรวัดแบบสเกลาร์ในบางสิ่งบางอย่างเช่นความเปรียบต่างโดยรวมความสว่างของแสงหรือสิ่งประดิษฐ์อื่น ๆ ที่เกิดจากการเบลอของโฟกัสนอกหรือไม่

1
รูปภาพ Denoising พร้อมการรักษาขอบที่ดีขึ้น
ฉันมีภาพอินพุต: และเอาท์พุทของการตรวจจับหลอดเลือดดำสำหรับใบไม้โดยใช้ตัวกรอง Gabor แต่ผลลัพธ์นั้นเสียงดังมาก: ฉันลองใช้การผันแปรโดยรวม denoising แต่ผลลัพธ์ไม่ดี: อย่างไรก็ตามฉันไม่ต้องการที่จะหลวมรายละเอียดที่ดีในหลอดเลือดดำของใบไม้ดังนั้นตัวกรองเฉลี่ยจะไม่เหมาะกับปัญหาของฉัน

1
การตรวจจับข้อภาษาอาหรับที่ขยายหลายบรรทัด
ฉันต้องสร้างแอพคัมภีร์กุรอานและฉันต้องการอ่านข้อเมื่อผู้ใช้สัมผัส ปัญหาที่ฉันเผชิญคือบางข้ออาจขยายไปถึงหนึ่งและครึ่งบรรทัด (ข้อสีแดงเน้น) หรือเพียงแค่พอดีในหนึ่งในสี่ของบรรทัด (ข้อสีเขียวเน้น) ดังนั้นการเพิ่มแต่ละข้อใน textview หรือมุมมองอื่น ๆ จะไม่ทำงาน ฉันต้องการตรวจจับข้อเช่นสีแดงในภาพที่สอง ฉันมีไฟล์เสียงสำหรับข้อดังนั้นไม่จำเป็นต้องแปลงข้อความเป็นคำพูด

2
ระบุจุดที่ถูกต้องในการวางฉลาก
ในภาพที่แสดงด้านล่างผมมีชุดข้อมูล 2D [0,1,2,3]ที่ฉันได้ระบุสี่กลุ่มที่มีป้ายกำกับ ฉันกำลังมองหาอัลกอริทึมในการวางฉลากด้วยวิธีธรรมชาติสำหรับแต่ละรูปร่าง การเดาครั้งแรกของฉันคือการวางพวกเขาใน "จุดศูนย์กลางมวล" ของคลัสเตอร์ซึ่งแสดงอยู่ด้านล่าง สำหรับกลุ่มที่ต่อเนื่องกันทำงานได้ดี สำหรับกลุ่มที่มีรูปร่างเหมือนในคลัสเตอร์0อย่างไรก็ตามวิธีการล้มเหลว หากไม่มีการใช้คำอธิบายภาพจะมีวิธีใดที่ดีกว่าในการวางป้ายกำกับในภาพนี้ * ธรรมชาติที่นี่อยู่ในระดับหนึ่ง แต่ประเด็นของฉลากคือการช่วยให้ผู้ดูเชื่อมโยงภูมิภาคบางแห่งในระนาบ xy ด้วยตัวเลข

2
ฉันจะดึงข้อมูลพื้นผิวโดยใช้ GLCM และจำแนกประเภทโดยใช้ตัวแยกประเภท SVM ได้อย่างไร
ฉันอยู่ในโครงการการแบ่งส่วนและจำแนกเนื้องอกของตับ ฉันใช้ Region Growing และ FCM สำหรับการแบ่งส่วนตับและเนื้องอกตามลำดับ จากนั้นฉันใช้เมทริกซ์ระดับสีเทาร่วมเกิดขึ้นสำหรับการแยกคุณลักษณะของพื้นผิว ฉันต้องใช้ Support Vector Machine เพื่อจัดหมวดหมู่ แต่ฉันไม่ทราบวิธีปรับเวกเตอร์คุณลักษณะให้เป็นมาตรฐานเพื่อที่ฉันจะสามารถให้มันเป็นอินพุตของ SVM ได้ มีใครบอกวิธีเขียนโปรแกรมใน Matlab ได้บ้าง ในโปรแกรม GLCM ฉันให้ภาพที่แบ่งกลุ่มเนื้องอกเป็นอินพุต ฉันถูกต้องหรือไม่ ถ้าเป็นเช่นนั้นฉันคิดว่าผลลัพธ์ของฉันก็จะถูกต้องด้วย การเข้ารหัส glcm ของฉันเท่าที่ฉันได้ลองคือ I = imread('fzliver3.jpg'); GLCM = graycomatrix(I,'Offset',[2 0;0 2]); stats = graycoprops(GLCM,'all') t1= struct2array(stats) I2 = imread('fzliver4.jpg'); GLCM2 = graycomatrix(I2,'Offset',[2 0;0 2]); stats2 = …

2
วิธีการใดที่ใช้สำหรับการแยกแยะความแตกต่างของเสียง (ดนตรี?)
ฉันพยายามค้นคว้าและหาวิธีที่ดีที่สุดในการโจมตีปัญหานี้ มันเลาะเลียบไปกับการประมวลผลเพลงการประมวลผลภาพและการประมวลผลสัญญาณและดังนั้นจึงมีวิธีมากมายในการดู ฉันต้องการสอบถามวิธีการที่ดีที่สุดในการเข้าหามันเนื่องจากสิ่งที่อาจดูซับซ้อนในโดเมน sig-proc บริสุทธิ์อาจเป็นเรื่องง่าย (และแก้ไขแล้ว) โดยผู้ที่ทำภาพหรือการประมวลผลเพลง อย่างไรก็ตามปัญหามีดังนี้: หากคุณยกโทษให้ฉันด้วยการวาดปัญหาเราจะเห็นสิ่งต่อไปนี้: f1f1f_1f4f4f_4 f1f1f_1 f1f1f_1 ปัญหาคือในทางใดที่ฉันจะแก้ไขปัญหานี้เช่นฉันสามารถเขียนลักษณนามที่สามารถแยกแยะระหว่างสัญญาณ -1 สัญญาณ 2 และสัญญาณ 3 นั่นคือถ้าคุณป้อนสัญญาณสัญญาณใดสัญญาณหนึ่งมันควรจะบอกได้ว่าสัญญาณนี้เป็นเช่นนั้น สิ่งที่ดีที่สุดของลักษณนามจะให้เมทริกซ์ความสับสนในแนวทแยง? บริบทเพิ่มเติมบางอย่างและสิ่งที่ฉันคิดเกี่ยวกับป่านนี้: อย่างที่ฉันพูดไปนี้เลาะเลียบทุ่งจำนวนมาก ฉันต้องการสอบถามเกี่ยวกับวิธีการที่อาจมีอยู่ก่อนที่ฉันจะนั่งลงและไปทำสงครามกับสิ่งนี้ ฉันไม่ต้องการประดิษฐ์ล้ออีกครั้งโดยไม่ได้ตั้งใจ นี่คือความคิดบางอย่างที่ฉันได้มองจากมุมมองที่แตกต่างกัน มุมมองการประมวลผลสัญญาณ: สิ่งหนึ่งที่ฉันได้ดูคือทำการวิเคราะห์ Cepstralและจากนั้นอาจใช้Gabor Bandwidthของ cepstrum ในการแยกแยะสัญญาณ -3 จากอีก 2 และจากนั้นวัดจุดสูงสุดสูงสุดของ cepstrum ในการแยกสัญญาณ - 1 จากสัญญาณ -2 นั่นเป็นโซลูชันการทำงานการประมวลผลสัญญาณปัจจุบันของฉัน จุดยืนของการประมวลผลภาพ: ที่นี่ฉันกำลังคิดอยู่เพราะในความเป็นจริงฉันสามารถสร้างภาพที่มีสเปคตรัมได้หรือเปล่า ฉันไม่คุ้นเคยอย่างใกล้ชิดกับส่วนนี้ แต่สิ่งที่เกี่ยวกับการทำ 'เส้น' ตรวจจับโดยใช้การแปลง Houghแล้วอย่างใด 'นับ' …

4
นี่เป็นวิธีที่ถูกต้องสำหรับการแก้ไขสัญญาณรบกวนแบบคงที่หรือไม่?
ขณะนี้ฉันมีส่วนร่วมในโครงการที่เกี่ยวข้องกับการตั้งโปรแกรมเซ็นเซอร์ภาพ เซ็นเซอร์ของเราให้เสียงเราดังนั้นเราต้องการแก้ไขให้ถูกต้อง มีคนอื่นในโปรเจ็กต์เกิดความคิดที่จะถ่ายภาพ "สีดำ" เช่นใส่ฝาปิดเลนส์และถ่ายภาพที่มีความหมายว่าเป็นสีดำทั้งหมด (เห็นได้ชัดว่ามันไม่ใช่เพราะเสียงรบกวน) ณ จุดนี้ในการจับภาพต่อมาเขาใช้ค่าพิกเซลจากภาพสีดำและลบออกจากภาพที่ถ่ายเป็นประจำ ภาพดูดีขึ้นและเสียงส่วนใหญ่จะถูกลบออก แต่ฉันไม่เชื่อว่านี่เป็นวิธีที่ดีที่สุดในการลบเสียงรบกวนเนื่องจากสาเหตุดังต่อไปนี้: ช่วงของภาพคงที่คือ [-172 194] (ค่า 366) เมื่อเทียบกับช่วงมาตรฐานของ [0 255] เมื่อวาดใหม่มันจะอยู่ในช่วง [0 255] และดูดีขึ้น แต่ฉันเชื่อว่านี่ไม่ถูกต้อง ฉันควรพูดถึงว่าภาพใหม่ถ่ายในที่แสงน้อย วิธีนี้ถูกต้องสำหรับการลบเสียงรบกวนหรือไม่? ทำไมหรือทำไมไม่?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.