คำถามติดแท็ก image-processing

โดยทั่วไปแล้วการประมวลผลภาพเป็นรูปแบบของการประมวลผลสัญญาณใด ๆ ที่อินพุตเป็นรูปภาพเช่นกรอบรูปหรือวิดีโอ

1
Opencv calcHist และ calcBackProject เป็นภาษาอังกฤษธรรมดา
ฉันเริ่มทดลองกับ c ++ และ opencv เพราะฉันต้องการเรียนรู้การประมวลผลภาพ ตอนนี้การออกกำลังกายครั้งแรกของฉันคือการสร้างเครื่องตรวจจับผิวcalcHistและcalcBackProject แต่ฉันไม่เข้าใจบางสิ่ง: การตีความทางสถิติของโครงการย้อนกลับและทำไมจึงมีชื่อว่า "โครงการย้อนกลับ" calcBackProjectฉันมีความเข้าใจค่อนข้างดีของสิ่งที่ช่วงพารามิเตอร์ที่อยู่ใน แต่ฉันติดอยู่กับพารามิเตอร์ range ในcalcHistฟังก์ชั่น เพื่อความแม่นยำในการตรวจจับมากขึ้นฉันคิดว่าอาจเป็นสิ่งที่ดีที่จะใช้แบ็คกราวด์ในระดับที่มากขึ้น: ในแต่ละช่องทางของ rgb ans ในแต่ละช่องของ hsv แต่ฉันไม่รู้ว่าจะรวมผลลัพธ์ที่แตกต่างกันcalcBackProjectของช่องแยกของ rgb และ hsv ได้อย่างไร และฉันคิดว่าความเข้าใจที่ไม่ดีของฉันนั้นเกิดจากการขาดทฤษฎีที่ว่าฉันกำลังทำอะไรกับวิธีการทั้งสอง (ดูจุดแรก) ดังนั้นโปรดอธิบายฉันเป็นภาษาอังกฤษธรรมดา

1
วิธีการขจัดคราบสกปรกจากภาพ?
ฉันมีภาพที่บิดเบี้ยวและเปื้อนมาก เป็นไปได้ไหมที่จะลบคราบนี้? ภาพในภาพวาดสามารถช่วยได้หรือไม่? กรุณาช่วย แก้ไข: ภาพอื่น หลังจากใช้การกระจายแบบแอนไอโซทรอปิกและแสดงรูปภาพด้วย imagesc (MATLAB) ฉันพยายามทาสี แต่ผลลัพธ์ไม่ดีพอ มีอยู่ฉันสามารถปรับปรุงผลลัพธ์นี้ได้หรือไม่

1
ฉันสามารถใช้วิธีการแก้ไขใดเพื่อให้ได้เส้นโค้งที่แน่นที่สุด
ฉันกำลังทำงานกับภาพ MRI ของสมองที่มีบางพื้นที่ทำเครื่องหมายด้วยมือเหมือนและ ฉันพยายามที่จะเกิดขึ้นกับฟังก์ชั่น interpolating ที่จะช่วยให้ผมอธิบายเส้นโค้งดังกล่าวเพื่อที่จะสามารถใช้เครื่องเรียนรู้เทคนิคการสร้างเครื่องหมายดังกล่าวในภาพป้ายเช่นโดยอัตโนมัติและ ฉันได้พิจารณาการใช้การประมาณลูกบาศก์ spline เพื่อประมาณเส้นโค้ง แต่เท่าที่ฉันรู้ฉันจะต้องแยกเส้นโค้งออกเป็นหลายส่วนเพื่อแก้ไข ฉันอยู่ในเส้นทางที่ถูกต้องหรือมีวิธีอื่นที่ดีกว่านี้ไหม?

1
คุณสามารถอธิบายเอฟเฟกต์สำหรับการเปลี่ยนแปลงพารามิเตอร์ต่าง ๆ ของเครื่องตรวจจับขอบแสนรู้ได้หรือไม่?
คำถามสุดท้ายที่จับคู่กับเครื่องตรวจจับขอบ Canny ข้อ จำกัด ของเครื่องตรวจจับขอบ Canny คืออะไร? และ วิธีที่ดีที่สุดในการแบ่งกลุ่มเส้นเลือดในใบไม้? โครงร่างพื้นฐานของอัลกอริทึมมีดังนี้: ใช้ Gaussian Convolution ทางเลือกของσσ\sigmaจะทำที่นี่) b. สมัคร 2D อนุพันธ์ ค ติดตามผ่านสันเขาของขอบนี้และ thresholding (ตั้งค่าพิกเซลเป็นศูนย์ซึ่งไม่ได้อยู่บนขอบ) ด้วย Hysteresis Lower และ T0 และ T1 ที่สูงขึ้น (ตัวเลือกของT0T0T0 และ T1T1T1 ที่จะทำที่นี่) อ่านนี้สำหรับพื้นหลังเพิ่มเติม ในขณะที่มันอ้างว่าเป็นสิ่งที่ดีที่สุด ; เมื่อได้รับผลการปฏิบัติเรื่องปัจจัยการปรับตามที่ระบุไว้ข้างต้นσ, T0 ,σ,T0,\sigma, T0, และ T1T1T1 สร้างความแตกต่างได้มากมาย ดังนั้นหนึ่งจะเลือกพารามิเตอร์ (tweaking) เหล่านี้จริงได้อย่างไร แม้ว่าจะไม่มีวิธีหรือคุณค่าที่ชัดเจนเทคนิคทั่วไปในการรู้สิ่งนี้คืออะไร?

1
ทำไมการแพร่กระจายแอนไอโซทรอปิกจึงมีประโยชน์ในการประมวลผลภาพ?
ฉันกำลังทำงานเกี่ยวกับการแพร่ anisotropicและทั้งสองค่าสัมประสิทธิ์ที่เสนอโดยPerona และมาลิก ฉันต้องการทราบว่าการใช้การกระจายในการประมวลผลรูปภาพคืออะไร เหตุใดการแพร่กระจายของแอนไอโซทรอปิกจึงมีความสำคัญและใช้กันทั่วไปในสาขาใด

1
ขั้นตอนวิธีลดรอยหยักที่ใช้กับการ์ดแสดงผลคืออะไร
อัลกอริทึมที่ใช้โดยการ์ดวิดีโอคืออะไรเมื่อพูดถึงเช่น8xAA? ฉันคิดว่าอัลกอริทึมเกี่ยวกับการดูพิกเซลที่อยู่ใกล้เคียงเพื่อแก้ไข กระนั้นฉันได้ยินว่าการติดตั้งเป็นเพียงการยกตัวอย่างตามด้วยการลดขนาดลง

2
คำอธิบายเกี่ยวกับ Haarlets
หากว่าใครบางคนสามารถที่จะให้ฉันข้อมูลบางส่วนหรือการเชื่อมโยง ฯลฯ ... เกี่ยวกับhaarlets aka Haar เวฟเช่นคุณสมบัติ ฉันกำลังอ่านเอกสารหลายฉบับสำหรับวิทยานิพนธ์ปริญญาโทของฉันและเอกสารเหล่านี้หลายฉบับพูดถึงเรื่องเล็ก ๆ น้อย ๆ ฉันไม่สามารถรับสิ่งที่พวกเขาเป็นและวิธีการใช้งานได้ ฉันขอโทษถ้านี่เป็นคำถามพื้นฐาน แต่ฉันจะขอขอบคุณข้อมูลที่มีโครงสร้างที่ชัดเจนบางอย่างเกี่ยวกับเรื่องนี้

1
การทำความเข้าใจทฤษฎีอวกาศสเกล
ในทฤษฎีสเกล - สเกลพื้นที่สเกล - สเปซแทนสัญญาณ , (ในกรณีของภาพ ) จะได้รับเป็น: โดยที่เป็นเคอร์เนล gaussian ที่มีพารามิเตอร์และเป็น convolution โดยการเปลี่ยนพารามิเตอร์เราได้รับภาพที่ราบเรียบมากขึ้นหรือน้อยลง เนื่องจากการเป็นตัวแทน coarser ผลลัพธ์ (พารามิเตอร์ ) จะไม่มีวัตถุขนาดเล็กหรือเสียงรบกวนf(x),x=(x1,...,xd)f(x),x=(x1,...,xd)f(x), x = (x_1, ..., x_d)d=2d=2d = 2L(x,y;t)=g(x,y;t)∗f(x,y)L(x,y;t)=g(x,y;t)∗f(x,y)L(x, y; t) = g(x, y; t) * f(x, y)g(x,y;t)g(x,y;t)g(x, y; t)ttt∗∗*tttttt ประเด็นหลักคือการหาวิธีการตรวจจับคุณสมบัติแบบไม่แปรปรวนใช่ไหม? ดังนั้นสำหรับบางภาพที่มีการลดขนาดคัดลอกคุณสมบัติเช่นจุดสำคัญจะถูกตรวจพบอย่างถูกต้องแม้ว่าขนาดจะแตกต่างกันโดยไม่ต้องค้นหาจุดรบกวนอื่น ๆ ในกระดาษพวกเขากำลังใช้อนุพันธ์ normalized \ อะไรคือความหมายของการใช้ normalized อนุพันธ์มันจะช่วยในการวัดขนาดแบบ invariancy ได้อย่างไร?γγ\gammaδξ,γ−norm=tγ/2δxδξ,γ−norm=tγ/2δx\delta_{\xi, \gamma-norm} …

1
วิธีการสลายตัวของข้อมูลไม่แปรเปลี่ยนไปสู่การเปลี่ยนแปลงขนาดเล็กและขนาด?
มีวิธีการสลายตัวของข้อมูลคล้ายกับค่าลักษณะเฉพาะที่ประมาณการเมทริกซ์การฉายภาพเพื่อลดมิติข้อมูล แต่ไม่ได้นำเสนอเวกเตอร์ที่คล้ายกันมากเกินไปในระยะทาง euclidian จากกันถ้าข้อมูลต้นฉบับจากคลาสเดียวกันเปลี่ยนแปลงเล็กน้อยในระดับ กรณี). y=Ex;y=Ex;y = E x; เช่นตัวอย่างปัญหาการจำแนกคลื่นไฟฟ้าหัวใจ รอบคาร์ดิโอมีระยะเวลาต่างกัน นอกจากนี้สเกลและการเลื่อนขึ้นอยู่กับความแม่นยำในการตรวจจับจังหวะ ดังนั้นรอบคาร์ดิโอที่เป็นของคลาสเดียวกันอาจถูกคาดการณ์ว่าอยู่ไกลเนื่องจากการเปลี่ยนแปลงนั้น

2
Log-Polar DFT Based การลงทะเบียนภาพขนาดคงที่
ฉันพยายามที่จะทำลงทะเบียนภาพโดยใช้ความสัมพันธ์ขั้นตอนที่อธิบายไว้ในกระดาษเรดดี้ Chatterji ในกรณีของฉันรูปภาพอาจถูกปรับขนาดและแปลให้สัมพันธ์กัน อัลกอริทึมสำหรับการค้นหาสเกลสัมพัทธ์ตามที่ฉันเข้าใจคือ (ดู: แผนผังลำดับงานจากกระดาษ ): F1 = DFT(I1) F2 = DFT(I2) H1 = Highpass(F1) H2 = Highpass(F2) L1 = LogPolar(Magnitude(H1)) L2 = LogPolar(Magnitude(H2)) PC = PhaseCorrelate(L1,L2) PM = norm(PC) R = IDFT(PhaseCorr/PM) P = Peak(R) Scale = LogBase^P[1] สเกลให้ค่าที่ดูไร้สาระ (แตกต่างจากภาพต่อภาพและไม่ถูกต้อง) แต่ไม่สนใจสเกลวิธีการสหสัมพันธ์เฟสเดียวกันนั้นใช้ได้ผลดีสำหรับการแปล และฉันก็สงสัยว่าฉันมีปัญหากับการแปลงขั้ว - นี่คือตัวอย่างที่ฉันแก้ไขสำหรับการแปล - รูปภาพด้านซ้ายเป็นต้นฉบับและด้านขวาถูกตัดและแปล - วิธีแก้ไขจะปรากฏที่ด้านบนของ …

2
แยกส่วนที่ไม่เบลอของภาพ foucsed
ฉันมีภาพที่ถ่ายโดยกล้องโทรศัพท์มือถือโดยเน้นที่ส่วนหนึ่งของมัน ฉันต้องการที่จะรู้ว่า - ประมาณ - ซึ่งเป็นพื้นที่ที่มุ่งเน้น ตัวอย่างเช่นกล่องขอบเขตรอบ ๆ พื้นที่ที่มุ่งเน้น ตัวอย่าง:

2
อัลกอริทึมสำหรับการตรวจจับปลายนิ้วหรือเล็บ
คุณสามารถให้คำแนะนำกับฉันเกี่ยวกับสิ่งที่อาจเป็นอัลกอริธึมที่ดีที่สุดที่จะใช้สำหรับการตรวจจับปลายนิ้ว / เล็บในภาพ สิ่งแรกที่ข้ามใจของฉันคือViola - โจนส์ หลังจากทบทวนใหม่ฉันสรุปว่าอาจเป็นไปได้ที่จะใช้เพียงการแปลงฮิวจ์หลังจากใช้การตรวจจับขอบ แต่ฉันต้องการคำแนะนำเพิ่มเติม นอกจากนี้เนื่องจากนี่จะเป็นโครงการของนักเรียนที่มีจุดประสงค์ในการเรียนรู้ฉันไม่ได้รับอนุญาตให้ใช้ OpenCV หรือกรอบงานที่คล้ายกัน ด้านล่างเป็นภาพทั่วไปที่จะดำเนินการ (โปรดทราบว่าไม่ใช่มุมมองจากบนลงล่าง) ไม่จำเป็นต้องใช้การตรวจจับนิ้วหัวแม่มือ ภาพทั่วไป http://www.deviantpics.com/images/BwgPX.jpg


1
สอนเกี่ยวกับเวฟเล็ตรุ่นที่ 2 (พร้อมยก)
สำหรับการทดลอง denoising และ deconvolution ฉันต้องการใช้การแปลงเวฟเล็ตรุ่นที่ 2 (โดยใช้ขั้นตอนการยก ) กับรูปภาพ ฉันรู้ว่ามีหลายการใช้งานที่มีอยู่ แต่ส่วนใหญ่ของพวกเขาใช้ MATLAB ในขณะที่ฉันต้องการที่จะทำงานในC ++กับOpenCV เนื่องจากไม่มีการแปลงเวฟเล็ตในตัวใน OpenCV 2.x ฉันจึงวางแผนที่จะใช้งานด้วยตัวเอง (บวกจะทำให้การออกกำลังกายที่ดีสำหรับฉัน) หลังจากการวิจัยบางอย่างฉันสามารถค้นหาบทความต้นฉบับเกี่ยวกับการแปลงเจนเนอเรชั่นที่ 2 แต่ฉันยังสับสนอยู่เล็กน้อยเกี่ยวกับวิธีการทำงานของอัลกอริทึม สำหรับการอ้างอิงหลักกระดาษ [1] โดย Sweldens: The Lifting scheme: การสร้างเวฟเล็ตรุ่นที่สองฉันยังคงสับสนกับคำจำกัดความของชุดดัชนีK(j)K(j)\mathcal{K}(j)ขนาดของพวกเขาคืออะไร? พวกเขาสร้างอย่างไร ... ดังนั้นคำถามของฉัน: ไม่มีใครรู้เกี่ยวกับทรัพยากรบางอย่างเกี่ยวกับการแปลงเวฟเล็ตรุ่นที่ 2 (เอกสาร, บทเรียน, สไลด์ ... ) ที่อยู่ในรูปแบบการสอนที่คล้ายกันหรือให้มุมมองอัลกอริทึมมากกว่า (มากกว่าคณิตศาสตร์) ซึ่งจะช่วยฉันออกแบบการใช้งานของฉันเอง? ขอบคุณล่วงหน้า. อ้างอิง การอ้างอิงหลักของฉันคือ: [1] Sweldens, W. (1998) …

2
การกรองอิมเมจ“ แบบครึ่งโทนสี” สำหรับการประมวลผล OCR
ฉันมีเอกสาร PDF ที่สแกนซึ่งฉันต้องการเพิ่มเลเยอร์ข้อความที่ซ่อนอยู่ดังนั้นฉันสามารถทำดัชนีเอกสาร ฉันใช้ ghostscript tiff output ขาวดำอุปกรณ์ (tiffg4) เพื่อแยกหน้าเป็นภาพ TIFF และนี่คือตัวอย่างของสิ่งที่พวกเขามีลักษณะ: การประมวลผลภาพนี้ด้วย tesseract ไม่ได้ผลลัพธ์ที่ดี การเปลี่ยนเอาต์พุต ghostscript DPI (600, 300, 150, 96) แสดงว่ารูปภาพที่ 96 DPI ให้ผลลัพธ์ที่ดีที่สุดจาก tesseract แต่ก็ยังไม่เป็นที่น่าพอใจ ตอนนี้ฉันคิดว่าจะขอคำแนะนำว่าตัวกรองใดที่จะปรับปรุงภาพนี้สำหรับการประมวลผล OCR ฉันสามารถใช้ imagemagick หรือ numpy / scipy / ndimage

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.