คำถามติดแท็ก image-processing

อะไรก็ตามที่เกี่ยวข้องกับการประมวลผลภาพดิจิทัลเช่นทฤษฎีและเทคนิคที่ใช้ในการดึงหรือจัดการข้อมูลจากภาพดิจิทัล

6
OpenCV C ++ / Obj-C: การตรวจจับกระดาษ / การตรวจจับสี่เหลี่ยม
ฉันนำตัวอย่างการตรวจจับสี่เหลี่ยมจัตุรัส OpenCV ไปใช้ในแอปพลิเคชันทดสอบของฉันได้สำเร็จแล้ว แต่ตอนนี้ต้องกรองผลลัพธ์เนื่องจากมันค่อนข้างยุ่ง - หรือรหัสของฉันผิด ฉันสนใจในจุดสี่มุมของกระดาษเพื่อลดการเอียง (เช่นนั้น ) และการประมวลผลเพิ่มเติม ... อินพุตและเอาต์พุต: ภาพต้นฉบับ: คลิก รหัส: double angle( cv::Point pt1, cv::Point pt2, cv::Point pt0 ) { double dx1 = pt1.x - pt0.x; double dy1 = pt1.y - pt0.y; double dx2 = pt2.x - pt0.x; double dy2 = pt2.y - pt0.y; return …

11
การจดจำใบหน้าห้องสมุด [ปิด]
ปิด. คำถามนี้ไม่เป็นไปตามหลักเกณฑ์กองมากเกิน ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นไปตามหัวข้อสำหรับ Stack Overflow ปิดให้บริการใน6 ปีที่ผ่านมา ปรับปรุงคำถามนี้ ฉันกำลังมองหาห้องสมุดจดจำใบหน้าฟรีสำหรับโครงการมหาวิทยาลัย ผมไม่ได้มองหาการตรวจหาใบหน้า ฉันกำลังมองหาการรับรู้ที่แท้จริง นั่นหมายถึงการค้นหารูปภาพที่มีใบหน้าหรือไลบรารีที่ระบุซึ่งคำนวณระยะทางระหว่างใบหน้าที่ระบุ ขณะนี้ฉันใช้OpenCVเพื่อตรวจจับใบหน้าและอัลกอริทึมEigenfaceคร่าวๆเพื่อการจดจำ แต่ฉันคิดว่าควรมีบางสิ่งบางอย่างที่นั่นพร้อมกับประสิทธิภาพที่ดีกว่าอัลกอริทึม Eigenface ที่เขียนขึ้นเอง ฉันไม่ได้พูดถึงความเร็วในการแสดงฉันกำลังมองหาห้องสมุดที่มีผลลัพธ์ที่ดีกว่าวิธี Eigenface อย่างง่าย ฉันดูจางๆ แต่ดูเหมือนว่าห้องสมุดจะไม่สามารถใช้ซ้ำได้สำหรับแอปพลิเคชันของฉันเอง ฉันมีความสุขกับห้องสมุดใน Python, Java, C ++, C หรืออะไรทำนองนั้น สิ่งที่ดีที่สุดก็คือถ้ามันสามารถทำงานบนเครื่อง Windows ได้เพราะฉันพึ่งใช้รหัสภายนอกของ Windows เท่านั้นในตอนนี้

7
การดาวน์โหลดอิมเมจด้วย node.js [ปิด]
ปิด คำถามนี้จะต้องมีมากขึ้นมุ่งเน้น ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้มุ่งเน้นที่ปัญหาเดียวโดยแก้ไขโพสต์นี้ ปิดให้บริการใน2 ปีที่ผ่านมา ปรับปรุงคำถามนี้ ฉันพยายามเขียนสคริปต์เพื่อดาวน์โหลดภาพโดยใช้ node.js นี่คือสิ่งที่ฉันมี: var maxLength = 10 // 10mb var download = function(uri, callback) { http.request(uri) .on('response', function(res) { if (res.headers['content-length'] > maxLength*1024*1024) { callback(new Error('Image too large.')) } else if (!~[200, 304].indexOf(res.statusCode)) { callback(new Error('Received an invalid status code.')) } else …

5
วิธีการปรับขนาดภาพด้วย OpenCV2.0 และ Python2.6
ฉันต้องการใช้ OpenCV2.0 และ Python2.6 เพื่อแสดงภาพที่ปรับขนาดแล้ว ผมใช้และนำมาใช้ตัวอย่างที่http://opencv.willowgarage.com/documentation/python/cookbook.htmlแต่โชคร้ายรหัสนี้สำหรับ OpenCV2.1 และดูเหมือนจะไม่ได้ทำงานกับ 2.0 นี่รหัสของฉัน: import os, glob import cv ulpath = "exampleshq/" for infile in glob.glob( os.path.join(ulpath, "*.jpg") ): im = cv.LoadImage(infile) thumbnail = cv.CreateMat(im.rows/10, im.cols/10, cv.CV_8UC3) cv.Resize(im, thumbnail) cv.NamedWindow(infile) cv.ShowImage(infile, thumbnail) cv.WaitKey(0) cv.DestroyWindow(name) เนื่องจากฉันไม่สามารถใช้ cv.LoadImageM ฉันใช้ cv.LoadImage แทนซึ่งไม่มีปัญหาในแอปพลิเคชันอื่น อย่างไรก็ตาม cv.iplimage ไม่มีแถวแอตทริบิวต์, cols หรือขนาด …

9
อัลกอริทึมเพื่อเปรียบเทียบภาพสองภาพ
ไฟล์รูปภาพที่แตกต่างกันสองไฟล์ (ในรูปแบบที่ฉันเลือก) ฉันต้องเขียนโปรแกรมเพื่อทำนายโอกาสหากไฟล์นั้นเป็นสำเนาที่ผิดกฎหมายของไฟล์อื่น ผู้เขียนสำเนาอาจทำสิ่งต่าง ๆ เช่นหมุนหมุนลบหรือเพิ่มรายละเอียดเล็กน้อย (รวมถึงการเปลี่ยนมิติของภาพ) คุณรู้จักอัลกอริทึมในการทำงานประเภทนี้หรือไม่?

7
วิธีผสานภาพ png โปร่งใสเข้ากับภาพอื่นโดยใช้ PIL
ฉันมีรูปแบบ png โปร่งใส "foo.png" และฉันเปิดภาพอื่นด้วย im = Image.open("foo2.png"); ตอนนี้สิ่งที่ฉันต้องการคือการรวม foo.png กับ foo2.png (foo.png มีข้อความบางส่วนและฉันต้องการพิมพ์ข้อความนั้นบน foo2.png)

9
แยกข้อความ OpenCV
ฉันพยายามค้นหากรอบข้อความในรูปภาพและขณะนี้ใช้วิธีนี้: // calculate the local variances of the grayscale image Mat t_mean, t_mean_2; Mat grayF; outImg_gray.convertTo(grayF, CV_32F); int winSize = 35; blur(grayF, t_mean, cv::Size(winSize,winSize)); blur(grayF.mul(grayF), t_mean_2, cv::Size(winSize,winSize)); Mat varMat = t_mean_2 - t_mean.mul(t_mean); varMat.convertTo(varMat, CV_8U); // threshold the high variance regions Mat varMatRegions = varMat > 100; เมื่อได้รับภาพเช่นนี้: จากนั้นเมื่อฉันแสดงvarMatRegionsฉันได้รับภาพนี้: ในขณะที่คุณเห็นมันค่อนข้างรวมบล็อกด้านซ้ายของข้อความกับส่วนหัวของการ์ดสำหรับการ์ดส่วนใหญ่วิธีนี้ใช้งานได้ดี …

13
การประมวลผลภาพเพื่อปรับปรุงความถูกต้องของ tesseract OCR
ฉันใช้ tesseract เพื่อแปลงเอกสารเป็นข้อความ คุณภาพของเอกสารอยู่ในช่วงที่ดุเดือดและฉันกำลังมองหาเคล็ดลับเกี่ยวกับการประมวลผลภาพประเภทใดที่อาจปรับปรุงผลลัพธ์ ฉันสังเกตเห็นว่าข้อความที่มีการจัดเรียงสูง - ตัวอย่างเช่นที่สร้างขึ้นโดยเครื่องแฟกซ์ - เป็นเรื่องยากโดยเฉพาะอย่างยิ่งสำหรับ tesseract ในการประมวลผล - สันนิษฐานว่าขอบหยักเหล่านี้กับตัวอักษรทำให้เกิดความสับสนในอัลกอริทึมการจดจำรูปร่าง เทคนิคการประมวลผลภาพแบบใดที่จะปรับปรุงความแม่นยำ ฉันใช้การเบลอแบบเกาส์เพื่อปรับภาพที่มีตัวอักษรให้เรียบและเห็นการปรับปรุงเล็กน้อย แต่ฉันหวังว่าจะมีเทคนิคเฉพาะที่จะให้ผลลัพธ์ที่ดีกว่า พูดฟิลเตอร์ที่ปรับให้เป็นภาพขาวดำซึ่งจะทำให้ขอบที่ไม่สม่ำเสมอนั้นราบเรียบตามด้วยฟิลเตอร์ที่จะเพิ่มความคมชัดเพื่อทำให้ตัวละครมีความชัดเจนยิ่งขึ้น มีคำแนะนำทั่วไปสำหรับคนที่เป็นมือใหม่ในการประมวลผลภาพหรือไม่?

14
คลังภาพที่มีคุณภาพสูง [ปิด]
ปิด. คำถามนี้ไม่เป็นไปตามหลักเกณฑ์กองมากเกิน ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นไปตามหัวข้อสำหรับ Stack Overflow ปิดให้บริการใน5 ปีที่ผ่านมา ปรับปรุงคำถามนี้ ฉันต้องการปรับขนาดภาพใน C # ด้วยระดับคุณภาพที่ดีเหมือนกับ Photoshop มีไลบรารี่การประมวลผลภาพ C # ในการทำสิ่งนี้หรือไม่?

9
การแปลงสตริงฐาน 64 เป็นรูปภาพและบันทึก
นี่คือรหัสของฉัน: protected void SaveMyImage_Click(object sender, EventArgs e) { string imageUrl = Hidden1.Value; string saveLocation = Server.MapPath("~/PictureUploads/whatever2.png") ; HttpWebRequest imageRequest = (HttpWebRequest)WebRequest.Create(imageUrl); WebResponse imageResponse = imageRequest.GetResponse(); Stream responseStream = imageResponse.GetResponseStream(); using (BinaryReader br = new BinaryReader(responseStream)) { imageBytes = br.ReadBytes(500000); br.Close(); } responseStream.Close(); imageResponse.Close(); FileStream fs = new FileStream(saveLocation, FileMode.Create); BinaryWriter …

8
การแปลง RGB เป็นระดับสีเทา / ความเข้ม
เมื่อแปลงจาก RGB เป็นโทนสีเทามีการกล่าวว่าควรใช้น้ำหนักเฉพาะสำหรับช่อง R, G และ B น้ำหนักเหล่านี้คือ 0.2989, 0.5870, 0.1140 ว่ากันว่าเหตุผลนี้คือการรับรู้ / ความรู้สึกของมนุษย์ที่แตกต่างกันต่อสีทั้งสามนี้ บางครั้งก็มีการกล่าวว่านี่คือค่าที่ใช้ในการคำนวณสัญญาณ NTSC อย่างไรก็ตามฉันไม่พบข้อมูลอ้างอิงที่ดีสำหรับเรื่องนี้บนเว็บ ที่มาของค่าเหล่านี้คืออะไร? ดูเพิ่มเติมคำถามก่อนหน้านี้: ที่นี่และที่นี่


3
ปรับขนาดภาพตามสัดส่วนด้วยข้อ จำกัด MaxHeight และ MaxWidth
การใช้System.Drawing.Image. หากความกว้างหรือความสูงของรูปภาพเกินค่าสูงสุดจำเป็นต้องปรับขนาดตามสัดส่วน หลังจากปรับขนาดแล้วจำเป็นต้องตรวจสอบให้แน่ใจว่าความกว้างหรือความสูงยังไม่เกินขีด จำกัด ความกว้างและความสูงจะถูกปรับขนาดจนกว่าจะไม่เกินสูงสุดและต่ำสุดโดยอัตโนมัติ (ขนาดใหญ่ที่สุดที่เป็นไปได้) และยังคงรักษาอัตราส่วนไว้


3
วิธีการจัดเรียงอุ้งเท้าของฉัน?
ในคำถามก่อนหน้าของฉันฉันได้รับคำตอบที่ยอดเยี่ยมซึ่งช่วยให้ฉันตรวจพบว่าอุ้งเท้ากระทบกับแผ่นความดัน แต่ตอนนี้ฉันกำลังดิ้นรนเพื่อเชื่อมโยงผลลัพธ์เหล่านี้กับอุ้งเท้าที่ตรงกัน: ฉันใส่คำอธิบายประกอบอุ้งเท้าด้วยตนเอง (RF = ด้านหน้าขวา, RH = หลังขวา, LF = หน้าซ้าย, LH = หลังซ้าย) อย่างที่คุณเห็นชัดเจนว่ามีรูปแบบการทำซ้ำอย่างชัดเจนและกลับมาในเกือบทุกการวัด นี่คือลิงค์ไปยังการนำเสนอการทดลอง 6 รายการที่มีการใส่คำอธิบายประกอบด้วยตนเอง ความคิดแรกของฉันคือการใช้ฮิวริสติกส์เพื่อทำการเรียงลำดับเช่น: มีอัตราส่วนประมาณ 60-40% ในการแบกน้ำหนักระหว่างอุ้งเท้าหน้าและหลัง อุ้งเท้าหลังมักมีพื้นผิวเล็กกว่า อุ้งเท้า (มัก) แบ่งออกเป็นระยะทางซ้ายและขวา อย่างไรก็ตามฉันค่อนข้างสงสัยเกี่ยวกับฮิวริสติกของฉันเพราะพวกเขาจะล้มเหลวกับฉันทันทีที่ฉันพบกับรูปแบบที่ฉันไม่เคยคิด พวกเขาจะไม่สามารถรับมือกับการวัดจากสุนัขง่อยซึ่งอาจมีกฎของตัวเอง นอกจากนี้คำอธิบายประกอบที่โจแนะนำไว้บางครั้งก็ยุ่งเหยิงและไม่ได้คำนึงถึงลักษณะของอุ้งเท้า จากคำตอบที่ฉันได้รับสำหรับคำถามของฉันเกี่ยวกับการตรวจจับจุดสูงสุดภายในอุ้งเท้าฉันหวังว่าจะมีวิธีแก้ปัญหาขั้นสูงเพิ่มเติมในการจัดเรียงอุ้งเท้า โดยเฉพาะอย่างยิ่งเนื่องจากการกระจายแรงกดและการลุกลามของอุ้งเท้าแต่ละอันแตกต่างกันเกือบจะเหมือนลายนิ้วมือ ฉันหวังว่าจะมีวิธีที่สามารถใช้สิ่งนี้เพื่อรวมอุ้งเท้าของฉันแทนที่จะจัดเรียงตามลำดับเหตุการณ์ ดังนั้นฉันกำลังมองหาวิธีที่ดีกว่าในการจัดเรียงผลลัพธ์ด้วยอุ้งเท้าที่สอดคล้องกัน สำหรับทุกคนที่มีความท้าทายฉันได้รวบรวมพจนานุกรมที่มีอาร์เรย์ที่หั่นบาง ๆ ซึ่งมีข้อมูลแรงกดของอุ้งเท้าแต่ละอัน (รวมตามการวัด) และชิ้นส่วนที่อธิบายตำแหน่งของพวกเขา (ตำแหน่งบนจานและเวลา) เพื่อความชัดเจน: walk_sliced_data คือพจนานุกรมที่มี ['ser_3', 'ser_2', 'sel_1', 'sel_2', 'ser_1', 'sel_3'] ซึ่งเป็นชื่อของการวัด …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.