คำถามติดแท็ก computer-vision

วิสัยทัศน์ของคอมพิวเตอร์รวมถึงวิธีการประมวลผลวิเคราะห์ภาพและข้อมูลมิติสูงเพื่อสร้างความเข้าใจในระดับสูงและการจดจำฉากหรือภาพ

2
กล้องแบบประมาณขั้นตอนโดยประมาณสำหรับการติดตามด้วยภาพและเครื่องหมายบนภาพถ่าย
ฉันทำงานเกี่ยวกับหัวข้อการประมาณค่ากล้องเพื่อเพิ่มความเป็นจริงและแอพพลิเคชั่นการติดตามด้วยภาพเป็นระยะเวลาหนึ่งและฉันคิดว่าถึงแม้จะมีข้อมูลรายละเอียดมากมายเกี่ยวกับงาน แต่ก็ยังมีความสับสนและความเข้าใจผิดมากมาย ฉันคิดว่าคำถามต่อไปควรได้รับคำตอบทีละขั้นตอนอย่างละเอียด กล้องที่แท้จริงคืออะไร? Extrinsics กล้องคืออะไร? ฉันจะคำนวณ homography จากเครื่องหมายระนาบได้อย่างไร หากฉันมี homography ฉันจะทำให้กล้องถ่ายรูปได้อย่างไร

3
การเรียงลำดับส่วน biquad สำหรับตัวกรองคำสั่งซื้อที่สูงขึ้นทำงานอย่างไร
ฉันกำลังพยายามใช้ตัวกรอง IIR อันดับที่ 8 และบันทึกย่อของแอปพลิเคชันและหนังสือทุกเล่มที่ฉันได้อ่านบอกว่ามันเป็นการดีที่สุดที่จะใช้ตัวกรองลำดับที่สองมากกว่านั้นเป็นส่วนที่สอง ฉันใช้tf2sosMATLAB เพื่อรับค่าสัมประสิทธิ์สำหรับส่วนที่สองซึ่งทำให้ฉันมีค่า 6x4 coeffs สำหรับส่วนของคำสั่งที่สอง 4 ตามที่คาดไว้ ก่อนการใช้งานเป็น SOS ตัวกรองลำดับที่ 8 จำเป็นต้องเก็บค่าตัวอย่าง 7 ค่าก่อนหน้า (และค่าเอาต์พุตด้วย) ตอนนี้เมื่อดำเนินการตามลำดับส่วนที่สองโฟลว์ทำงานอย่างไรจากอินพุตไปยังเอาต์พุตฉันต้องเก็บค่าตัวอย่างก่อนหน้านี้เพียง 2 ค่าหรือไม่ หรือผลลัพธ์ของตัวกรองตัวแรกป้อนเช่นเดียวx_inกับตัวกรองที่สองและอื่น ๆ ?
20 filters  filter-design  infinite-impulse-response  biquad  audio  image-processing  distance-metrics  algorithms  interpolation  audio  hardware  performance  sampling  computer-vision  dsp-core  music  frequency-spectrum  matlab  power-spectral-density  filter-design  ica  source-separation  fourier-transform  fourier-transform  sampling  bandpass  audio  algorithms  edge-detection  filters  computer-vision  stereo-vision  filters  finite-impulse-response  infinite-impulse-response  image-processing  blur  impulse-response  state-space  linear-systems  dft  floating-point  software-implementation  oscillator  matched-filter  digital-communications  digital-communications  deconvolution  continuous-signals  discrete-signals  transfer-function  image-processing  computer-vision  3d 

5
ฉันจะเปรียบเทียบภาพสองภาพจากกล้องและบอกได้ว่ามีความแตกต่างเพียงพอในการตรวจจับการเคลื่อนไหวหรือไม่?
ฉันต้องการใช้โทรศัพท์ของฉันเป็นระบบกล้องวงจรปิดเพื่อควบคุมห้องในบ้านของฉันและแสดงการแจ้งเตือนเมื่อมีบางอย่างกำลังเคลื่อนไหว สำหรับตอนนี้สิ่งที่ฉันประสบความสำเร็จในการทำคือการจับภาพทุกนาทีและอัพโหลดผ่านสคริปต์ PHP ไปยังเซิร์ฟเวอร์ของฉัน ตอนนี้ฉันต้องการที่จะเปรียบเทียบภาพปัจจุบันและภาพที่ 1 นาทีที่ผ่านมาและตรวจสอบว่ามีคนเข้ามาในห้อง ดังนั้นโดยทั่วไปฉันจะต้องเปรียบเทียบความแตกต่างของพิกเซลในภาพ (แต่ต้องคำนึงว่าเมฆอาจทักทายและเปลี่ยนความสว่างในช่วงเวลาหนึ่งนาที) ใครบ้างมีเบาะแสเกี่ยวกับวิธีการที่จะประสบความสำเร็จหรือว่ามีเอกสารให้อ่าน?

2
การปรับขนาดภาพมีผลต่อเมทริกซ์กล้องภายในอย่างไร
ฉันมีเมทริกซ์กล้อง (ฉันรู้ว่าพารามิเตอร์ทั้งภายในและภายนอก) เป็นที่รู้จักสำหรับภาพขนาด HxW (ฉันใช้เมทริกซ์นี้สำหรับการคำนวณบางอย่างที่ฉันต้องการ) ฉันต้องการใช้ภาพที่เล็กลงพูดว่า: (ครึ่งหนึ่งของต้นฉบับ) ฉันต้องทำการเปลี่ยนแปลงอะไรกับเมทริกซ์เพื่อรักษาความสัมพันธ์เดิมH2× W2H2×W2\frac{H}{2}\times \frac{W}{2} ฉันมีเป็นพารามิเตอร์ที่แท้จริง ( การหมุนR , Tและการแปล)KKKRRRTTT ลูกเบี้ยว= K⋅ [ R T]ลูกเบี้ยว=K⋅[RT]\text{cam} = K \cdot [R T] K= ⎛⎝⎜ax000aY0ยู0โวลต์01⎞⎠⎟K=(ax0ยู00aYโวลต์0001)K = \left( \begin{array}&a_x &0 &u_0\\0 &a_y &v_0 \\ 0 &0 &1\end{array} \right) คือ 3 * 3 ฉันคิดว่าการคูณ a x , a , y …

3
วิธีการตรวจจับการไล่ระดับสีและขอบในรูปภาพ?
ฉันต้องการที่จะหาจุดในภาพที่เป็นจุดศูนย์กลางของการไล่ระดับสีแบบรัศมีเช่นเดียวกับที่แสดงในภาพด้านซ้ายด้านล่าง มีความคิดเห็นเกี่ยวกับวิธีการใช้ Hough transform หรือวิธีการมองเห็นด้วยคอมพิวเตอร์อื่น ๆ อย่างไร ขอบคุณ ภาพการค้นหาตัวอย่าง:

4
คำอธิบายที่ใช้งานง่ายของการติดตามด้วยตัวกรองคาลมาน
ฉันขอขอบคุณคำอธิบายที่ใช้งานง่ายสำหรับการติดตาม (ภาพ) ด้วยตัวกรองคาลมาน สิ่งที่ฉันรู้: ขั้นตอนการทำนาย: สถานะของระบบแบบไดนามิก : ตำแหน่งเป้าหมาย ณ เวลาxเสื้อxเสื้อ\mathbf x_tเสื้อเสื้อt การวัด : รูปภาพที่ดัชนีเวลา (??)Zเสื้อZเสื้อ\mathbf z_tเสื้อเสื้อt จากภาพ / การวัดฉันต้องการที่จะทำนายสถานะ ? (ใช้สมการแบบไดนามิก) ถูกต้องไหม?1 → ( t - 1 )1→(เสื้อ-1)1\rightarrow(t-1)xเสื้อxเสื้อ\mathbf x_t ฉันจะตีความขั้นตอนการแก้ไขเป็นคำเหล่านั้นได้อย่างไร (รูปภาพสถานที่เป้าหมาย)

2
เหตุใดเราจึงใช้ตัวบอกคำสำคัญ
ฉันเพิ่งศึกษาเกี่ยวกับ SURF และฉันจะลงมือปฏิบัติ แต่ฉันก็ยังไม่เข้าใจว่าทำไมเราจึงใช้ตัวอธิบาย ฉันเข้าใจว่าประเด็นสำคัญคืออะไรและจุดประสงค์ของพวกเขา แต่เมื่อเราแยกจุดสำคัญออกไปกว่าเหตุใดเราจึงจำเป็นต้องใช้ตัวอธิบาย? ความสำคัญและบทบาทของพวกเขาในการรับรู้คืออะไร?

3
การจับคู่รูปทรง - การค้นหาการกำจัดรูปทรง
ฉันพบรูปทรงในสองภาพที่มีวัตถุเดียวกันและฉันต้องการค้นหาการกระจัดและการหมุนของวัตถุนี้ ฉันได้ลองกับกล่องที่มีขอบหมุนของรูปทรงนี้แล้วมุมและจุดกึ่งกลางของมัน แต่การหมุนของกล่องขอบไม่ได้บอกเกี่ยวกับการหมุนของรูปร่างอย่างถูกต้องเพราะมันเหมือนกันสำหรับมุมที่ 0, a + 90, a + 180 เป็นต้น องศา มันเป็นวิธีการอื่นที่ดีในการค้นหาการหมุนและการเคลื่อนที่ของรูปทรง? บางทีการใช้ตัวเรือนูนข้อบกพร่องนูนบาง? ฉันอ่านในการเรียนรู้ OpenCv เกี่ยวกับรูปทรงที่ตรงกัน แต่มันไม่ได้ช่วย ใครช่วยยกตัวอย่างได้บ้าง ตัวอย่าง: ฉันต้องการตรวจจับเช่นสี่เหลี่ยมสีชมพูและในปากกาตัวที่สอง ตัวอย่างอื่น ๆ อาจเป็นสี่เหลี่ยมจัตุรัสที่มีบางหลุมดาว ฯลฯ อย่างที่ฉันบอกว่าฉันต้องการทำบางสิ่งที่ไม่เหมือนกัน ข้อเสนอแนะใด ๆ ชื่นชมเพราะฉันต้องการทดสอบวิธีการให้มากที่สุด

5
คำอธิบายคุณลักษณะการปรับขนาดและการหมุน
คุณสามารถแสดงคำอธิบายคุณลักษณะของมาตราส่วนและตัวชี้การหมุนแบบคงที่เพื่อใช้ในการตรวจจับคุณสมบัติหรือไม่ แอปพลิเคชั่นนี้ใช้สำหรับตรวจจับรถยนต์และมนุษย์ในวิดีโอที่ถ่ายโดย UAV โดยใช้ตัวจําแนกหลายคลาส จนถึงตอนนี้ฉันได้ดู SIFT และ MSER (ซึ่งเลียนแบบค่าคงที่) ฉันยังดูที่ LESH, LESH ขึ้นอยู่กับแบบจำลองพลังงานในท้องที่ แต่คำนวณด้วยวิธีที่ไม่แปรเปลี่ยนแบบหมุนได้ฉันพยายามคิดหาวิธีที่จะใช้ประโยชน์จากพลังงานในท้องถิ่นเพื่อสร้างค่าคงที่แบบหมุนได้ คำอธิบายคุณลักษณะฉันอ่านที่นี่มีทางเลือกฟรีอะไรบ้างสำหรับ SIFT / SURF ที่สามารถใช้ในแอปพลิเคชันเชิงพาณิชย์ได้ ว่า "ถ้าคุณกำหนดทิศทางไปยังจุดสนใจและหมุนแผ่นภาพตามนั้นคุณจะได้ค่าความแปรปรวนแบบหมุนได้ฟรี" แต่ไม่รู้ว่าสิ่งนี้จะช่วยบรรเทาได้อย่างไรหรือฉันจะนำสิ่งนี้ไปใช้กับปัญหาของฉันได้อย่างไร ชื่นชมขอบคุณ

4
การตรวจจับคนจากด้านบน
ฉันกำลังพยายามหาวิธีตรวจจับคนที่ใช้กล้องเพียงแค่ 3 เมตรเหนือพื้นดิน นี่คือเฟรมที่กล้องคืนมา: อัปเดต: การทดสอบวิดีโอ -> http://dl.dropbox.com/u/5576334/top_head_shadow.avi ในการทำเช่นนั้นก่อนอื่นฉันต้องเข้าใจว่าฉันต้องทำการแบ่งส่วนหลังแบบพื้นหน้า นั่นคือส่วนที่ง่าย ด้วยหน้ากากเบื้องหน้าฉันสามารถทำงานง่ายๆเช่น Hough transform เพื่อค้นหาแวดวง แต่วิธีนี้ตรวจจับได้เพียง 60% ของหัวรวมถึงผลบวกที่ผิดพลาดมากมาย ฉันสามารถใช้เทคนิคง่ายๆอื่น ๆ เช่นการแบ่งส่วนสี แต่ฉันพบว่าคนหัวแตกต่างกันมากเห็นจากด้านบนเพราะทรงผมสีผมจำนวนของพวกเขา ... ตัวเลือกอื่นที่ฉันคิดไว้คือความเป็นไปได้ในการใช้ HOG Descriptors หรือคุณลักษณะที่คล้ายกับ Haar แต่ฉันต้องการฐานข้อมูลที่กว้างขวางของผู้คนที่เห็นจากด้านบนเพื่อฝึกฝนโมเดล ฉันไม่พบอะไรแบบนั้น ฉันคิดว่านี่จะเป็นปัญหาที่เกิดขึ้นอีกมาก แต่ฉันไม่สามารถพบได้มากในวรรณคดีหรืออินเทอร์เน็ต ความช่วยเหลือในการแก้ไขงานนี้จะได้รับการชื่นชม :-) ปรับปรุง: สำหรับข้อมูลเพิ่มเติมเป้าหมายคือการใช้วิธีการทั่วไปบางอย่างเพื่อให้การติดตามการเดินเท้า ต้นแบบตัวแรกจะถูกทดสอบใน Mall

1
ปรับภาพใหม่ให้เหมาะสมจากการคำนวณ SVD / PCA
ฉันพยายามที่จะทำซ้ำความคิดจากหน้า Eigenfaceในวิกิพีเดีย จากภาพตัวอย่างร้อยภาพที่แสดงโดยเมทริกซ์ข้อมูล (ซึ่งภาพแต่ละภาพแบนไปเป็นเวกเตอร์ที่มีความยาวnดังนั้นXคือ100XX\bf XnnnXX\bf X100100100เมทริกซ์คูณ ) ฉันได้คำนวณการสลายตัวของ SVD:nnn X=UΣVTX=UΣVT\begin{equation} \bf X = U \Sigma V^{T} \end{equation} ด้วยเหตุนี้: XXT=UΣ2UTXXT=UΣ2UT\begin{equation} \bf X X^{T} = U \Sigma^2 U^{T} \end{equation} โดยการย่อยของที่ใหญ่ที่สุด eigenmodes ฉันสามารถใกล้เคียงกับเมทริกซ์ (ขอσ 1 ≥ σ 2 ≥ ⋯ ):qqqσ1≥σ2≥⋯σ1≥σ2≥⋯\sigma_1 \ge \sigma_2 \ge \cdots X≈σ1u1vT1+σ2u2vT2+⋯+σquqvTqX≈σ1u1v1T+σ2u2v2T+⋯+σquqvqT\begin{equation} {\bf X} \approx \sigma_1 u_1 v_1^{T} + …

2
การสร้างภาพ 3 มิติใหม่ตามความลึกของระดับความเข้มหรือไม่
อย่างไรก็ตามมีการแบ่งกลุ่มวัตถุตามระยะห่างจากผู้ดูหรือไม่ ค่าสีสามารถประเมินสิ่งเหล่านี้ได้หรือไม่? ระดับความเข้มจะช่วยในการกำหนดว่าวัตถุนั้นมาจากผู้ชมมากแค่ไหน ภาพอื่น:

2
มีโปรแกรมโอเพ่นซอร์ส (ดี, ฟรี) ที่เขียนด้วยลายมือดีหรือไม่?
ชื่อถามมันทั้งหมด ฉันมีงานการป้อนข้อมูลที่ฉันไม่กระตือรือร้นเกินไปเกี่ยวกับ: หน้า 50-100 หน้าของการเขียนด้วยลายมือออกจากระบบ / ลงชื่อเข้าใช้ในบันทึก รูปแบบของบันทึกอาจช่วยได้ หน้าจะถูกแบ่งออกเป็นแถวและคอลัมน์ที่กำหนดอย่างชัดเจน (13r x 6c พร้อมแถวส่วนหัวที่พิมพ์พิเศษ) การช่วยเหลือฉันเพิ่มเติมคือคอลัมน์ที่สามเกี่ยวข้องกับวันที่ / เวลา (วันที่หมดเวลาและเวลาเข้า) นอกจากนี้ข้อมูลในสองคอลัมน์ (ทรัพยากรและชื่อ) มีการแจกแจงมากหรือน้อยดังนั้นตัวอย่างเช่นชื่อ "Smith" อาจปรากฏขึ้นครั้งแล้วครั้งเล่าในคอลัมน์ชื่อแต่ละครั้งด้วยลายมือเดียวกัน คอลัมน์สุดท้าย "Notes" เป็นรูปแบบอิสระ แต่ถ้าฉันสามารถทำให้คอลัมน์ 6 คอลัมน์ก่อนหน้านี้เป็นแบบอัตโนมัติได้ฉันก็ไม่อยากป้อน Notes ด้วยมือเลย ข้อเสนอแนะใด ๆ (นอกจาก 'เริ่มพิมพ์') ป.ล. หากมีเว็บไซต์ SE ที่ดีกว่าให้ถามฉันรู้ว่าฉันจะถามที่นั่น

2
ทำไมความแตกต่างของ gaussians มาตราส่วนสเกลอวกาศคงที่?
ฉันจะใช้อัลกอริทึมการแปลงคุณสมบัติไม่แปรเปลี่ยนเป็นตัวอย่างที่นี่ SIFT สร้างพื้นที่ขนาดตามการกรองแบบเกาส์ปรับขนาดของภาพแล้วคำนวณความแตกต่างของ Gaussian เพื่อตรวจหาจุดสนใจที่อาจเกิดขึ้น คะแนนเหล่านี้ถูกกำหนดให้เป็น minima ท้องถิ่นและ maxima ข้ามความแตกต่างของ gaussians มันก็อ้างว่าวิธีนี้เป็นขนาดคงที่ (ในหมู่ invariances งงอื่น ๆ ) ทำไมนี้ มันไม่ชัดเจนสำหรับฉันว่าทำไมในกรณีนี้

6
ปัญหาการแบ่งส่วนภาพของวัสดุที่แตกต่าง
สวัสดีชุมชน CV / รูปแบบการรับรู้ ฉันมีปัญหาร้ายแรงเกี่ยวกับการแบ่งส่วนของรูปภาพ สถานการณ์เป็นบรรยากาศภายในเตาหลอมซึ่งทำให้หัวฉันเสียสติ และฉันต้องการตรวจจับวัตถุรูปทรงของวัสดุที่แตกต่างกัน (แก้ว, เซรามิก, อัล, ไออาร์ .. ) ในช่วงเวลาสั้น ๆ (<10 วินาที) และไม่ใช่แค่กรณีพิเศษอย่างเดียว ฉันยังต้องการเส้นชั้นความสูงในแถวพิกเซลต่อเนื่องเพื่อรับรหัส ดังนั้นจำเป็นต้องใช้รหัสลูกโซ่หรือที่เรียกว่าการติดตามเส้นขอบ / รูปร่างดังนั้นรูเปิดจึงไม่ดี ในพื้นหลังไม่ใช่เสียงเชิงเส้นประมาณฝุ่นอนุภาคหรืออย่างอื่นที่ปรากฏขึ้นเป็นครั้งคราว ยินดีต้อนรับข้อเสนอแนะ Matlab หรือ OpenCV เพื่อให้ชัดเจนยิ่งขึ้นฉันได้โพสต์ภาพเป้าหมายและวัตถุโปร่งใสครึ่งหนึ่งซึ่งต้องตรวจจับด้วย นอกจากนี้ยังมีตัวอย่างเพิ่มเติมที่ต้องระวัง อย่างที่คุณเห็นในภาพ # 1 มีอนุภาคอยู่ทางด้านขวาของภาพและใกล้กับรูปร่างชั้นนอกของดาวซึ่งเป็นวัตถุ ความคมชัดโดยรวมยังไม่ดีมาก วัตถุนั้นตั้งอยู่บนชั้นใต้ดินซึ่งไม่เกี่ยวข้องกับการตรวจจับเส้นชั้นความสูง รูปภาพ # 2 แสดงวัตถุแบบกึ่งโปร่งใสซึ่งเป็นไปได้เช่นกัน ฉันต้องการค้นหารูปร่าง / ขอบเขตของวัตถุนั้นเช่นบนหน้าจอถัดไป (เส้นสีแดง) สี่เหลี่ยมสองรูป (สีเหลือง) กำลังทำเครื่องหมายจุดเริ่มต้น (ซ้าย) และจุดสิ้นสุด (ขวา) เส้นสีฟ้านั้นไม่น่าสนใจ …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.