การประมวลผลสัญญาณ

ถามตอบสำหรับผู้ปฏิบัติงานด้านศิลปะและวิทยาศาสตร์ของการประมวลผลสัญญาณภาพและวิดีโอ

4
ค้นหาปากใบในรูปพืชกล้องจุลทรรศน์
นี่คือคำถามสำหรับผู้เชี่ยวชาญด้านการประมวลผลภาพ ฉันกำลังทำงานกับปัญหาการมองเห็นคอมพิวเตอร์ที่ยากลำบาก งานคือการนับปากใบ (ทำเครื่องหมายด้านล่าง) ในภาพกล้องจุลทรรศน์ DIC ภาพเหล่านี้มีความทนทานต่อเทคนิคการประมวลผลภาพผิวเผินมากที่สุดเช่นการดำเนินงานทางสัณฐานวิทยาและการตรวจจับขอบ นอกจากนี้ยังแตกต่างจากงานนับเซลล์อื่น ๆ ฉันใช้ OpenCV แผนของฉันคือการตรวจสอบคุณสมบัติที่มีประโยชน์สำหรับการเลือกปฏิบัติปากใบ ตัวแยกประเภทของพื้นผิว DCT (การแปลงโคไซน์ไม่ต่อเนื่อง / การวิเคราะห์โดเมนความถี่) LBP (รูปแบบไบนารีโลคัล) HOG (ฮิสโตแกรมของการไล่ระดับสีเชิง) เครื่องตรวจจับคุณสมบัติที่ทนทาน (ฉันไม่เชื่อ) มุมแฮร์ริส SIFT, SURF, STAR, เป็นต้น ตัวเรียงลำดับ Haar cascade / คุณสมบัติของ Viola-Jones และอาจออกแบบตัวอธิบายคุณลักษณะใหม่ ตอนนี้ฉันไม่ได้เลือกตัวจําแนก ฉันพลาดอะไรไป คุณจะแก้ปัญหานี้อย่างไร การแก้ปัญหาการตรวจจับวัตถุที่คล้ายกันจะมีประโยชน์มาก ภาพตัวอย่างที่นี่ หลังจากตัวกรอง bandpass: การตรวจจับขอบ Canny ไม่ได้เป็นสัญญา บางพื้นที่ภาพไม่ได้โฟกัส:


8
เทคนิค Computer Stereo Vision เหมาะสมสำหรับการวัดขนาดย่อยหรือไม่?
ฉันมีโครงการที่ฉันต้องการถ่ายภาพวัตถุและสามารถรับความสูงของคุณลักษณะต่าง ๆ ในภาพนี้เพื่อความแม่นยำในระดับต่ำกว่ามิลลิเมตร (แน่นอนว่าความแม่นยำยังคงถูกกำหนด แต่ตอนนี้พูดว่า 100 มิลลิเมตรของมิลลิเมตร) . ก่อนหน้านี้ฉันได้รับคำแนะนำแล้วว่าเทคนิคการยิงเลเซอร์โดยตรงจะไม่เหมาะสม เวลาเดินทางจะน้อยเกินไปและต้องใช้ความแม่นยำมากเกินไปในการคำนวณที่แม่นยำ การสั่นสะเทือนเล็กน้อย (เช่นคนที่เดินใกล้อุปกรณ์) จะรบกวนผลลัพธ์ ฉันสังเกตเห็นอุปกรณ์เลเซอร์ที่ขายในราคาประมาณ $ 1,000 ที่สามารถบรรลุความแม่นยำ แต่ได้รับผลกระทบจากปัญหาการสั่นสะเทือน (ซึ่งเป็นเรื่องปกติ ฉันต้องการที่จะได้ผลลัพธ์ที่คุ้มค่ากว่าและถือเป็นวิสัยทัศน์สเตอริโอเป็นทางเลือก การเป็นสามเณรในสาขานี้ฉันไม่แน่ใจว่าสามารถบรรลุความแม่นยำที่ต้องการได้หรือไม่ ความแม่นยำที่ต้องการ (อย่างน้อยที่สุด) เป็นไปได้ในทางทฤษฎีหรือไม่? มีกระดาษหรือทรัพยากรที่แนะนำที่จะช่วยอธิบายหัวข้อนี้เพิ่มเติมหรือไม่ หมายเหตุเพิ่มเติม วัตถุที่มีปัญหาจะอยู่ในช่วงตั้งแต่ประมาณ 1/2 "สแควร์ถึงประมาณ 2 1/2" สแควร์ที่บางครั้งความหนาต่ำมาก (1/16 "?) ส่วนใหญ่ของพื้นผิวควรจะแบน แต่การทดสอบหนึ่งจะ คือการยืนยันการยืนยันคุณสมบัติจะค่อนข้างหยาบ (ช่วงการเปลี่ยนภาพที่คมชัด) 17 ส.ค. เวลา 11:00 น หนึ่งในสิ่งที่น่าสนใจ "ยาก" จะมีขนาดประมาณ 20 มม. สูง 1.25 …

5
มีศัพท์เทคนิคหรือไม่สำหรับวิธีง่ายๆในการทำให้สัญญาณเรียบ
ประการแรกฉันยังใหม่กับ DSP และไม่มีการศึกษาจริงในนั้น แต่ฉันกำลังพัฒนาโปรแกรมสร้างภาพเสียงและฉันเป็นตัวแทนของอาร์เรย์ FFT เป็นแถบแนวตั้งเช่นเดียวกับการสร้างภาพคลื่นความถี่ทั่วไป ปัญหาที่ฉันมีคือค่าสัญญาณเสียงเปลี่ยนไปเร็วเกินไปที่จะสร้างเอาต์พุตภาพที่น่าพอใจถ้าฉันเพิ่งแมปค่า FFT โดยตรง: ดังนั้นฉันจึงใช้ฟังก์ชั่นง่าย ๆ กับค่าต่างๆเพื่อ "ทำให้เรียบ" ผลลัพธ์: // pseudo-code delta = fftValue - smoothedFftValue; smoothedFftValue += delta * 0.2; // 0.2 is arbitrary - the lower the number, the more "smoothing" กล่าวอีกนัยหนึ่งฉันกำลังใช้ค่าปัจจุบันและเปรียบเทียบกับค่าล่าสุดจากนั้นเพิ่มเศษส่วนของเดลต้านั้นให้เป็นค่าสุดท้าย ผลลัพธ์จะเป็นดังนี้: ดังนั้นคำถามของฉันคือ: นี่เป็นรูปแบบหรือฟังก์ชั่นที่ได้รับการยอมรับเป็นอย่างดีซึ่งคำศัพท์นี้มีอยู่แล้ว คำนี้คืออะไร? ฉันใช้ "การปรับให้เรียบ" ด้านบน แต่ฉันรู้ว่านี่หมายถึงบางสิ่งที่เฉพาะเจาะจงมากใน DSP และอาจไม่ถูกต้อง นอกเหนือจากนั้นอาจเกี่ยวข้องกับซองจดหมายที่มีปริมาณมาก …

4
เวฟเล็ตแปลงค่าสัมประสิทธิ์ความถี่ใด
คำถามนี้ถูกโยกย้ายจาก Stack Overflow เนื่องจากสามารถตอบได้ในการประมวลผลสัญญาณ Stack Exchange อพยพ 8 ปีที่ผ่านมา ด่วนแปลงฟูเรียใช้เวลาการดำเนินงานในขณะที่จานด่วนแปลงเวฟเล็ตใช้เวลา(N) แต่ FWT คำนวณอะไรโดยเฉพาะ?O(NlogN)O(Nlog⁡N)\mathcal O(N \log N)O(N)O(N)\mathcal O(N) แม้ว่าจะมีการเปรียบเทียบบ่อยครั้ง แต่ดูเหมือนว่า FFT และ FWT เป็นแอปเปิ้ลและส้ม ตามที่ฉันเข้าใจมันจะเป็นการดีกว่าที่จะเปรียบเทียบ STFT (FFTs ของชิ้นเล็ก ๆ เมื่อเวลาผ่านไป) กับMorlet WT ที่ซับซ้อนเนื่องจากทั้งคู่เป็นตัวแทนความถี่เวลาตามไซนัสที่ซับซ้อน (โปรดแก้ไขฉันหากฉันผิด ) นี่มักจะแสดงด้วยแผนภาพดังนี้: ( อีกตัวอย่าง ) ทางด้านซ้ายแสดงให้เห็นว่า STFT เป็นพวงของ FFTs ซ้อนกันอยู่ด้านบนของเวลาที่ผ่านไป (การแสดงนี้เป็นที่มาของspectrogram ) ในขณะที่ด้านขวาแสดง dyadic WT ซึ่งมีความละเอียดเวลาที่ดีกว่าที่ความถี่สูงและความถี่ที่ดีขึ้น ความละเอียดที่ความถี่ต่ำ …
26 frequency  fft  wavelet 

3
สิ่งที่ควรพิจารณาเมื่อเลือกฟังก์ชั่นหน้าต่างเมื่อปรับเวลาให้เรียบ
หากใครต้องการทำให้อนุกรมเวลาราบรื่นขึ้นโดยใช้ฟังก์ชั่นหน้าต่างเช่น Hanning, Hamming, Blackman เป็นต้นสิ่งที่ต้องคำนึงถึงในการเลือกหน้าต่างใดหน้าต่างหนึ่งเหนือหน้าต่างอื่น?

1
"สุ่มตัวอย่างสุ่ม" หมายความว่าอะไร
"สุ่มตัวอย่างสุ่ม" หมายความว่าอะไรและมันแตกต่างอย่างลึกซึ้งจากทฤษฎีการสุ่มตัวอย่าง Nyquist-Shannonปกติหรือไม่? มันเกี่ยวข้องกับการสุ่มตัวอย่างกระบวนการสุ่มหรือไม่?
25 sampling 

4
ฉันจะประมาณค่าสัญญาณ 1D ได้อย่างไร
ฉันมีสัญญาณที่มีความยาวประมาณ 1,000 ตัวอย่าง ฉันต้องการขยายสัญญาณนี้เป็น 5,000 ตัวอย่างซึ่งเก็บตัวอย่างในอัตราเดียวกับต้นฉบับ (เช่นฉันต้องการทำนายว่าสัญญาณจะเป็นอย่างไรถ้าฉันยังคงทดลองต่อไปเป็นระยะเวลานานขึ้น) สัญญาณประกอบด้วยส่วนประกอบหลายรูปแบบที่เพิ่มเข้าด้วยกัน วิธีที่ฉันเข้ามาครั้งแรกคือการใช้ FFT ทั้งหมดและขยายออก แต่นี่ทำให้ความไม่ต่อเนื่องที่แข็งแกร่งมากที่เฟรม 1001 ฉันยังพิจารณาเฉพาะการใช้คลื่นความถี่ใกล้กับยอดเขาและในขณะนี้ ปรับปรุงสัญญาณค่อนข้างดีสำหรับฉันดูเหมือนว่าเฟสจะรับประกันว่าถูกต้อง วิธีที่ดีที่สุดในการขยายสัญญาณนี้คืออะไร? นี่คือรหัส MATLAB บางส่วนที่แสดงวิธีการในอุดมคติของสิ่งที่ฉันต้องการ แน่นอนว่าฉันจะไม่ทราบล่วงหน้าว่ามีองค์ประกอบของซายน์ 3 อย่างแน่นอนไม่ว่าจะเป็นเฟสและความถี่ที่แน่นอน ฉันต้องการตรวจสอบให้แน่ใจว่าฟังก์ชั่นนั้นต่อเนื่องไม่มีการกระโดดเมื่อเราเลื่อนไปที่จุด 501 vals = 1:50; signal = 100+5*sin(vals/3.7+.3)+3*sin(vals/1.3+.1)+2*sin(vals/34.7+.7); % This is the measured signal % Note, the real signal will have noise and not be known exactly. output_vals …
25 matlab  sampling 

1
ทับซ้อนเพิ่มกับทับซ้อนกันบันทึก
ความแตกต่างหรือเกณฑ์อื่นใดที่สามารถใช้ในการตัดสินใจระหว่างการใช้การทับซ้อนกันเพิ่มและการทับซ้อนกันบันทึกสำหรับการกรอง? ทั้งการทับซ้อน - เพิ่มและการทับซ้อน - บันทึกอธิบายว่าเป็นอัลกอริธึมสำหรับการทำสังวัตนาที่รวดเร็วของการสตรีมข้อมูลอย่างรวดเร็วด้วยเคอร์เนล FIR ความหน่วงแฝงประสิทธิภาพการคำนวณหรือความแตกต่างของแคช (ฯลฯ ) มีความแตกต่างกันถ้ามี? หรือพวกเขาเหมือนกันหรือไม่

3
ฉันจะสร้างโครงสร้าง 3 มิติใหม่จากชุดภาพได้อย่างไร?
ฉันมีชุดของรูปทรง (ชุดของส่วนของเส้น) จัดกลุ่มด้วยวิธีดังต่อไปนี้: Si={I0,Iπ4,I2π4,…,I7π4}Si={I0,Iπ4,I2π4,…,I7π4}S_i = \{I^0, I^\frac{\pi}{4}, I^\frac{2\pi}{4}, \ldots, I^\frac{7\pi}{4} \} ที่ไหน SiSiS_iแสดงถึงลำดับของภาพถ่ายของวัตถุรูปธรรมหนึ่งชิ้น IjIjI^jแสดงถึงภาพโดยมีมุมมอง (หมายถึงมุมมองด้านหน้า) jthjthj^{th}j=0j=0j=0 นี่คือตัวอย่างของ (มุมมองด้านหลัง): IπIπI^\pi ฉันจะสร้างโครงสร้าง 3 มิติของวัตถุด้วยกำหนดได้อย่างไรSiSiS_i ใครบางคนสามารถชี้ให้ฉันไปที่เอกสารบางส่วนหรือแม้กระทั่งให้ฉันคำหลักบางอย่าง ฉันรู้ว่ามีบทความจำนวนมากที่ทำงานกับกลุ่มเมฆของจุดและอื่น ๆ แต่สิ่งเหล่านั้นไม่ทำงานในขณะที่ฉันทำงานกับสาย

1
ตัวกรองคาลมานสำหรับตำแหน่งและความเร็ว: แนะนำการประมาณความเร็ว
ขอบคุณทุกคนที่โพสต์ความเห็น / คำตอบคำถามของฉันเมื่อวานนี้ ( ใช้ตัวกรองคาลมานสำหรับตำแหน่ง, ความเร็ว, ความเร่ง ) ฉันได้รับการมองหาสิ่งที่ได้รับการแนะนำและโดยเฉพาะอย่างยิ่งในการที่ทั้งสอง (ก) ตัวอย่างที่วิกิพีเดียในตำแหน่งมิติหนึ่งและความเร็วและยังเว็บไซต์อื่นที่จะพิจารณาสิ่งที่คล้ายกัน อัปเดต 26 เม.ย. 2556 : คำถามเดิมที่นี่มีข้อผิดพลาดบางอย่างเกี่ยวข้องกับความจริงที่ว่าฉันไม่เข้าใจตัวอย่างวิกิพีเดียในตำแหน่งมิติและความเร็วอย่างเดียว ด้วยความเข้าใจที่ดีขึ้นของฉันเกี่ยวกับสิ่งที่เกิดขึ้นตอนนี้ฉันได้ร่างคำถามขึ้นใหม่และมุ่งเน้นไปที่มันแน่นขึ้น ตัวอย่างทั้งสองที่ฉันอ้างถึงในย่อหน้าเบื้องต้นข้างต้นถือว่าเป็นตำแหน่งที่วัดได้เท่านั้น อย่างไรก็ตามไม่มีตัวอย่างใด ๆ ที่มีการคำนวณสำหรับความเร็ว ตัวอย่างเช่นตัวอย่างวิกิพีเดียระบุเมทริกซ์เป็นซึ่งหมายความว่าตำแหน่งเดียวคืออินพุต เพ่งความสนใจไปที่ตัวอย่างของ Wikipedia เวกเตอร์สถานะของตัวกรองคาลมานมีตำแหน่งและความเร็วคือ(xk−xk−1)/dt(xk−xk−1)/dt(x_k-x_{k-1})/dtHH{\bf H}H=[1 0]H=[1 0]{\bf H} = [1\ \ \ 0]xkxk{\bf x}_kxkxkx_kx˙kx˙k\dot{x}_{k} xk=(xkx˙k)xk=(xkx˙k) \begin{align*} \mathbf{x}_{k} & =\left(\begin{array}[c]{c}x_{k}\\ \dot{x}_{k}\end{array} \right) \end{align*} Suppose the measurement of position at …

3
แบบจำลองทางคณิตศาสตร์ของเสียงใดที่สามารถเปลี่ยนระดับเสียงที่เป็นไปได้ของบันทึกย่อส่วนบุคคลในโพลีโฟนิก
คำถามของฉันคืออะไรแบบจำลองทางคณิตศาสตร์ของเสียงโพลีโฟนิคสามารถทำให้เกิดการเปลี่ยนแปลง (เช่นการเปลี่ยนระดับเสียง) ของโน้ตดนตรีแต่ละรายการในการบันทึกเสียงแบบหลายเสียงในช่องทางเดียวของเครื่องดนตรีอะคูสติกโพลีโฟนิค? ด้วย 'การเปลี่ยนโน้ตในเสียงโพลีโฟนิค' ฉันหมายถึงการทำสิ่งต่าง ๆ เช่นการแก้ไขเสียงด้วยคุณสมบัติ ' การเข้าถึงบันทึกย่อโดยตรง ' ในซอฟต์แวร์ Melodyne ของซีลีโอนี ตามที่วิกิพีเดียสิ่ง Melodyne ใช้ในการจำลองสัญญาณเสียงของทำนองบรรทัดเดียวเล่นบนอะคูสติก (และซับซ้อน timbrally) เครื่องดนตรีเป็นสิ่งที่ชอบสิ่งที่เฮนนิ่ง Thielemann อธิบายในบทความของเขาที่ชื่อ ' เฟสแกะและเวลาในการเสียงเหมือน ' อย่างไรก็ตาม ฉันไม่พบการอ้างอิงถึงแบบจำลองสัญญาณเสียงของเครื่องดนตรีโพลีโฟนิคใด ๆ ตามการให้สัมภาษณ์บน Youtubeของ Peter Neubacker (คัดลอกด้านล่าง) คุณลักษณะของ Melodyne สำหรับการจัดการกับการแก้ไขเสียงโพลีโฟนิคต้องใช้วิธีที่แตกต่างจากที่อธิบายโดย Thielemann เบาะแสหนึ่งจากคลิป youtube อื่นคือโมเดลของ Neubacker ทำงานได้ดีขึ้นด้วยการบันทึกเสียงของเครื่องดนตรีหนึ่งชนิดเท่านั้น (เช่นเปียโนเท่านั้นกีตาร์เท่านั้นสายเท่านั้นลมเท่านั้น ฯลฯ ) เบาะแสอื่นเป็นอีกคลิปหนึ่งที่แสดงความสามารถในการเปลี่ยนระดับเสียงของโน้ต แต่ยังกำหนดจังหวะเวลาของการเริ่มต้นและสิ้นสุด ด้านล่างนี้เป็นวิดีโอของ youtube ที่กล่าวว่า …
24 frequency 

4
วิธีการตรวจจับจุดสูงสุด
อะไรคืออัลกอริธึมการตรวจจับสูงสุดที่มีอยู่? ฉันมีข้อมูลที่มีเสียงดังและฉันต้องการที่จะใช้การตรวจจับสูงสุดสำหรับข้อมูลนี้ ข้อมูลกลับด้านจริง ๆ แล้วฉันพยายามหาจุดล่าง นี่คือภาพรวมของข้อมูลใน Excel ฉันชอบที่จะตรวจสอบพื้นทั้งสอง ฉันคิดถึงการส่งข้อมูลผ่านตัวกรอง low-pass และจากนั้นทำค่าเฉลี่ยเคลื่อนที่ซึ่งฉันกำหนดยอดเขาและภายในค่าเฉลี่ยเคลื่อนที่ฉันทำการค้นหาอีกครั้ง ฉันมีพื้นหลังเป็นศูนย์ DSP; นี่เป็นเพียงแนวทางสามัญสำนึก ฉันต้องการได้ยินสิ่งที่ผู้เชี่ยวชาญแนะนำ

5
คำสั่งซื้อแรกที่ดีที่สุดของ IIR (ตัวกรอง AR) ใช้กับตัวกรองค่าเฉลี่ยเคลื่อนที่ (ตัวกรอง FIR) คืออะไร
สมมติตัวกรอง IIR อันดับแรกดังต่อไปนี้: y[n]=αx[n]+(1−α)y[n−1]y[n]=αx[n]+(1−α)y[n−1] y[n] = \alpha x[n] + (1 - \alpha) y[n - 1] ฉันจะเลือกพารามิเตอร์αα \alpha st ที่ IIR ประมาณเท่าที่จะทำได้ FIR ซึ่งเป็นค่าเฉลี่ยเลขคณิตของkk k ตัวอย่างล่าสุดได้อย่างไร: z[n]=1kx[n]+1kx[n−1]+…+1kx[n−k+1]z[n]=1kx[n]+1kx[n−1]+…+1kx[n−k+1] z[n] = \frac{1}{k}x[n] + \frac{1}{k}x[n-1] + \ldots + \frac{1}{k}x[n-k+1] โดยที่n∈[k,∞)n∈[k,∞) n \in [k, \infty) หมายถึงอินพุตสำหรับ IIR อาจยาวกว่าkk k และยังต้องการให้การประมาณค่าเฉลี่ยที่ดีที่สุดของอินพุตสุดท้ายkk k ฉันรู้ว่า IIR มีการตอบสนองต่อแรงกระตุ้นอย่างไม่มีที่สิ้นสุดดังนั้นฉันจึงมองหาการประมาณค่าที่ดีที่สุด ฉันยินดีที่จะใช้โซลูชันการวิเคราะห์ไม่ว่าจะเป็นฟังก์ชั่นการคิดต้นทุนL2L2 …

1
คณิตศาสตร์ของการตรวจจับมุมของแฮร์ริส
คำถามนี้ถูกโยกย้ายจาก Stack Overflow เนื่องจากสามารถตอบได้ในการประมวลผลสัญญาณ Stack Exchange อพยพ 7 ปีที่ผ่านมา นี่คือนิพจน์ทางคณิตศาสตร์สำหรับการตรวจจับมุมของแฮร์ริส: แต่ฉันมีข้อสงสัยดังต่อไปนี้: ความสำคัญทางกายภาพของและคืออะไร? อ้างอิงหลายคนบอกว่ามันเป็นเรื่องสำคัญโดยที่หน้าต่างขยับ หน้าต่างเลื่อนไปเท่าไหร่ หนึ่งพิกเซลหรือสองพิกเซลuuuvvvwww ผลรวมของตำแหน่งพิกเซลครอบคลุมโดยหน้าต่างหรือไม่ สมมติว่า ,คือความเข้มของพิกเซลเดียวที่หรือผลรวมของความเข้มภายในหน้าต่างด้วยจุดศูนย์กลางที่ ?w(x,y)=1w(x,y)=1w(x,y) = 1I(x,y)I(x,y)I(x,y)(x,y)(x,y)(x,y)(x,y)(x,y)(x,y) ตามที่วิกิพวกเขาบอกว่าภาพเป็น 2 มิติแสดงโดยฉันแล้วขอให้พิจารณาการปะภาพเหนือพื้นที่จากนั้นใช้สัญกรณ์(x,y)(x,y)(x,y)I(x,y)I(x,y)I(x,y) ฉันพบว่ามันสับสนที่จะเข้าใจคำอธิบายทางคณิตศาสตร์ ใครมีความคิด?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.