การประมวลผลสัญญาณ

ถามตอบสำหรับผู้ปฏิบัติงานด้านศิลปะและวิทยาศาสตร์ของการประมวลผลสัญญาณภาพและวิดีโอ

2
การแบ่งส่วนของวัสดุโปร่งใสครึ่งหนึ่งเช่นแก้ว
ฉันติดอยู่กับปัญหาเกี่ยวกับการแบ่งส่วนของวัตถุที่เป็นแก้ว ฉันต้องการวัตถุที่แม่นยำที่สุดเท่าที่จะเป็นไปได้ แนวทางของฉันแตกต่างกัน ตอนแรกฉันพยายามที่จะลบพื้นหลังเพื่อให้มีเพียงส่วนโค้งที่คมชัดเท่านั้น แต่ใช้งานได้กับวัตถุที่มีขอบ / การไล่ระดับสีคม มิฉะนั้นวัตถุก็จะถูกลบออกด้วย ฉันโพสต์ภาพที่แตกต่างกันสองภาพ ฉันพยายามที่จะลบพื้นหลังผ่านการดำเนินการทางสัณฐานวิทยาเช่นการขยายสีเทาและ divison บนมัน แต่มันก็ไม่ได้ช่วยอะไรมาก หลังจากนั้นฉันลองใช้วิธี k โดยใช้ k = 3 เพื่อให้ได้พื้นหลังที่ถูกดัดแปลงแยกออกจากค่าสีเทาและสีดำของแก้ว ไม่ประสบความสำเร็จในบางกรณี แต่ไม่รวม / โดยเฉลี่ย ฉันยังพยายามตรวจจับขอบแสนรู้ด้วยตัวกรองเบลอโดยรวม แต่สิ่งที่นำไปสู่ผลลัพธ์ที่อ่อนแอลงในรูปแบบของรูปทรงเปิดเสียงรบกวนมากมาย ฯลฯ pp Canny ด้วยผลลัพธ์ขีด จำกัด อัตโนมัติ: testimg = imread('http://i.imgur.com/huQVt.png'); imshow(testimg) imedges = edge(testimg,'canny'); imshow(imedges); กันไปสำหรับภาพที่สอง อย่างที่คุณเห็นมีเสียงรบกวนมากมายทั้งในและนอกและเพิ่มขอบสองเท่าจากขอบแก้ว แม้จะมีช่องว่างที่ขอบ ดังนั้นฉันต้องการคำแนะนำของคุณสำหรับวิธีการทั่วไปในการจัดการกับปัญหาของวัสดุกึ่งโปร่งใสนี้ไม่ใช่เพียงแค่ภาพสองภาพนี้ 1) แนวคิดอื่น ๆ สำหรับการลบพื้นหลังโดยไม่ทำให้วัตถุเสียหายหรือไม่ 2) วิธีการแบ่งส่วนอื่น …

1
ฉันและองค์ประกอบ Q และความแตกต่างระหว่าง QPSK และ 4QAM
ทั้ง 4QAM และ QPSK เห็นได้ชัดว่ามีรูปแบบของคลื่นที่เหมือนกัน ในกลุ่ม QPSK จุดทำแผนที่ที่ 45, 135, 225 และ 315 องศาในขณะที่ 4QAM อยู่ที่ 0, 90, 180 และ 270 ฉันยังต้องพยายามทำความเข้าใจองค์ประกอบ I / Q ของแผนภาพกลุ่มดาวเช่นนี้ด้วย "inphase" และ "quadrature-phase" หมายถึงอะไร? พวกเขาเป็นอีกวิธีหนึ่งในการระบุส่วนจริงและจินตภาพของการใช้งานประเภทนี้หรือไม่?

2
จะทำนายได้อย่างไรโดยใช้ข้อมูลโดเมนความถี่
การถดถอยเชิงเส้นและตัวกรองคาลมานสามารถใช้ในการประมาณค่าและทำนายจากลำดับเวลาของข้อมูลในโดเมน หากมีวิธีใดบ้างที่สามารถใช้ในการทำนายโดยใช้ข้อมูลโดเมนความถี่ได้ (เช่นทำนายขั้นตอนในอนาคตโดยใช้ผลลัพธ์จาก FFT ที่เหมาะสมของข้อมูลก่อนหน้าโดยไม่ต้องย้อนกลับไปที่โดเมนเวลาสำหรับการประมาณค่า) ข้อสมมติฐานเกี่ยวกับข้อมูลหรือตัวแบบเบื้องหลังข้อมูลอาจจำเป็นสำหรับสิ่งที่มีคุณภาพหรือการเพิ่มประสิทธิภาพของการทำนายในโดเมนความถี่ (แต่คิดว่ามันไม่เป็นที่ทราบแน่ชัดว่าแหล่งข้อมูลนั้นมีความกว้างรูรับแสง FFT เป็นระยะอย่างเคร่งครัดหรือไม่)

4
ช่วยสมการสำหรับซองจดหมาย ADSR แบบเลขชี้กำลัง
ด้วยรหัสแอปพลิเคชันฉันได้ติดตั้งซอง ADSR แบบเส้นตรงเพื่อสร้างแอมพลิจูดของเอาต์พุตออสซิลเลเตอร์ พารามิเตอร์สำหรับการโจมตีการสลายตัวและระยะเวลาการปล่อยเช่นเดียวกับระดับการรักษาสามารถตั้งค่าบนซองจดหมายและทุกอย่างทำงานตามที่คาดไว้ อย่างไรก็ตามฉันต้องการปรับแต่งรูปร่างของทางลาดให้คล้ายกับสิ่งที่ซินธิไซเซอร์ส่วนใหญ่ใช้สำหรับการตอบสนองที่เป็นธรรมชาติมากขึ้น: ผกผันเลขชี้กำลังสำหรับการโจมตีและเลขชี้กำลังสำหรับการสลายตัวและการปลดปล่อย ฉันมีปัญหาในการทำให้สูตรถูกต้องสำหรับการคำนวณค่าผลลัพธ์ของซองจดหมายสำหรับรูปร่างของทางลาดประเภทนี้ ในการคำนวณทางลาดเชิงเส้นฉันใช้รูปแบบสองจุดเสียบค่าเริ่มต้น / สิ้นสุด /ซึ่งได้มาจากค่าพารามิเตอร์อินพุตการโจมตี / การสลายตัว / การคงอยู่ / การปล่อย ฉันไม่สามารถหาสูตรที่ถูกต้องสำหรับทางลาดแบบเอ็กซ์โปเนนเชียล (แบบมาตรฐานและแบบผกผัน) โดยใช้ค่าจุดเริ่มต้น / สิ้นสุด /เดียวกันxxxYyyxxxYyy ฉันบันทึกเซสชั่นเครื่องคิดเลขกราฟ Desmosที่แสดงให้เห็นถึงวิธีการทางลาดเชิงเส้นที่ฉันอธิบายไว้ข้างต้น หากใครสามารถช่วยชี้ให้ฉันในทิศทางที่ถูกต้องมันจะได้รับการชื่นชมมาก

1
การแสดงออกเชิงวิเคราะห์สำหรับ eigenvector ของเมทริกซ์สมมาตรจริง 3x3 หรือไม่?
ฉันกำลังเขียนอัลกอริทึมที่ประมวลผลภาพ 3 มิติตามช่วงเวลาของความเฉื่อย ฉันมีเมทริกซ์สมมาตรจริง 3x3 ซึ่งฉันต้องหาค่าลักษณะเฉพาะ ฉันได้พบอัลกอริทึมทั่วไปที่หลากหลายสำหรับการทำเมทริกซ์ตามแนวทแยงมุมออกไป แต่ฉันไม่สามารถรู้ได้ว่ามีนิพจน์การวิเคราะห์สำหรับ 3 eigenvctors ของเมทริกซ์ดังกล่าวหรือไม่ ใครบางคนที่มีความเชี่ยวชาญในวิชาคณิตศาสตร์รู้หรือไม่? แก้ไข สำหรับบันทึกที่นี่คือสิ่งที่ฉันได้พบกับคำถามตัวเอง ดังที่ Matthias Odisio พูดไว้คุณไม่สามารถลงไปสู่การแสดงออกเชิงวิเคราะห์อย่างง่ายๆ ได้ทันทีที่คุณมีเมทริกซ์ 3x3 ฉันได้พบ แต่กระดาษเฉพาะสำหรับกรณีพิเศษเมทริกซ์เฮอร์เมียน 3x3 ซึ่งเปรียบเทียบวิธีการเชิงตัวเลขแบบต่างๆ: http://arxiv.org/abs/physics/0610206 นี่คือรหัส C และ Fortran ของกระดาษ: http://www.mpi-hd.mpg.de/personalhomes/globes/3x3/index.html
11 3d  matrix 

1
Thresholding แบบปรับตัวสำหรับการแบ่งส่วนตับโดยใช้ Matlab
ฉันต้องแบ่งตับออกจากภาพ CT ของท้องโดยใช้ Adaptive Thresholding แต่ฉันได้พื้นหน้าทั้งหมดแยกออกจากพื้นหลังเพียงอย่างเดียว ฉันต้องการเพียงส่วนตับของเบื้องหน้าที่แยกจากกัน ลองดูไฟล์ pdf ในhttp://www.ijcaonline.org/casct/number1/SPE34T.pdf ฉันต้องการเอาต์พุตคล้ายกับที่แสดงในรูปที่ 6 ฉันแนบรหัสของฉันที่นี่ กรุณาช่วยฉันออก %testadaptivethresh.m clear;close all; im1=imread('nfliver2.jpg'); bwim1=adaptivethreshold(im1,11,0.03,0); figure,imshow(im1); figure,imshow(bwim1); imwrite(bwim1,'at2.jpg'); function bw=adaptivethreshold(IM,ws,C,tm) %ADAPTIVETHRESHOLD An adaptive thresholding algorithm that seperates the %foreground from the background with nonuniform illumination. % bw=adaptivethreshold(IM,ws,C) outputs a binary image bw with the local % …

2
คุณจะบอกได้อย่างไรว่ามีสัญญาณ (เมื่อสัญญาณของคุณดูเหมือนเสียงรบกวน)
นี่คือเครื่องตรวจกรนของฉันอีกครั้ง ฉันได้รับการตรวจจับสัญญาณที่ดีเมื่อมีสิ่งใดอยู่ในนั้น - สามารถติดตามจากเสียงกรนกราดผนังเพื่อการหายใจที่คุณไม่ได้ยินแม้แต่ในการบันทึก ปัญหาคือฉันไม่สามารถบอกได้เมื่อสัญญาณลดลงต่ำกว่าระดับที่ตรวจพบได้และแอพเป็นเพียง "ได้ยินสิ่ง" และน่าเสียดายที่การกรน / การหายใจมักจะผิดปกติพอที่ความสัมพันธ์แบบง่าย ๆ หรือช่วงเวลาคล้ายกันนั้นไม่น่าจะช่วยอะไรได้มากนัก (และอาจเป็นไปได้ว่าในบางกรณีเสียงดังกว่าปกติในการหายใจ) ดังนั้นจะมีเทคนิคใดที่ฉันขาดหายไปในการหาเมื่อไม่มีสัญญาณหรือไม่? ดูเหมือนว่าฉันกำลังเผชิญหน้ากับสถานที่ที่ยากลำบากที่นี่เนื่องจาก "สัญญาณ" เป็นเสียงเริ่มต้น (และนี่อาจเกี่ยวข้องกับปัญหาอื่นที่ฉันมี: น่าแปลกที่ฉันไม่สามารถวัดระดับสัญญาณได้อย่างแม่นยำแม้จะค่อนข้างดังเนื่องจากฉันต้องใช้ค่าเฉลี่ยและอัตราส่วนการหมุนเพื่อตรวจจับสัญญาณต่อไป ประเภทข้อมูลระดับจะหายไปฉันกำลังมองหาเทคนิคเพื่อสร้างมันขึ้นมาใหม่) เทคนิคพื้นฐาน (สำหรับ Yoda) สัญญาณเสียงถูกสุ่มตัวอย่าง (โดยทั่วไปที่ 8000Hz ด้วยเหตุผลต่าง ๆ ) แล้ว FFTed ใน 1024 บล็อก (ในการทดลองของฉัน Hamming ฟิลเตอร์และบล็อกที่ทับซ้อนกันดูเหมือนจะมีผลเพียงเล็กน้อยแม้ว่าสิ่งเหล่านั้นอาจได้รับการตรวจสอบในภายหลัง) FFT ถูกแบ่งออกเป็น "วงดนตรี" (ปัจจุบัน 5 ขนาดเอียงเล็กน้อยเพื่อวางรายละเอียดเพิ่มเติมในระดับต่ำ) และ "ความแตกต่างของสเปกตรัม" และระดับของแต่ละวงจะถูกรวมเข้าด้วยกัน ค่าเฉลี่ยระยะยาวของค่าสูงสุดที่ จำกัด ใช้เป็น "เกณฑ์" และการปรับตั้งค่าอคติต่อไปจะใช้เพื่อรักษาอัตรา …
11 noise  snr 

1
การปรับสัญญาณ / การตรวจจับการสะดุดในกระแสข้อมูลราบรื่นขึ้น
(แก้ไข: คำถามนี้ตามมาจากการแยกข้อมูลบัตรแถบแม่เหล็กจาก WAV ดิบ ) นี่คือสัญญาณของฉัน (บรรทัดบนสุด) และใช้ตัวกรอง IIR พื้นฐาน (บรรทัดล่างสุด) (แก้ไข: งานของฉันคือการแบ่งสัญญาณออกเป็นไบนารี 0 (ความถี่ F) และไบนารี 1 (ความถี่ 2F) - นั่นคือสาเหตุที่เรียกว่า F2F ดังนั้นฉันต้องประมวลผลในลักษณะที่รับประกันไม่มียอดปลอมในขณะที่ ภาพหน้าจอทำให้ดูไม่สำคัญมีปัญหาที่อาจเกิดขึ้นจากการเพิ่มขึ้นเป็นสองเท่าและการได้รับผลบวกที่ผิดพลาดในร่องระหว่างยอดเขาจริง) คำถามของฉันคือมีวิธีใดบ้างที่ทำให้สัญญาณนี้ราบรื่น IIR เป็นทางออกที่ดีที่สุดของฉันหรือไม่ ฉันเห็นความเป็นไปได้อย่างน้อยสามประการ: IIR y [n] = 0.9 * y [n-1] + 0.1 * x [n] โดยที่ y [x] = 0 เมื่อ x <0 …
11 filters  noise 

1
การลบเสียงรบกวนจากสัญญาณ F2F
(คำถามนี้เกี่ยวข้องกับการดึงข้อมูลบัตรแถบแม่เหล็กแบบไบนารีจาก WAV ดิบ ) ฉันกำลังแยกลำดับเลขฐานสองออกจากแถบแม่เหล็กบนบัตรเครดิต อย่างที่คุณเห็นสัญญาณจะลดลงอย่างชัดเจนในที่เดียว นอกจากนี้ยังมีการย่อยสลายเล็กน้อยทางด้านซ้ายของภาพ เพียงแค่ใช้ IIR (เช่น ) ปรับให้เรียบ แต่สัญญาณที่ได้จะไม่ราบรื่นทางคณิตศาสตร์ ถ้าฉันแยกสัญญาณสองสามครั้งเสียงจะกลับมาพร้อมกับการแก้แค้น:Xo ยูที= 0.9 Xo ยูทีl a s t+ 0.1 XฉันnXโอยูเสื้อ=0.9Xโอยูเสื้อล.asเสื้อ+0.1XผมnX_{\rm out} = 0.9X_{\rm out_{last}} + 0.1X_{\rm in} คำถามของฉันคือ: ฉันสามารถลบเสียงรบกวนในลักษณะที่ตราสารอนุพันธ์ออกมาได้หรือไม่? ถ้าเป็นเช่นนั้นได้อย่างไร แก้ไข:นี่คือภาพโคลสอัพของคลื่นที่เสียหายบางส่วน: แก้ไข (2): สองวิธีที่ฉันกำลังพิจารณา: ประการแรกฉันสามารถทำการประมาณเทย์เลอร์ของสัญญาณทั้งสองด้านของเซกเตอร์ที่เสียหายและผสมผสานการประมาณเข้าด้วยกัน ประการที่สองฉันสามารถ FFT ลบส่วนประกอบความถี่สูงและย้อนกลับ FFT ฉันจะลองวิธีที่สองตอนนี้ ...
11 fft  noise 

2
อัลกอริทึมที่อยู่เบื้องหลังการปรับเลเยอร์“ ขาวดำ” ของ Photoshop คืออะไร?
บางคนสามารถอธิบายอัลกอริทึมที่อยู่เบื้องหลังเลเยอร์การปรับ "ขาวดำ" ใน photoshop ได้ไหม? ฉันต้องทำซ้ำโดยใช้ C ++ สำหรับแอปพลิเคชันที่เน้นพิกเซลที่ไม่ใช่สีแดง / สีม่วงแดง (ish) จากรูปภาพ (ที่มีความอดทนร้อยละเหมือนกำหนดค่าได้) และทรัพยากรนี้แสดงพฤติกรรมที่ฉันคาดหวัง ยังคงทำซ้ำไม่ได้ แต่ฉันพบเบาะแส: แต่ละพิกเซลถูกกำหนดโดยตัวควบคุมมากถึงสองตัวเสริมหนึ่ง (RGB) และหนึ่งลบ (CMY)

1
การใช้ A-weighting
ฉันต้องการคำนวณความดังของสัญญาณที่กำหนดและฉันได้พบกับเธรดนี้ ฉันสับสนเล็กน้อยเกี่ยวกับมุมมอง A-Weighting ของมัน ฉันไม่สามารถโพสต์ภาพได้ แต่ฉันคิดว่าเว็บไซต์นี้มีสูตรที่ฉันต้องการ (Wa = 10log ... ) สิ่งที่ฉันไม่เข้าใจคือวิธีใช้งานจริงในโปรแกรมของฉัน ถ้าค่าfย่อมาจากความถี่ก็น่าจะสามารถ hardcode ค่าเพราะพวกเขาจะคงที่ หากเป็นกรณีนี้ฉันWaจะนำไปใช้กับค่าตัวอย่างของฉันได้อย่างไรและฉันจะใช้ค่าใดได้อย่างไร ฉันคำนวณสเปกตรัมพลังงานเพื่อรับWINDOW_SIZE/2ค่าและคูณแต่ละค่าในแถบความถี่ด้วยWaค่าที่คำนวณล่วงหน้าที่เกี่ยวข้องหรือเป็นวิธีที่ผิดในการทำหรือไม่? ขอบคุณล่วงหน้า.
11 algorithms  audio 

1
การวัดที่แน่นอนของ sparsity คืออะไร?
ฉันกำลังทำงานกับการตรวจจับการบีบอัดและการแสดงสัญญาณเพียงเล็กน้อยโดยเฉพาะภาพ ฉันถูกถามบ่อยครั้งว่า ฉันตอบ "ถ้าองค์ประกอบส่วนใหญ่ของสัญญาณเป็นศูนย์หรือใกล้กับศูนย์ในโดเมนบางอย่างเช่นฟูริเยร์หรือเวฟเล็ตสัญญาณนี้จะเบาบางในพื้นฐานนั้น" แต่มีปัญหาเสมอในคำจำกัดความนี้ "องค์ประกอบส่วนใหญ่หมายถึงอะไรมันเป็น 90 เปอร์เซ็นต์หรือ 80 เปอร์เซ็นต์ต่อครั้งหรือไม่ 92.86 เปอร์เซ็นต์?!" ที่นี่คำถามของฉันเกิดขึ้นมีอะไรที่แน่นอนเช่นตัวเลขความหมายสำหรับ sparsity?
11 sparsity 

2
วิธีจัดการกับพื้นฐานขั้นต่ำเมื่อใช้ AMDF สำหรับการแยกพิทช์?
ฉันกำลังใช้ฟังก์ชั่นค่าความแตกต่างเฉลี่ยเพื่อประเมินความถี่พื้นฐานของสัญญาณเสียงแบบกึ่งระยะเวลา AMDF หมายถึง Dn=1N−n∑k=nN−1|Sk−Sk−n|Dn=1N−n∑k=nN−1|Sk−Sk−n| D_n = \frac{1}{N-n}\sum_{k=n}^{N-1}|S_k - S_{k-n}| ที่ไหน NNNคือความยาวของสัญญาณ ฟังก์ชั่นนี้แสดงขั้นต่ำเมื่อสัญญาณถูกเลื่อนด้วยจำนวนเท่ากับระยะเวลา นี่คือรหัสที่ฉันใช้เพื่อแยก pitch (ใน Matlab): a = amdf(f); a = a/max(a); [p l] = findpeaks(-a, 'minpeakprominence', 0.6); pitch = round(sample_freq/l(1); อย่างไรก็ตามฉันกำลังจัดการกับสัญญาณเสียงที่ความถี่พื้นฐานต่ำมาก: เป็นผลให้เกิดปัญหาการเสแสร้งเกิดขึ้น: ขั้นต่ำที่ตรวจพบสอดคล้องกับครึ่งเวลาของสัญญาณ (เช่นฮาร์โมนิที่สอง): ฉันพยายามที่จะสกัดจุดสูงสุดที่ใหญ่ที่สุดและไม่ใช่แค่ครั้งแรก แต่บางครั้งปัญหานี้ยังคงอยู่ ฉันจะปรับปรุงโค้ดและ / หรือฟังก์ชั่น AMDF เพื่อจัดการกับพื้นฐานขั้นต่ำได้อย่างไร

1
ความแตกต่างระหว่างตัวตรวจจับคุณสมบัติและตัวอธิบายคุณลักษณะคืออะไร
ความแตกต่างระหว่างตัวตรวจจับคุณสมบัติและตัวอธิบายคุณลักษณะคืออะไร ซึ่งในบรรดาสิ่งเหล่านี้คือเครื่องตรวจจับและเป็นตัวบ่งชี้: แฮร์ริสเซิร์ฟมินไอเกนรวดเร็วฟาสต์บริสก์

1
ตัวกรองคาลมาน - เข้าใจเมทริกซ์ความแปรปรวนร่วมของเสียง
อะไรคือความสำคัญของเมทริกซ์ความแปรปรวนร่วมเสียงในกรอบตัวกรองคาลมาน ฉันหมายถึง: เมทริกซ์ความแปรปรวนร่วมของสัญญาณรบกวนความแปรปรวนQ , และ เสียงการวัดความแปรปรวนเมทริกซ์R ในเวลาใดก็ได้ที ฉันจะตีความเมทริกซ์เหล่านี้ได้อย่างไร พวกเขาเป็นตัวแทนอะไร พวกเขาพูดคุยกันหรือไม่ว่าเสียงของการสังเกตหนึ่งเสียงแตกต่างกันไปตามเสียงของการสังเกตการณ์อื่นในเวกเตอร์สถานะหรือไม่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.