การประมวลผลสัญญาณ

ถามตอบสำหรับผู้ปฏิบัติงานด้านศิลปะและวิทยาศาสตร์ของการประมวลผลสัญญาณภาพและวิดีโอ

1
การสังเคราะห์เสียงพูดต้องการประสิทธิภาพของ CPU น้อยมาก
ย้อนกลับไปในสมัยที่คอมพิวเตอร์ส่วนบุคคลซีพียู 8 MHz 8 บิต (Apple II, Atari 800, et.al. ) มีโปรแกรมซอฟต์แวร์ที่สามารถทำการสังเคราะห์ข้อความเป็นคำพูดที่เข้าใจง่ายบนพีซีเหล่านั้น อัลกอริธึมการสังเคราะห์เสียงพูดที่เผยแพร่ใดที่อาจเหมาะสำหรับการนำไปใช้กับตัวควบคุมขนาดเล็กที่มีประสิทธิภาพและหน่วยความจำ จำกัด ใกล้เคียงกัน? (ถ้ามี...)

1
คำจำกัดความต่างๆสำหรับ
คำนิยามของดูเหมือนจะเป็นหอคอยบาเบลในอุตสาหกรรม คำจำกัดความของมีอะไรบ้าง(รู้สึกฟรีกับแอปพลิเคชันของไซต์) และสามารถวัดได้อย่างแม่นยำสำหรับแอปพลิเคชันนั้น ๆS N RS N RSNR\rm SNRS N RSNR\rm SNR คำถามเฉพาะของฉันเกี่ยวกับคือ:S N RSNR\rm SNR เราจะวัดสำหรับระบบสื่อสารได้อย่างไรถ้าเรายังไม่สามารถบรรลุเวลาสุ่มตัวอย่างบิตที่ดีที่สุดและสิ่งที่เราต้องทำงานด้วยคือสัญญาณทั้งหมดในเครื่องรับถึงและรวมถึงซองจดหมายของ I และ ช่อง Q ดูโพสต์นี้สำหรับบริบทS N RSNR\rm SNR เมื่อเราได้รับการสุ่มตัวอย่างบิตที่ดีที่สุดและได้รับ softbits แล้ววิธีที่ดีที่สุดในการวัด (หรือ ) วิธีหนึ่งที่ฉันใช้คือ: E b N 0 10 บันทึก10 [ mean { | s n | 2 }S N RSNR\rm SNREขยังไม่มีข้อความ0EbN0E_bN_010 บันทึก10[ …
13 noise  bpsk  snr 

4
วิธีการตรวจหามุมในภาพไบนารีด้วย OpenGL?
ฉันมีภาพไบนารีขนาด 160x120 เช่น: ฉันต้องการตรวจหามุมของหยดสีขาวเหล่านั้น ก่อนหน้านี้พวกเขาถูกปิดโดยสัณฐานวิทยาทางคณิตศาสตร์ดังนั้นจึงไม่ควรมีมุมด้านใน ในกรณีเฉพาะนี้ฉันต้องการ 16 มุมเช่น: ความพยายามครั้งแรกของฉันคือการใช้ฟังก์ชั่น OpenCV บางอย่างเช่นgoodFeaturesToTrackหรือFASTแต่มันช้ามากเป็นพิเศษ (บวกกับ FAST นั้นไม่เสถียรมาก) ความคิดของฉันคือการคำนวณเช่นนี้ใน GPU เนื่องจากภาพต้นฉบับของฉันมาจากมัน ฉันค้นหาความคิดบนเว็บเกี่ยวกับวิธีการเขียนเฉดสี (ฉันใช้ OpenGL ES 2.0) แต่ไม่มีอะไรเป็นรูปธรรม ความคิดใดที่ฉันจะเริ่มอัลกอริธึมแบบนั้นได้?

3
ความหมายของจริงและส่วนจินตภาพของการแปลงฟูริเยร์ของสัญญาณ
Sayสัญญาณเวลา ,ฟูริเยร์มันเปลี่ยนของตัวแปรวีffftttFFFvvv เป็นที่ทราบกันว่าในพิกัดเชิงขั้วบอกเราว่าความถี่อยู่เหนือสัญญาณมากแค่ไหนและจะบอกเราว่าความถี่ของการมีส่วนร่วมนั้นเปลี่ยนเฟสเท่าใด|F(v)||F(v)||F(v)|vvvArg(F(v))Arg(F(v))Arg(F(v)) ส่วนที่แท้จริงและจินตภาพของข้อมูลบอกอะไรเรา หรือถ้าฉันปรับคำถาม: เราสามารถตีความการแปลงฟูริเยร์ในพิกัดคาร์ทีเซียนเหมือนที่เราสามารถทำได้ในพิกัดเชิงขั้วหรือไม่?

2
คำอธิบายที่เข้าใจง่ายของความสัมพันธ์ข้ามในโดเมนความถี่
ตามทฤษฎีบทความสัมพันธ์ข้าม: ความสัมพันธ์ข้ามระหว่างสองสัญญาณเท่ากับผลคูณของการแปลงฟูริเยร์ของสัญญาณหนึ่งคูณด้วยคอมเพล็กซ์ที่ซับซ้อนของการแปลงฟูริเยร์ของสัญญาณอื่น หลังจากทำสิ่งนี้แล้วเมื่อเรารับสัญญาณของผลิตภัณฑ์เราจะได้จุดสูงสุดซึ่งบ่งชี้การเปลี่ยนแปลงระหว่างสัญญาณทั้งสอง ฉันไม่สามารถเข้าใจวิธีการทำงานนี้ได้อย่างไร ทำไมฉันถึงได้จุดสูงสุดซึ่งบ่งบอกถึงการเปลี่ยนแปลงระหว่างสัญญาณทั้งสอง ฉันได้คณิตศาสตร์มาจาก: http://mathworld.wolfram.com/Cross-CorrelationTheorem.html แต่ฉันไม่สามารถเข้าใจได้ว่าสิ่งนี้มีความหมายอย่างไรโดยสัญชาตญาณ ใครช่วยกรุณาอธิบายหรือชี้แนะฉันไปที่เอกสารที่ถูกต้องได้ไหม? ขอบคุณ!

4
การแบ่งส่วนและการรับรู้ชื่อหนังสือและผู้แต่งจากภาพชั้นหนังสือ
ฉันพยายามเพื่อจุดประสงค์การเรียนรู้ของฉันเองเพื่อพัฒนาการใช้อัลกอริทึมที่จะเขียนรายการหนังสือโดยกำหนดภาพของชั้นวางหนังสือดังนี้ ขั้นตอนแรกคือการแบ่งภาพออกเป็นแต่ละเล่ม อัลกอริทึมของฉันในMathematicaคือ: img = ColorConvert[Import["http://i.stack.imgur.com/IaLQk.jpg"], "GrayScale"] ทำการตรวจจับขอบพื้นฐาน & ลบข้อความและพยายามรักษาความยาวบรรทัด edge = DeleteSmallComponents[EdgeDetect[img, 3],Last[ImageDimensions[img]]/5] จากนั้นลบเส้นแนวนอนที่ไม่พึงประสงค์ lines = Sort[ImageLines[img5] /. {{0., _}, {_, _}} -> Sequence[]] Show[img, Graphics[{Thick, Orange, Line /@ lines}]] แม้ว่าผลลัพธ์จะน้อยกว่ามาก: คำถามของฉันคือ: ฉันจะปรับปรุงสิ่งนี้เพื่อให้ได้ผลลัพธ์ที่ดีขึ้นได้อย่างไร มีวิธีที่ฉลาดกว่านี้หรือไม่? ฉันควรประมวลผลรูปภาพเพิ่มเติมเพื่อเพิ่มความแม่นยำในระยะ OCR (ในภายหลัง) อย่างไร จะใช้ข้อมูลสีเพื่อปรับปรุงการแบ่งส่วนได้อย่างไร

3
มีทางเลือกอื่นของการกระจายสัญญาณของสัญญาณในการตรวจจับแบบบีบอัด
ข้อสันนิษฐานเริ่มต้นสำหรับการตรวจจับแบบบีบอัด (CS) คือสัญญาณพื้นฐานนั้นเบาบางในบางกรณีเช่นมีค่าสัมประสิทธิ์ฟูริเยร์สูงสุดที่ไม่เป็นศูนย์สำหรับ สัญญาณ -sparse และประสบการณ์ชีวิตจริงแสดงให้เห็นว่าสัญญาณภายใต้การพิจารณามักกระจัดกระจายsss คำถามคือ - ให้สัญญาณก่อนที่จะส่งบิตตัวอย่างที่ถูกบีบอัดไปยังเครื่องรับและปล่อยให้เธอฟื้นความสามารถที่ดีที่สุดของเธอให้มีวิธีที่จะบอกว่า sparsity ของมันคืออะไรและถ้ามันเป็นผู้สมัครที่เหมาะสมสำหรับการบีบอัด รู้สึกแรก? อีกวิธีหนึ่งหรือมีลักษณะพิเศษเพิ่มเติม / ทางเลือกของ sparsity ที่สามารถบอกเราได้อย่างรวดเร็วว่า CS จะเป็นประโยชน์หรือไม่ ใครจะเห็นว่าผู้ส่งสามารถทำสิ่งที่ผู้รับจะทำกับชุดของการวัดแบบสุ่มและลองหาคำตอบ แต่มีวิธีอื่นในการแก้ไขคำถามนี้หรือไม่ ความสงสัยของฉันคือสิ่งนี้ต้องได้รับการศึกษา แต่ฉันไม่พบตัวชี้ที่ดี หมายเหตุ: ฉันได้โพสต์คำถามนี้ใน Mathoverflow ไม่กี่สัปดาห์ก่อน แต่ไม่ได้รับคำตอบ ดังนั้นการโพสต์ข้าม

2
การดำเนินการประมวลผลภาพที่จำเป็นก่อนการจับคู่แม่แบบ
นี่อาจแสดงว่าฉันไม่ได้เข้าคลาสการประมวลผลภาพ ฉันมีเทมเพลตนี้เพื่อจับคู่วัตถุในภาพ ตัวอย่างเช่นวัตถุจริงในภาพไม่ได้มีลักษณะเช่นนั้น แต่เป็นภาพที่สอง ฉันต้องใช้การดำเนินการใดเพื่อให้ภาพอย่างที่สองต้องพร้อมสำหรับการจับคู่แม่แบบ FYI ภาพที่สามแสดงให้เห็นถึงการจับคู่ที่เหมาะ ในความคิดอื่นฉันพอดีแม่แบบกับภาพ นั่นคือฉันให้พิกัดสี่มุมในภาพเพื่อให้ตรงกับที่อยู่ในแม่แบบ จากนั้นมันจะคำนวณวิธีการให้พอดีกับแม่แบบกับพื้นที่ UPDATE: แก้ไขปัญหาแล้ว ขอบคุณคำตอบที่ฉันเลือกด้านล่าง ฉันประสบความสำเร็จในการจัดการที่จะใช้แม่แบบของฉันในภาพ ภาพสุดท้ายแสดงผลลัพธ์

5
การแปลงฟูริเยร์แบบไม่ต่อเนื่องเวลา
ฉันเป็นนักเรียนมัธยมต้นที่มีความหลงใหลในอุปกรณ์อิเล็กทรอนิกส์การเขียนโปรแกรมและสิ่งที่ชอบ เมื่อเร็ว ๆ นี้ฉันได้เรียนรู้เกี่ยวกับการประมวลผลสัญญาณ น่าเสียดายที่ฉันยังไม่ได้ทำแคลคูลัสมาก (ยกโทษให้ฉัน) ดังนั้นฉันจึงสับสนเล็กน้อยในเรื่องต่างๆ หากคุณต้องคำนวณ DTFT ของสัญญาณอะไรคือความแตกต่างระหว่างการเป็นตัวแทนหรือของสัญญาณนั้นsinsin\sincoscos\cos ด้วย DTFT ฉันเข้าใจว่าสัญญาณที่คุณป้อนเข้ามานั้นไม่ต่อเนื่อง แต่ในโลกนี้คุณสามารถรับสัญญาณต่อเนื่องในโดเมนความถี่ได้อย่างไร สิ่งนี้นำไปสู่คำถามที่สองของฉันซึ่งคือ: DTFT มีประโยชน์อย่างไร แอปพลิเคชั่นส่วนใหญ่มีการใช้งานที่ไหนและทำไม? ฉันอยากจะขอบคุณความช่วยเหลือใด ๆ.

2
คำอธิบายทางคณิตศาสตร์ที่ดีเกี่ยวกับปรากฏการณ์ของกิ๊บส์
ฉันอธิบายให้คนฟังว่าชุดฟูริเยร์ทำงานอย่างไรในบริบทของการสร้างสัญญาณที่ไม่สามารถหาได้จากที่ใดก็ได้เช่นคลื่นสี่เหลี่ยม, คลื่นหยัก, ฟันเลื่อยเป็นต้นเมื่อฉันพูดถึงปรากฏการณ์กิ๊บส์ฉันรู้ว่าฉันไม่เคยรู้เลยว่าทำไม ในความเป็นจริงเมื่อเรื่องราวดำเนินไปทุกคนไม่ได้ตระหนักว่ามันเป็นสมบัติทางคณิตศาสตร์ที่แท้จริงของสัญญาณอนุกรมเป็นระยะและไม่มีความบังเอิญในการคำนวณและปรากฎว่าการพิสูจน์ส่วนใหญ่ค่อนข้างลำบากและซับซ้อน หลังจากอ่านหลาย ๆ เล่มฉันเริ่มตระหนักว่าทำไมปรากฏการณ์ดังกล่าวอาจเกิดขึ้น แต่ฉันมีพื้นหลังในการวิเคราะห์ที่แท้จริงและซับซ้อนทอพอโลยีและอื่น ๆ คำถามคือฉันสามารถอธิบายและพิสูจน์ปรากฏการณ์กิ๊บส์ได้อย่างเต็มที่ทางคณิตศาสตร์กับคนที่มีเพียงหลักสูตรระดับปริญญาตรีแคลคูลัสขั้นพื้นฐานในคลังแสงของพวกเขา (หรือวิชาบังคับทั่วไปอื่น ๆ สำหรับหลักสูตรการประมวลสัญญาณระดับปริญญาตรี) ถ้าเป็นเช่นนั้นได้อย่างไร

2
แพ็คเกจการระบุระบบ
ฉันกำลังมองหาทางเลือกอื่นสำหรับเครื่องมือระบุตัวตนของ Matlab แต่ความธรรมดาสามัญของคำว่า "ระบบ" และ "ตัวตน" กำลังทำให้การค้นหาสับสน มีห้องสมุดแบบสแตนด์อโลนที่เขียนขึ้นเพื่อจุดประสงค์นี้หรือไม่? (ใน C ++, C #, Python และอื่น ๆ )

2
สามารถใช้ DCT สำหรับสเปกตรัมขนาดเสียงแทน DFT ได้หรือไม่
จากสิ่งที่ฉันเข้าใจ DCT มีขนาดครึ่งถังเป็น DFT ที่มีขนาดเท่ากัน N DFT ยังรวมข้อมูลเฟสด้วย แต่บ่อยครั้งที่สิ่งนี้ไม่จำเป็นเมื่อต้องการสเปกตรัมขนาดเท่านั้น DCT สามารถนำมาใช้เพื่อให้สเปกตรัมขนาดที่มีความหนาแน่นเป็นสองเท่า (ระยะห่างครึ่งช่องเก็บขยะ) ของ DFT หรือข้อมูลเฟสขาดหายไปได้หรือไม่? ทับซ้อนกัน 50% แล้วล่ะ
13 dct  dft 

2
ความแปรปรวนร่วมกับความสัมพันธ์อัตโนมัติ
ฉันพยายามที่จะคิดออกว่ามีความสัมพันธ์โดยตรงระหว่างแนวคิดเหล่านี้ อย่างเคร่งครัดจากคำจำกัดความพวกเขาดูเหมือนจะเป็นแนวคิดที่แตกต่างกันโดยทั่วไป ยิ่งฉันคิดถึงมันมากเท่าไหร่ฉันก็ยิ่งคิดว่าพวกมันคล้ายกันมากเท่านั้น ให้X,YX,YX,Yเป็นเวกเตอร์สุ่ม WSS ความแปรปรวนร่วมCXYCXYC_{XY}กำหนดโดยCXY=E[(X−μx)(Y−μy)H]CXY=E[(X−μx)(Y−μy)H]C_{XY}=E\left[(X-\mu_x)(Y-\mu_y)^H\right]โดยที่HHHหมายถึง Hermitian ของเวกเตอร์ ให้เป็นเวกเตอร์สุ่มของ WSS ฟังก์ชั่น autocorrelation, , มอบให้โดยZZZRXXRXXR_{XX}RZZ(τ)=E[(Z(n)−μz)(Z(n+τ)−μz)H]RZZ(τ)=E[(Z(n)−μz)(Z(n+τ)−μz)H]R_{ZZ}(\tau)=E\left[\left(Z(n)-\mu_z\right)\left(Z(n+\tau)-\mu_z\right)^H\right] แก้ไขหมายเหตุมีการแก้ไขคำจำกัดความนี้ตามที่ใช้กับการประมวลผลสัญญาณดูคำตอบของ Matt ด้านล่าง ความแปรปรวนร่วมไม่เกี่ยวข้องกับแนวคิดของเวลามันถือว่าแต่ละองค์ประกอบของเวกเตอร์แบบสุ่มเป็นการก่อให้เกิดความแตกต่างของเครื่องกำเนิดแบบสุ่ม ความสัมพันธ์อัตโนมัติถือว่าเวกเตอร์แบบสุ่มเป็นวิวัฒนาการเวลาของตัวสร้างแบบสุ่มเริ่มต้น แต่ในท้ายที่สุดแล้วพวกเขาทั้งสองเป็นเอนทิตีทางคณิตศาสตร์ที่เหมือนกันลำดับของตัวเลข ถ้าคุณปล่อยให้มันจะปรากฏขึ้นมีอะไรที่ฉันขาดหายไปอีกหรือเปล่า?X=Y=ZX=Y=ZX=Y=ZCXY=RZZCXY=RZZC_{XY}=R_{ZZ}

3
การแปลงฟูริเยร์แบบไม่ต่อเนื่อง: เทอมดีซีคืออะไร?
ขณะนี้ฉันกำลังเล่นกับ Discrete Fourier Transform (DFT) ใน Matlab เพื่อดึงคุณสมบัติต่าง ๆ จากภาพ ฉันชอบที่จะเข้าใจแนวคิดที่ฉันใช้อย่างเต็มที่ ฉันได้อ่านคำอธิบายหลายอย่างเช่นนี้แต่จนถึงขณะนี้ยังไม่มีใครอธิบายความหมายของคำศัพท์ DC ได้ ทั้งหมดที่ฉันรู้ก็คือเทอม k'the ของDFTนั้นสามารถเขียนเป็น: ที่ เป็นปัจจัย twiddle นั่นหมายความว่าเทอมแรก (เทอม DC) คือแอมพลิจูดที่ไม่มีความถี่ มีคนอธิบายได้ไหมว่าเพราะเหตุใดจึงเรียกว่าคำศัพท์ DC? อะไรคือความสัมพันธ์กับ "กระแสตรง" และความเกี่ยวข้องของเทอม DC คืออะไร? มันจะมีประโยชน์เมื่อใดและเพื่ออะไร
13 image  matlab  fft  dft 

2
ตัวเลือกของการประชุมและสัญกรณ์สำหรับการแปลงฟูริเยร์?
คำจำกัดความของการแปลงฟูริเยร์และการแปลงฟูริเยร์ที่ฉันเรียนรู้ในวิทยาลัยคือ เอฟ( T ) = 1F( j ω ) = ∫∞- ∞ฉ( t ) e- j ω t dเสื้อF(Jω)=∫-∞∞ฉ(เสื้อ)อี-Jωเสื้อ dเสื้อ F(j\omega) = \int_{-\infty}^{\infty} f(t) e^{-j\omega t}\ dt ฉ( t ) = 12 π∫∞- ∞F( j ω ) ej ω tdωฉ(เสื้อ)=12π∫-∞∞F(Jω)อีJωเสื้อdω f(t)=\frac{1}{2\pi}\int_{-\infty}^{\infty}F(j\omega)e^{j\omega t} d\omega ลักษณะเด่นของอนุสัญญานี้คือ การแปลงแบบไม่รวมกัน; หน่วยโดเมนความถี่คือเรเดียน (ตัวแปรคือ )ωω\omega หน่วย "โดเมนเวลา" …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.