คำถามติดแท็ก signal-analysis

10
การเรียนรู้อย่างลึกซึ้งนั้นเป็นการฆ่าการประมวลผลภาพ / การมองเห็นคอมพิวเตอร์หรือไม่?
ฉันรอคอยที่จะลงทะเบียนในปริญญาโทในการประมวลผลสัญญาณและภาพหรือบางทีคอมพิวเตอร์วิสัยทัศน์ (ฉันยังไม่ได้ตัดสินใจ) และคำถามนี้เกิดขึ้น ความกังวลของฉันคือเนื่องจากการเรียนรู้ลึกไม่ต้องการการแยกคุณลักษณะและแทบจะไม่มีการประมวลผลล่วงหน้าอินพุตมันฆ่าการประมวลผลภาพ (หรือการประมวลผลสัญญาณโดยทั่วไป) หรือไม่? ฉันไม่ใช่ผู้เชี่ยวชาญในการเรียนรู้อย่างลึกซึ้ง แต่ดูเหมือนว่าจะทำงานได้ดีมากในการจดจำและจัดประเภทงานถ่ายภาพโดยตรงแทนที่จะเป็นเวกเตอร์คุณลักษณะเช่นเทคนิคอื่น ๆ มีกรณีใดบ้างที่วิธีการแยกคุณสมบัติแบบดั้งเดิม + การจำแนกประเภทจะดีกว่าใช้เทคนิคการประมวลผลภาพหรือสิ่งนี้กำลังจะตายเพราะการเรียนรู้อย่างลึกซึ้ง?

8
ความหมายของการแปลง Hilbert
ฉันเข้าใจการแปลงฟูริเยร์ซึ่งเป็นการดำเนินการทางคณิตศาสตร์ที่ให้คุณดูเนื้อหาความถี่ของสัญญาณที่กำหนด แต่ตอนนี้ในคอมของฉัน แน่นอนอาจารย์แนะนำการเปลี่ยนแปลงของฮิลแบร์ต ผมเข้าใจว่ามันมีการเชื่อมโยงไปยังเนื้อหาที่ค่อนข้างความถี่ที่ได้รับความจริงที่ว่า Hilbert Transform จะคูณ FFT โดยหรือ convolving ฟังก์ชั่นเวลากับปี่ที- เครื่องหมายj( ว( ฉ) )−jsign⁡(W(f))-j\operatorname{sign}(W(f))1 / πเสื้อ1/πt1/\pi t ความหมายของการเปลี่ยนแปลงของฮิลแบร์ตคืออะไร? เราจะได้รับข้อมูลอะไรบ้างจากการนำการแปลงไปใช้กับสัญญาณที่กำหนด?

3
แสดงให้คนอื่นเห็นว่าฉันได้ยินตัวเองอย่างไร
Sooo .. ฉันคิดเกี่ยวกับสิ่งนี้ เราทุกคนรู้ว่าเราเสียงแตกต่างจากสิ่งที่เราได้ยินเสียงของเราเอง มันง่ายที่จะทราบว่าคนอื่นได้ยินเราโดยการบันทึกตนเองและฟัง แต่แล้ววิธีอื่น ๆ ล่ะ? มีวิธีที่จะเปลี่ยนเสียงของเราในแบบที่คนอื่นสามารถได้ยินเราเมื่อเรารับรู้เสียงของเราเองหรือไม่? ฉันคิดว่ามันเป็นคำถามที่น่าสนใจทีเดียว น่าเศร้าที่ฉันไม่พบสิ่งใดบนเว็บหลังจากค้นหา google สองสามครั้ง ไม่มีใครคิดเกี่ยวกับเรื่องนี้หรือเป็นไปไม่ได้เพราะเหตุผลบางอย่างที่ฉันไม่เห็น? ใด ๆ ที่นำไปสู่การนี้จะได้รับการชื่นชม :)

3
ความแตกต่างระหว่างตัวกรองเชิงเส้นและไม่ใช่เชิงเส้นคืออะไร?
ตัวกรองค่าเฉลี่ยเรียกว่าเป็นตัวกรองแบบเชิงเส้นและตัวกรองแบบมัธยฐานเรียกว่าเป็นตัวกรองแบบไม่เชิงเส้นได้อย่างไร ฉันเข้าใจว่าตัวกรองค่าเฉลี่ยและค่ามัธยฐานทำงานอย่างไร แต่ฉันไม่สามารถเกี่ยวข้องกับคำเชิงเส้นและไม่เชิงเส้นได้ โปรดอธิบายฉันด้วยตัวอย่าง

1
ช่วยในการคำนวณ / ทำความเข้าใจเกี่ยวกับ MFCCs: ค่าสัมประสิทธิ์ของ Mel-Frequency
ฉันกำลังอ่านบิตและชิ้นส่วนออนไลน์ แต่ฉันไม่สามารถรวมมันเข้าด้วยกันได้ ฉันมีความรู้พื้นฐานเกี่ยวกับสัญญาณ / สิ่ง DSP ซึ่งน่าจะเพียงพอสำหรับสิ่งนี้ ในที่สุดฉันสนใจที่จะเขียนอัลกอริทึมนี้ใน Java แต่ฉันยังไม่เข้าใจมันอย่างสมบูรณ์ซึ่งเป็นสาเหตุที่ฉันมาที่นี่ (นับเป็นคณิตศาสตร์ใช่ไหม) นี่คือวิธีที่ฉันคิดว่ามันทำงานร่วมกับช่องว่างในความรู้ของฉัน เริ่มต้นด้วยตัวอย่างเสียงพูดของคุณพูดไฟล์. WAV ที่คุณสามารถอ่านเป็นอาร์เรย์ได้ เรียกอาร์เรย์นี้ว่าโดยที่nมีช่วงตั้งแต่0 , 1 , … , N - 1 ( ตัวอย่างNดังนั้น) ค่าที่สอดคล้องกับความเข้มของเสียงที่ฉันเดา - แอมพลิจูดx[n]x[n]x[n]nnn0,1,…,N−10,1,…,N−10, 1, \ldots ,N-1NNN แยกสัญญาณเสียงออกเป็น "เฟรม" ที่แตกต่างกัน 10ms หรือมากกว่านั้นเมื่อคุณถือว่าสัญญาณเสียงพูดคือ "นิ่ง" นี่คือรูปแบบของการหาปริมาณ ดังนั้นหากอัตราตัวอย่างของคุณเป็น 44.1KHz, 10ms เท่ากับ 441 ตัวอย่างหรือค่าของ ]x[n]x[n]x[n] ทำการแปลงฟูริเยร์ (FFT เพื่อประโยชน์ในการคำนวณ) ทีนี้ทำสิ่งนี้กับสัญญาณทั้งหมดหรือในแต่ละเฟรมที่แยกกันของ …

2
อะไรคือข้อดีของการมีอัตราการสุ่มสัญญาณที่สูงขึ้น?
การเป็นนักเรียนวิทยาศาสตร์การประมวลผลสัญญาณที่ไม่ใช่ฉันมีความเข้าใจแนวคิด จำกัด ฉันมีสัญญาณผิดพลาดแบริ่งเป็นระยะอย่างต่อเนื่อง (ที่มีแอมพลิจูดเวลา) ซึ่งสุ่มตัวอย่างที่และความถี่ ฉันใช้เทคนิคการเรียนรู้ของเครื่อง (Convolutional Neural Network) เพื่อจำแนกสัญญาณที่ผิดปกติกับสัญญาณที่ไม่ผิดพลาด12 kHz12 kHz12\textrm{ kHz}48 kHz48 kHz48\textrm{ kHz} เมื่อฉันใช้ฉันสามารถบรรลุความแม่นยำในการจำแนกประเภทความแม่นยำ ในทำนองเดียวกันฉันสามารถบรรลุความถูกต้องของเมื่อฉันใช้เทคนิคเดียวกันกับสัญญาณเดียวกัน แต่ตัวอย่างที่แม้จะมีการบันทึกที่ RPM โหลดและมุมการบันทึกด้วยเซ็นเซอร์เดียวกัน12 kHz12 kHz12\textrm{ kHz}97±1.2%97±1.2%97 \pm 1.2 \%95%95%95\%48 kHz48 kHz48\textrm{ kHz} อะไรคือสาเหตุของอัตราการผิดประเภทที่เพิ่มขึ้นนี้? มีเทคนิคใดบ้างที่สามารถมองเห็นความแตกต่างของสัญญาณได้หรือไม่? สัญญาณความละเอียดสูงมีแนวโน้มที่จะมีเสียงรบกวนสูงขึ้นหรือไม่? รายละเอียดของสัญญาณสามารถดูได้ที่นี่ในบทที่ 3

7
รับค่าสูงสุดของสัญญาณหากความถี่อยู่ระหว่างสอง bin center
โปรดสมมติว่าต่อไปนี้: ความถี่พื้นฐานของสัญญาณได้รับการประมาณโดยใช้ FFT และวิธีการประมาณความถี่บางอย่างและอยู่ระหว่างศูนย์ bin สองแห่ง ความถี่ในการสุ่มตัวอย่างได้รับการแก้ไข ความพยายามในการคำนวณไม่ใช่ปัญหา เมื่อทราบความถี่แล้ววิธีใดที่แม่นยำที่สุดในการประเมินค่าสูงสุดของสัญญาณขั้นพื้นฐาน วิธีหนึ่งอาจเป็นสัญญาณแผ่นเวลาเป็นศูนย์เพื่อเพิ่มความละเอียด FFT เช่นที่ศูนย์ช่องเก็บจะอยู่ใกล้กับความถี่โดยประมาณ ในสถานการณ์นี้จุดหนึ่งที่ฉันไม่แน่ใจเกี่ยวกับคือถ้าฉันสามารถเป็นศูนย์ได้มากเท่าที่ฉันต้องการหรือหากมีข้อบกพร่องบางอย่างในการทำเช่นนั้น อีกอันหนึ่งคือศูนย์ bin ที่ฉันควรเลือกหลังจากการเติมศูนย์เป็นศูนย์ที่ฉันได้รับค่าสูงสุดจาก (เพราะอาจไม่มีความถี่ของดอกเบี้ยที่น่าสนใจแม้แต่หลังจากการเติมเต็มศูนย์) อย่างไรก็ตามฉันยังสงสัยว่ามีวิธีอื่นที่อาจให้ผลลัพธ์ที่ดีกว่าได้หรือไม่ผู้ประเมินที่ใช้ค่าสูงสุดของศูนย์ bin สองแห่งรอบข้างเพื่อประเมินมูลค่าสูงสุดตามความถี่ที่น่าสนใจ

2
ฉันจะตรวจสอบได้อย่างไรว่าสัญญาณไม่ต่อเนื่องเป็นระยะ ๆ
ฉันต้องการทราบวิธีที่ฉันสามารถตรวจสอบว่าชุดของข้อมูลเป็นระยะหรือไม่ ฉันต้องการใช้การแปลงฟูริเยร์ / ซีรีส์ ข้อมูลของฉันมีลักษณะเป็นช่วง ๆ [111100001111000110010101010000101] หรือเป็นระยะ [11001100110011001100] และฉันต้องตัดสินใจว่ามันคืออะไรโดยอัตโนมัติ ฉันสามารถทำการวิเคราะห์หรือคำนวณประเภทใดเพื่อตรวจสอบว่าสัญญาณเป็นระยะหรือไม่

2
ทำไมเราถึงพูดว่า“ การเติมเต็มศูนย์ไม่เพิ่มความละเอียดของความถี่”
นี่คือไซน์ของความถี่f = 236.4 Hz(ยาว 10 มิลลิวินาทีมีN=441คะแนนที่อัตราการสุ่มตัวอย่างfs=44100Hz) และ DFT โดยไม่มีการเติมเต็ม : ข้อสรุปเดียวที่เราสามารถให้ได้โดยดูจาก DFT คือ: "ความถี่ประมาณ 200Hz" นี่คือสัญญาณและ DFT ของมันที่มีการเติมเต็มศูนย์ขนาดใหญ่ : ตอนนี้เราสามารถให้ข้อสรุปที่แม่นยำมากขึ้น : "โดยการดูอย่างละเอียดที่สเปกตรัมสูงสุดฉันสามารถประมาณความถี่ 236Hz" (ฉันซูมและพบว่าค่าสูงสุดอยู่ใกล้ 236) คำถามของฉันคือทำไมเราบอกว่า "ศูนย์ padding ไม่ได้เพิ่มความละเอียด" ? (ฉันเห็นประโยคนี้บ่อยมากจากนั้นพวกเขาพูดว่า "เพิ่มการแก้ไขเท่านั้น") => จากตัวอย่างของฉันการเติมเต็มศูนย์ช่วยให้ฉันค้นหาความถี่ที่ถูกต้องด้วยความละเอียดที่แม่นยำยิ่งขึ้น!

6
มีแอปพลิเคชันที่ใช้งานได้จริงเพื่อทำการแปลงฟูริเยร์คู่หรือไม่? …หรือฟูริเยร์ผกผันแปลงเป็นอินพุตโดเมนไทม์
ในคณิตศาสตร์คุณสามารถหาอนุพันธ์คู่หรือฟังก์ชันอินทิกรัลสองครั้ง มีหลายกรณีที่การแสดงแบบจำลองอนุพันธ์สองครั้งเป็นสถานการณ์จริงในโลกจริงเช่นการค้นหาการเร่งความเร็วของวัตถุ เนื่องจากการแปลงฟูริเยร์ใช้สัญญาณจริงหรือเชิงซ้อนเป็นอินพุตและสร้างสัญญาณที่ซับซ้อนเป็นเอาท์พุทจึงไม่มีอะไรหยุดคุณจากการเอาท์พุทนั้นและใช้การแปลงฟูริเยร์เป็นครั้งที่สอง ... นี้? มันช่วยจำลองสถานการณ์ที่ซับซ้อนจริง ๆ บ้างไหม? ด้วยตรรกะเดียวกันไม่มีอะไรจะหยุดคุณจากการแปลงฟูริเยร์ผกผันของสัญญาณอินพุตโดเมนเวลาดั้งเดิมของคุณ ... สิ่งนี้จะมีประโยชน์หรือไม่? ทำไมหรือทำไมไม่?

1
ฉันและองค์ประกอบ Q และความแตกต่างระหว่าง QPSK และ 4QAM
ทั้ง 4QAM และ QPSK เห็นได้ชัดว่ามีรูปแบบของคลื่นที่เหมือนกัน ในกลุ่ม QPSK จุดทำแผนที่ที่ 45, 135, 225 และ 315 องศาในขณะที่ 4QAM อยู่ที่ 0, 90, 180 และ 270 ฉันยังต้องพยายามทำความเข้าใจองค์ประกอบ I / Q ของแผนภาพกลุ่มดาวเช่นนี้ด้วย "inphase" และ "quadrature-phase" หมายถึงอะไร? พวกเขาเป็นอีกวิธีหนึ่งในการระบุส่วนจริงและจินตภาพของการใช้งานประเภทนี้หรือไม่?

7
เหตุใด DFT ถือว่าสัญญาณที่แปลงเป็นระยะ?
ในหนังสือประมวลผลสัญญาณหลายเล่มอ้างว่า DFT ถือว่าสัญญาณที่แปลงเป็นระยะ (และนี่คือเหตุผลว่าทำไมการรั่วไหลของสเปกตรัมเช่นอาจเกิดขึ้นได้) ทีนี้ถ้าคุณดูนิยามของ DFT ก็ไม่มีข้อสันนิษฐานแบบนั้น อย่างไรก็ตามในบทความ Wikipediaเกี่ยวกับการแปลงฟูริเยร์แบบไม่ต่อเนื่อง (DTFT) มีการระบุไว้ว่า เมื่อมีการป้อนข้อมูลตามลำดับ x [ n ]x[n]x[n] คือ ยังไม่มีข้อความNN-periodic, Eq.2 สามารถลดลงเป็นการแปลงฟูริเยร์โดยสิ้นเชิง (DFT) ดังนั้นสมมติฐานนี้เกิดขึ้นจาก DTFT หรือไม่ ที่จริงแล้วเมื่อคำนวณ DFT ฉันจริง ๆ แล้วทำการคำนวณ DTFT ด้วยการสันนิษฐานว่าสัญญาณเป็นระยะ?

1
ทำไมการสุ่มตัวอย่างสัญญาณต่อเนื่องเป็นระยะทำให้เกิดสัญญาณไม่ต่อเนื่องเป็นระยะ?
ฉันได้ศึกษาสัญญาณและระบบเมื่อเร็ว ๆ นี้และฉันได้พบกับข้อเรียกร้องต่อไปนี้: การสุ่มตัวอย่างอย่างสม่ำเสมอของสัญญาณต่อเนื่องเป็นระยะอาจไม่เป็นระยะ! ใครช่วยอธิบายหน่อยได้ไหมว่าทำไมข้อความนี้ถึงเป็นจริง

3
เลื่อนสัญญาณโดยใช้เศษส่วนของตัวอย่าง
ฉันมีสัญญาณที่มีเวลาตัวอย่าง 0.5 ไมโครวินาทีและฉันต้องการเปลี่ยนสัญญาณนี้โดยใช้เวลาเพียงเศษเสี้ยวของตัวอย่างพูดด้วย 3 นาโนวินาที ฉันได้อ่านแหล่งข้อมูลออนไลน์เกี่ยวกับการกรองการหน่วงเวลาแบบเศษส่วนและการใช้ FFT และ IFFT เพื่อดำเนินการหน่วงเวลาดังกล่าว ใครบางคนสามารถชี้ให้ฉันเห็นทฤษฎีบางอย่างเกี่ยวกับเรื่องนี้หรือให้แนวคิดเกี่ยวกับวิธีการนำไปใช้ สำหรับการเปลี่ยนสัญญาณปกติสำหรับตัวอย่างจำนวนเต็มฉันได้ดำเนินการนี้โดยขยับสัญญาณตามจำนวนตัวอย่างที่ต้องการและเพิ่มศูนย์ที่จุดเริ่มต้น วิธีนี้ถูกต้องหรือไม่

4
คำนวณและตีความความถี่ทันที
ฉันยังใหม่กับหลักการคำนวณความถี่ในทันทีและเกิดคำถามมากมายขึ้นมา คุณพบพวกเขาทั้งหมดในรายการสัญลักษณ์แสดงหัวข้อท้ายข้อความนี้ ข้อความอาจยาวไปหน่อยขอโทษสำหรับเรื่องนั้น แต่ฉันพยายามแก้ปัญหาด้วยตัวเอง ดังนั้นฉันสนใจความถี่ทันที ฉ( t )ฉ(เสื้อ)f(t) ของสัญญาณมูลค่าที่แท้จริง x ( t )x(เสื้อ)x(t). การคำนวณเสร็จสิ้นด้วยความช่วยเหลือของสัญญาณการวิเคราะห์Z( t ) = x ( t ) + j y( t )Z(เสื้อ)=x(เสื้อ)+JY(เสื้อ)z(t) = x(t) + j y(t)ที่ไหน Y( t )Y(เสื้อ)y(t) คือการเปลี่ยนแปลงของฮิลแบร์ต x ( t )x(เสื้อ)x(t). เพื่อคำนวณความถี่ทันทีจากสัญญาณวิเคราะห์ Z( t )Z(เสื้อ)z(t) ฉันติดตามกระดาษ: การคำนวณความถี่ทันทีและแบนด์วิดท์ทันทีโดย Arthur E. Barns จากปี 1992 …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.