มีข้อมูลเชิงลึกที่สำคัญหลายประการที่คุณต้องการเพื่อทำความเข้าใจว่า DFT ช่วยให้คุณเปลี่ยนภาพได้อย่างไร
อย่างแรกทฤษฎีของฟูริเยร์: มันอาจจะง่ายกว่าที่จะดูกรณีต่อเนื่อง (เช่นอะนาล็อก) ก่อน ลองนึกภาพคุณมีฟังก์ชั่นบางอย่างเรียกว่า g (t) สำหรับความเรียบง่ายสมมติว่า g (t) เป็นการบันทึกเสียงแบบอะนาล็อกดังนั้นมันจึงเป็นฟังก์ชั่นหนึ่งมิติซึ่งต่อเนื่องและแสดงถึงความกดดันแบบทันทีทันใดเป็นฟังก์ชั่นของเวลา
ตอนนี้ g (t) เป็นวิธีหนึ่งที่เราสามารถเป็นตัวแทนการบันทึกเสียงของเรา อีกอันคือ G (f) G (f) คือการแปลงฟูริเยร์ของ g (t) ดังนั้น G (f) == FT (g (t)) G (f) มีข้อมูลทั้งหมดเหมือนกับ g (t) แต่มันแสดงถึงข้อมูลนั้นในโดเมนความถี่แทนที่จะเป็นโดเมนเวลา มีรายละเอียดเล็กน้อยเกี่ยวกับการแปลงฟูริเยร์ซึ่งฉันจะไม่พูดถึง
คุณสามารถนึกถึง G (f) เป็น "การแจกแจงความถี่" ที่อยู่ใน g (t) ดังนั้นถ้า g (t) เป็นคลื่นไซน์ (เช่นน้ำเสียงบริสุทธิ์) ดังนั้น G (f) จะเป็นศูนย์ทุกที่ยกเว้นที่ความถี่ของเสียงนั้น นี่อาจเป็นจุดที่ดีที่จะกล่าวถึงว่า G (f) โดยทั่วไปแล้วเป็นฟังก์ชันที่ซับซ้อน - กล่าวได้ว่ามันคืนค่าจำนวนเชิงซ้อนซึ่งสามารถคิดได้ว่ามีองค์ประกอบจริงและจินตภาพหรือขนาดและเฟส
δ(w)δ
ตกลงดังนั้นตอนนี้เรามี FT อย่างต่อเนื่องภายใต้เข็มขัดของเรา
นี่คือข้อมูลเชิงลึกที่สอง: การแปลงฟูริเยร์แบบไม่ต่อเนื่องคือการแปลงฟูริเยร์เนื่องจากสัญญาณตัวอย่างคือสัญญาณอะนาล็อก ในกรณีนี้ "ไม่ต่อเนื่อง" หมายถึงปริมาณของโดเมนของฟังก์ชัน (เวลาหรือความถี่) ไม่ใช่ช่วง (สัญญาณดิจิตอลตัวอย่างที่คุณได้รับจากการ์ดเสียงของคุณนั้นถูกวัดปริมาณทั้งในโดเมนและช่วง)
กระแสดิจิตอลไบต์ที่คุณได้รับจากการ์ดเสียงของคุณมี "ตัวอย่าง" ของสัญญาณต่อเนื่อง (อะนาล็อก) ดั้งเดิมจากไมโครโฟน หากเราใช้ DFT ของตัวอย่าง g (t) เรายังคงได้ G (f) G (f) จำได้ว่าเป็นเพียงวิธีที่แตกต่างในการแสดงข้อมูลที่มีอยู่ใน g (t) หากเราเชื่อฟังทฤษฎีของ Nyquistสัญญาณตัวอย่าง g (t) จะมี "ความฉลาด" ทั้งหมดของสัญญาณต่อเนื่องดั้งเดิมดังนั้น G (f) ที่แยกจากกันของเราจะต้องมีข้อมูลทั้งหมดจากสัญญาณต่อเนื่องดั้งเดิมของเรา Parenthetically, G (f) ยังคงเป็นฟังก์ชันที่ซับซ้อน
นี่คือความมหัศจรรย์ของการเปลี่ยนพิกเซลย่อย แต่ในกรณีนี้ฉันจะเขียนเกี่ยวกับการเปลี่ยนสัญญาณเสียงในเวลาน้อยกว่าตัวอย่างเนื่องจากมันเป็นสิ่งเดียวกัน
eiπ2
นั่นหมายความว่าเราสามารถเปลี่ยนการบันทึกเสียงของเราในเวลา (โดยใด ๆจำนวนเงินที่เราเลือกรวมทั้งส่วนของเวลาตัวอย่างหนึ่ง) โดยเพียงแค่การปรับเปลี่ยนขั้นตอนของ G (t) จริงๆแล้วคำพูดนั้นอาจจะดูธรรมดาไปหน่อย สำหรับสัญญาณที่ไม่ได้วัดปริมาณตัวอย่างจะสามารถปรับเฟสได้โดยพลการ (นี่เป็นส่วนหนึ่งของเหตุผลที่ฉันสร้างความแตกต่างระหว่างการหาปริมาณของโดเมนและช่วงก่อนหน้านี้) อย่างไรก็ตามสำหรับสัญญาณตัวอย่างที่ถูก quantized (ตัวอย่างเช่น byte-stream ของออดิโอ) ขนาดขั้นตอน quantization (เช่นจำนวนบิต) กำหนดความละเอียดที่เราสามารถปรับเฟสได้ เมื่อเราผกผันแปลงฟูริเยร์ G (f) (หรือ DIFT สำหรับสัญญาณตัวอย่างนี้) กลุ่มตัวอย่างใหม่ g '(t) = DIFT (G (F)) ทั้งหมดจะถูกเลื่อนตามเวลาที่เราเลือก
การใช้สิ่งนี้กับพิกเซลของคุณนั้นหมายถึงการใช้ FT แบบ 2 มิติแทน FT แบบ 1 มิติที่กล่าวถึงที่นี่