ความต้องการสำหรับการจัดศูนย์กลางและข้อมูลที่เป็นมาตรฐานในการถดถอย


16

พิจารณาการถดถอยเชิงเส้นด้วยการทำให้เป็นมาตรฐาน: เช่นค้นหาที่ย่อเล็กสุด| | A x - b | | 2 + λ | | x | |x||Axb||2+λ||x||1

โดยปกติคอลัมน์ของ A จะเป็นมาตรฐานที่จะมีค่าเฉลี่ยศูนย์และบรรทัดฐานของหน่วยในขณะที่ bอยู่ตรงกลางให้มีค่าเฉลี่ยเป็นศูนย์ ฉันต้องการตรวจสอบให้แน่ใจว่าการทำความเข้าใจเกี่ยวกับเหตุผลในการกำหนดมาตรฐานและการจัดกึ่งกลางถูกต้องหรือไม่

ด้วยการทำให้คอลัมน์และbเป็นศูนย์ทำให้เราไม่จำเป็นต้องมีคำดักจับอีกต่อไป มิฉะนั้นวัตถุประสงค์จะเป็น| | A x - x 0 1 - b | | 2 + λ | | x | | 1 . ด้วยการสร้างบรรทัดฐานของคอลัมน์ A เท่ากับ 1 เราจะลบความเป็นไปได้ของกรณีที่เพียงเพราะคอลัมน์หนึ่งคอลัมน์ A มีบรรทัดฐานสูงมากมันจะมีค่าสัมประสิทธิ์ต่ำในxซึ่งอาจทำให้เราสรุปได้ไม่ถูกต้องว่าคอลัมน์ของ A ไม่ "อธิบาย" xAb||Axx01b||2+λ||x||1xxดี

เหตุผลนี้ไม่เข้มงวดอย่างแน่นอน แต่สังหรณ์ใจว่าเป็นวิธีที่เหมาะสมที่จะคิด?

คำตอบ:


14

คุณถูกต้องเกี่ยวกับ zeroing วิธีการของคอลัมน์และbAb

อย่างไรก็ตามสำหรับการปรับเปลี่ยนบรรทัดฐานของคอลัมน์ให้พิจารณาว่าจะเกิดอะไรขึ้นถ้าคุณเริ่มต้นด้วยบรรทัดฐานAและองค์ประกอบทั้งหมดของxมีขนาดเท่ากัน แล้วให้เราคูณคอลัมน์หนึ่งโดยการพูด, 10 - 6 องค์ประกอบที่สอดคล้องกันของxในการถดถอยที่ไม่สม่ำเสมอนั้นจะเพิ่มขึ้นด้วยปัจจัย10 6 ดูว่าจะเกิดอะไรขึ้นกับข้อกำหนดการทำให้เป็นมาตรฐาน? การทำให้เป็นมาตรฐานจะใช้กับค่าสัมประสิทธิ์เดียวเท่านั้น AAx106x106

โดยการสร้างบรรทัดฐานของคอลัมน์เราเขียนโดยสังหรณ์ใจทำให้คอลัมน์ทั้งหมดอยู่ในระดับเดียวกัน ดังนั้นความแตกต่างในขนาดขององค์ประกอบของxจะเกี่ยวข้องโดยตรงกับ "wigginess" ของฟังก์ชั่นการอธิบาย ( A x ) ซึ่งก็คือการพูดอย่างหลวม ๆ สิ่งที่เป็นมาตรฐานพยายามควบคุม โดยไม่ได้ค่าสัมประสิทธิ์การเช่น 0.1 เมื่อเทียบกับอีก 10.0 จะบอกคุณในกรณีที่ไม่มีความรู้เกี่ยวกับไม่มีอะไรเกี่ยวกับการที่ค่าสัมประสิทธิ์การได้รับการบริจาคมากที่สุดกับ "wiggliness" ของx (สำหรับฟังก์ชันเชิงเส้นเช่นA x "wigginess" เกี่ยวข้องกับการเบี่ยงเบนจาก 0)AxAxAAxAx

เพื่อกลับไปยังคำอธิบายของคุณถ้าคอลัมน์หนึ่งของมีบรรทัดฐานสูงมากและด้วยเหตุผลบางอย่างที่ได้รับต่ำค่าสัมประสิทธิ์ในxเราจะไม่สรุปว่าคอลัมน์ของไม่ "อธิบาย" xดี Aไม่ได้ "อธิบาย" xเลย AxAxAx


คุณหมายถึง$x$ does not ''explain'' $A$ wellและหมายความว่าx does not ''explain'' $A$ at allอย่างไร คือข้อมูลในขณะที่xเป็นตัวแบบในกรณีนี้ Ax
user3813057

@ user3813057 - นี่เป็นคำถามเกี่ยวกับการทำให้เป็นมาตรฐานและไม่มีส่วนเกี่ยวข้องกับพลังในการอธิบาย จะมากขึ้นมักจะมีป้ายβ , จะมากขึ้นมักจะมีป้ายXและBจะมีมากขึ้นมักจะมีป้ายกำกับY xคือไม่ได้มีการอธิบายที่ทั้งหมด xβAXbyxA
jbowman
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.