การถดถอยเชิงเส้น: การแจกแจงแบบไม่ปกติใด ๆ ที่แสดงเอกลักษณ์ของ OLS และ MLE?


13

คำถามนี้ได้รับแรงบันดาลใจจากการอภิปรายที่ยาวนานในความคิดเห็นที่นี่: การถดถอยเชิงเส้นใช้การกระจายแบบปกติอย่างไร

ในรูปแบบการถดถอยเชิงเส้นตามปกติเพื่อความง่ายในการเขียนนี่มีเพียงตัวทำนายเดียว: โดยที่เป็นค่าคงที่ที่รู้จักกันและเป็นข้อผิดพลาดอิสระที่ไม่มีค่าเฉลี่ยศูนย์ หากเรายังถือว่าการแจกแจงปกติสำหรับข้อผิดพลาดตัวประมาณกำลังสองน้อยที่สุดและตัวประมาณความน่าจะเป็นสูงสุดของจะเหมือนกันx ฉันϵ ฉันβ 0 , β 1

Yi=β0+β1xi+ϵi
xiϵiβ0,β1

ดังนั้นคำถามง่าย ๆ ของฉัน: มีการแจกแจงอื่น ๆ สำหรับข้อผิดพลาดเช่นนั้น mle เหมือนกันกับตัวประมาณค่า squaeres น้อยที่สุดหรือไม่? ความหมายหนึ่งแสดงให้เห็นได้ง่ายส่วนอีกเรื่องหนึ่งไม่เป็นเช่นนั้น


1
(+1) มันจะต้องมีการกระจายศูนย์กลางรอบศูนย์และดูเหมือนว่ามันจะช่วยถ้ามันเป็นสมมาตร ผู้สมัครบางคนที่เข้ามาในใจเช่นการกระจาย t- หรือ Laplace ดูเหมือนจะไม่หลอกลวงในขณะที่ MLE คือแม้ในกรณีคงที่เท่านั้นไม่มีในรูปแบบปิดหรือกำหนดโดยค่ามัธยฐานตามลำดับ
Christoph Hanck

ดูstats.stackexchange.com/questions/99014/..ด้วยดูเหมือนว่ามีหลายสิ่งเท่านั้นที่จะหา
Christoph Hanck

ฉันแน่ใจว่าคำตอบคือไม่ อาจเป็นเรื่องยากที่จะเขียนหลักฐานที่เข้มงวดอย่างไรก็ตาม
Gordon Smyth

คำตอบ:


11

ในการประเมินความเป็นไปได้สูงสุดเราคำนวณ

β^ML:lnf(ϵi)β=0f(ϵi)f(ϵi)xi=0

ความสัมพันธ์ครั้งสุดท้ายโดยคำนึงถึงโครงสร้างความเป็นเส้นตรงของสมการการถดถอย

ในการเปรียบเทียบ OLS ประมาณ

ϵixi=0

เพื่อให้ได้นิพจน์พีชคณิตที่เหมือนกันสำหรับสัมประสิทธิ์ความชันเราจำเป็นต้องมีความหนาแน่นสำหรับเทอมผิดพลาดเช่นนั้น

f(ϵi)f(ϵi)=±cϵif(ϵi)=±cϵif(ϵi)

นี่คือสมการเชิงอนุพันธ์ของรูปแบบที่มีวิธีแก้ไขy=±xy

1ydy=±xdxlny=±12x2

y=f(ϵ)=exp{±12cϵ2}

ฟังก์ชันใด ๆ ที่มีเคอร์เนลนี้และรวมเข้ากับความเป็นเอกภาพในโดเมนที่เหมาะสมจะทำให้ MLE และ OLS เป็นค่าสัมประสิทธิ์ความชันเหมือนกัน คือเรากำลังมองหา

g(x)=Aexp{±12cx2}:abg(x)dx=1

มีที่ไม่ใช่ความหนาแน่นปกติ (หรือครึ่งปกติหรืออนุพันธ์ของฟังก์ชันข้อผิดพลาด) หรือไม่? g

อย่างแน่นอน แต่อีกสิ่งหนึ่งที่เราต้องพิจารณาคือ: หากมีการใช้เครื่องหมายบวกในเลขชี้กำลังและการสนับสนุนแบบสมมาตรรอบศูนย์เช่นหนึ่งจะได้รับความหนาแน่นที่มีค่าต่ำสุดที่ไม่ซ้ำกันในกลางและสูงสุดท้องถิ่นสองที่ ขอบเขตของการสนับสนุน


คำตอบที่ดี (+1) แต่ถ้าใช้เครื่องหมายบวกในฟังก์ชั่นมันจะเป็นความหนาแน่นหรือไม่ ปรากฏว่าฟังก์ชั่นนั้นมีอินทิกรัลไม่สิ้นสุดจึงไม่สามารถทำให้เป็นมาตรฐานได้กับฟังก์ชันความหนาแน่น หากเป็นกรณีนี้เราจะเหลือการกระจายแบบปกติเท่านั้น
เบ็น - คืนสถานะโมนิก้า

1
(a,b)

นั่นเป็นความจริง - ฉันคิดเอาเอง
เบ็น - คืนสถานะโมนิก้า

5

argβ0,β1mini=1n(yiβ0β1xi)2
f(y|x,β0,β1)
argβ0,β1mini=1nlog{f(yi|xi,β0,β1)}=argβ0,β1mini=1n(yiβ0β1xi)2
f 0 ( y | x ) ( β 0 , β 1 )
f(y|x,β0,β1)=f0(y|x)exp{ω(yiβ0β1xi)2}
f0(y|x)(β0,β1)

การตั้งค่าอีกประการหนึ่งที่ตัวประมาณค่าทั้งสองเกิดขึ้นพร้อมกันเมื่อข้อมูลมาจากการกระจายแบบสมมาตรคือเมื่อข้อมูล (เวกเตอร์)มีความหนาแน่นตามเงื่อนไขด้วยฟังก์ชั่นลดลง (ในกรณีนี้ OLS ยังคงใช้งานได้แม้ว่าข้อสันนิษฐานของความเป็นอิสระของจะถูกเก็บไว้ในกรณีปกติเท่านั้น) h ( | | y - X β | | ) h ( ) ϵ iy

h(||yXβ||)
h()ϵi

1
สิ่งนี้ดูไม่ถูกต้องสำหรับฉัน หากคุณใช้การกระจายแบบสมมาตรทรงกลมที่แตกต่างกันนั่นจะไม่นำไปสู่การลดฟังก์ชั่นของบรรทัดฐานต่าง ๆ ให้น้อยที่สุด (ไม่ใช่การประมาณกำลังสองน้อยที่สุด) ใช่หรือไม่?
เบ็น - คืนสถานะโมนิก้า

1

ฉันไม่รู้เกี่ยวกับคำถามนี้จนกว่า @ Xi'an เพิ่งอัปเดตพร้อมคำตอบ มีวิธีแก้ปัญหาทั่วไปมากขึ้น การแจกแจงแบบครอบครัวแบบเอกซ์โพเนนเชียลที่มีพารามิเตอร์บางตัวให้ผลตอบแทนคงที่กับ Bregman divergences สำหรับการแจกแจงแบบนี้หมายความว่าเป็น minimizer OLS minimizer ก็เป็นค่าเฉลี่ยเช่นกัน ดังนั้นสำหรับการแจกแจงแบบนี้พวกเขาควรจะเกิดขึ้นพร้อมกันเมื่อฟังก์ชันเชิงเส้นเชื่อมโยงกับพารามิเตอร์ค่าเฉลี่ย

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.75.6958&rep=rep1&type=pdf

ป้อนคำอธิบายรูปภาพที่นี่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.