การประมาณค่าแบบจำลองเลขชี้กำลัง


10

รูปแบบเลขชี้กำลังเป็นรูปแบบที่อธิบายโดยสมการต่อไปนี้:

yi^=β0eβ1x1i++βkxki

วิธีที่ใช้กันมากที่สุดที่ใช้ในการประเมินแบบจำลองนี้คือการทำให้เป็นเส้นตรงซึ่งสามารถทำได้อย่างง่ายดายโดยการคำนวณลอการิทึมของทั้งสองฝ่าย อะไรคือแนวทางอื่น ๆ ? ฉันสนใจเป็นพิเศษสำหรับผู้ที่สามารถจัดการในการสังเกตyi=0

อัปเดต 31.01.2011
ฉันตระหนักถึงความจริงที่ว่ารุ่นนี้ไม่สามารถสร้างศูนย์ได้ ฉันจะอธิบายรายละเอียดเล็กน้อยเกี่ยวกับสิ่งที่ฉันทำตัวแบบและทำไมฉันถึงเลือกรุ่นนี้ สมมติว่าเราต้องการทำนายจำนวนเงินที่ลูกค้าใช้ในร้าน แน่นอนว่าลูกค้าจำนวนมากกำลังมองหาอยู่และพวกเขาไม่ได้ซื้ออะไรเลยทำไมมี 0 ฉันไม่ต้องการใช้แบบจำลองเชิงเส้นเพราะมันสร้างค่าลบจำนวนมากซึ่งไม่สมเหตุสมผล เหตุผลอื่นคือโมเดลนี้ทำงานได้ดีจริง ๆ ดีกว่าแบบเส้นตรงมาก ฉันใช้อัลกอริทึมทางพันธุกรรมเพื่อประมาณค่าพารามิเตอร์เหล่านั้นดังนั้นมันจึงไม่ใช่วิธีการทางวิทยาศาสตร์ ตอนนี้ฉันอยากจะรู้วิธีจัดการกับปัญหาโดยใช้วิธีการทางวิทยาศาสตร์มากขึ้น สามารถสันนิษฐานได้ว่าตัวแปรส่วนใหญ่หรือทั้งหมดเป็นตัวแปรไบนารี่


1
หากมีเลขศูนย์ในข้อมูลของคุณการถดถอยแบบเลขชี้กำลังอาจไม่เหมาะสมเนื่องจากตัวแบบตามที่คุณระบุจะไม่สามารถตรวจสอบค่าศูนย์ได้
mpiktas

คำตอบ:


11

มีหลายประเด็นที่นี่

(1) รูปแบบที่จะต้องมีความน่าจะเป็นอย่างชัดเจน ในเกือบทุกกรณีจะไม่มีชุดของพารามิเตอร์ที่ lhs ตรงกับ rhs สำหรับข้อมูลทั้งหมดของคุณ: จะมีส่วนที่เหลือ คุณต้องตั้งสมมติฐานเกี่ยวกับสิ่งที่เหลืออยู่ คุณคาดหวังให้พวกเขาเป็นศูนย์โดยเฉลี่ย? มีการกระจายแบบสมมาตรหรือไม่? จะกระจายประมาณปกติ?

ต่อไปนี้เป็นสองรุ่นที่เห็นด้วยกับรุ่นที่ระบุ แต่อนุญาตให้มีพฤติกรรมการตกค้างที่แตกต่างกันอย่างเห็นได้ชัด คุณสามารถเปลี่ยนแปลงแบบจำลองเหล่านี้ได้โดยสมมติฐานที่แตกต่างกันเกี่ยวกับการแจกแจงร่วมของ :ϵi

B: y i = β 0 exp ( β 1 x 1

A: yi=β0exp(β1x1i++βkxki+ϵi)
B: yi=β0exp(β1x1i++βkxki)+ϵi.

(โปรดทราบว่าสิ่งเหล่านี้เป็นแบบจำลองสำหรับข้อมูล โดยปกติจะไม่มีสิ่งเช่นค่าข้อมูลโดยประมาณ )^ y iyiyi^

(2) ความจำเป็นในการจัดการค่าศูนย์สำหรับ y หมายถึงรูปแบบที่ระบุไว้ (A) ทั้งผิดและไม่เพียงพอเพราะมันไม่สามารถสร้างค่าเป็นศูนย์ไม่ว่าข้อผิดพลาดแบบสุ่มจะเท่ากับ รุ่นที่สองด้านบน (B) อนุญาตให้มีค่าศูนย์ (หรือลบ) ของ y อย่างไรก็ตามเราไม่ควรเลือกแบบจำลองเพียงอย่างเดียวบนพื้นฐานดังกล่าว หากต้องการย้ำข้อ # 1: เป็นสิ่งสำคัญที่ควรสร้างแบบจำลองข้อผิดพลาดที่เหมาะสม

(3) Linearization การเปลี่ยนแปลงรูปแบบ โดยทั่วไปแล้วจะส่งผลในรูปแบบเช่น (A) แต่ไม่ชอบ (B) มันถูกใช้โดยผู้ที่วิเคราะห์ข้อมูลของพวกเขามากพอที่จะรู้ว่าการเปลี่ยนแปลงนี้จะไม่ส่งผลกระทบอย่างมีนัยสำคัญต่อการประมาณค่าพารามิเตอร์และโดยคนที่ไม่รู้ในสิ่งที่เกิดขึ้น (มันยากหลายครั้งที่จะบอกความแตกต่าง)

(4) วิธีทั่วไปในการจัดการกับความเป็นไปได้ของค่าศูนย์คือการเสนอว่า (หรือการแสดงออกอีกครั้งของมันเช่นรากที่สอง) มีโอกาสในเชิงบวกอย่างเคร่งครัดเท่ากับศูนย์ ในทางคณิตศาสตร์เรากำลังผสมมวลจุด ("ฟังก์ชันเดลต้า") เข้ากับการแจกแจงแบบอื่น โมเดลเหล่านี้มีลักษณะดังนี้:y

f(yi)F(θ);θj=βj0+βj1x1i++βjkxki

โดยที่เป็นหนึ่งในพารามิเตอร์โดยปริยายในเวกเตอร์ ,คือบางส่วนของการแจกแจงพารามิเตอร์ โดยและคือการแสดงออกของฟังก์ชัน (ฟังก์ชัน "ลิงก์" ของโมเดลเชิงเส้นทั่วไป: ดูการตอบกลับของ onestop) (แน่นอนดังนั้น =เมื่อ ) ตัวอย่างคือศูนย์พอง Poisson และรูปแบบทวินามเชิงลบθ F θ 1 , , θ j f y Pr F θ [ f ( Y ) t ] ( 1 - θ j + 1 ) F θ ( t ) t 0PrFθ[f(Y)=0]=θj+1>0θFθ1,,θjfyPrFθ[f(Y)t](1θj+1)Fθ(t)t0

(5) ปัญหาของการสร้างรูปแบบและเนื้อมันมีความสัมพันธ์กัน แต่ที่แตกต่างกัน เป็นตัวอย่างง่ายๆแม้รูปแบบการถดถอยปกติสามารถทำได้หลายวิธีโดยใช้กำลังสองน้อยที่สุด (ซึ่งให้ค่าพารามิเตอร์เดียวกันกับโอกาสสูงสุดและข้อผิดพลาดมาตรฐานเดียวกันเกือบทั้งหมด) การทำซ้ำอย่างน้อยกำลังสองน้อยที่สุดรูปแบบอื่น ๆ ของ "ความแข็งแกร่งกำลังสองน้อยที่สุด " ฯลฯ การเลือกอุปกรณ์ที่เหมาะสมมักจะขึ้นอยู่กับความสะดวกความสะดวก ( เช่นความพร้อมของซอฟต์แวร์) ความคุ้นเคยนิสัยหรือการประชุม แต่อย่างน้อยบางคนก็ควรคิด มอบให้กับสิ่งที่เหมาะสมสำหรับการกระจายที่สันนิษฐานของข้อผิดพลาดไปยังสิ่งที่ϵ iY=β0+β1X+ϵϵiฟังก์ชั่นการสูญเสียสำหรับปัญหาอาจจะสมเหตุสมผลและเป็นไปได้ของการใช้ประโยชน์จากข้อมูลเพิ่มเติม (เช่นการกระจายก่อนหน้าสำหรับพารามิเตอร์)


10

นี่คือโดยทั่วไปรูปแบบเชิงเส้น (GLM) ด้วยการเข้าสู่ระบบฟังก์ชั่นการเชื่อมโยง

การแจกแจงความน่าจะเป็นใด ๆ ในโดยไม่มีความหนาแน่นเป็นศูนย์ที่ศูนย์จะจัดการในการสังเกตการณ์บางอย่าง; ที่พบมากที่สุดจะเป็นการกระจาย Poisson ผลในPoisson ถดถอยการสร้างแบบจำลองอาคาเข้าสู่ระบบเชิงเส้น อีกทางเลือกหนึ่งที่จะเป็นการกระจายทวินามเชิงลบ[0,)yi=0

หากคุณไม่มีข้อมูลการนับหรือถ้ารับค่าที่ไม่ใช่จำนวนเต็มคุณยังสามารถใช้เฟรมเวิร์กของตัวแบบเชิงเส้นทั่วไปโดยไม่ต้องระบุการแจกแจงแบบเต็มสำหรับแทน เพียงระบุความสัมพันธ์ระหว่างค่าเฉลี่ยและความแปรปรวนของตนโดยใช้กึ่งโอกาส P ( y i | x )yiP(yi|x)


ความอัปยศฉันไม่ได้รับการสอนเกี่ยวกับเรื่องนี้ที่มหาวิทยาลัย: / ดูเหมือนว่าจะเป็นประโยชน์ในกรณีนี้ แต่ฉันต้องการเวลาในการเจาะลึกรายละเอียด ขอบคุณ!
Tomek Tarczynski

โปรดทราบว่าสามารถลดขนาดเป็นจำนวนเต็มได้เสมอเมื่อมีเหตุผลเช่นวัดเพนนี / เซ็นต์แทนที่จะเป็นปอนด์ / ดอลลาร์ แม้ว่าคุณอาจต้องการปัดเศษเป็นปอนด์ / ดอลลาร์ที่ใกล้ที่สุดอยู่แล้วเนื่องจากการกระจายของเพนนี / เซนต์ส่วนหนึ่งของราคาสินค้ามีแนวโน้มที่จะไม่สม่ำเสมอมาก (เช่น 99 ส่วนใหญ่) yi
James

3

คุณสามารถใช้กำลังสองน้อยที่สุดเชิงเส้นไม่ได้ จากนั้นโมเดลของคุณจะเป็น:

yi=β0exp(β1x1i+...+βkxki)+εi

ศูนย์ในนั้นจะได้รับการปฏิบัติเหมือนเบี่ยงเบนจากแนวโน้มที่ไม่ใช่เชิงเส้นyi


แล้วค่าเริ่มต้นของพารามิเตอร์ล่ะ? วิธีที่ดีในการเลือกพวกเขาคืออะไร? ตามที่ฉันระบุไว้ในการปรับปรุงอาจสันนิษฐานว่าไม่มีตัวแปรต่อเนื่อง
Tomek Tarczynski

@Tomek ฉันคิดว่าไม่มีวิธีที่ดีในการเลือกพวกเขา โดยปกติจะขึ้นอยู่กับข้อมูล ฉันแนะนำค่าเฉลี่ยสำหรับการสกัดกั้นและศูนย์สำหรับค่าสัมประสิทธิ์อื่น ๆ
mpiktas
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.