การกำหนดฟังก์ชันการกระชับส่วนโค้งที่เหมาะสมที่สุดจากฟังก์ชันเชิงเส้น, เลขชี้กำลังและฟังก์ชันลอการิทึม


18

บริบท:

จากคำถามเกี่ยวกับ Mathematics Stack Exchange (ฉันสามารถสร้างโปรแกรม)มีใครบางคนมีชุดของจุดและต้องการให้พอดีกับเส้นโค้งกับมันเส้นเชิงเส้นชี้แจงหรือลอการิทึม วิธีปกติคือการเริ่มต้นด้วยการเลือกหนึ่งในวิธีเหล่านี้ (ซึ่งระบุรุ่น) แล้วทำการคำนวณทางสถิติx-Y

แต่สิ่งที่เป็นที่ต้องการจริงๆคือการหาเส้นโค้ง 'ที่ดีที่สุด' จากเส้นตรง, เลขชี้กำลังหรือลอการิทึม

เห็นได้ชัดว่าใครจะลองทั้งสามและเลือกเส้นโค้งที่พอดีที่สุดของทั้งสามตามค่าสัมประสิทธิ์สหสัมพันธ์ที่ดีที่สุด

แต่อย่างใดฉันรู้สึกว่านี่ไม่ใช่เพียว วิธีที่ได้รับการยอมรับโดยทั่วไปคือการเลือกแบบจำลองของคุณก่อนหนึ่งในสามนั้น (หรือฟังก์ชันการเชื่อมโยงอื่น ๆ ) จากนั้นข้อมูลจะคำนวณค่าสัมประสิทธิ์ และโพสต์พฤตินัยการเลือกที่ดีที่สุดของทั้งหมดคือการเก็บเชอร์รี่ แต่สำหรับฉันไม่ว่าคุณจะกำหนดฟังก์ชั่นหรือค่าสัมประสิทธิ์จากข้อมูลที่ยังคงเป็นสิ่งเดียวกันขั้นตอนของคุณคือการค้นพบสิ่งที่ดีที่สุด ... (สมมติว่าฟังก์ชันใดคือ

คำถาม:

  • เหมาะสมหรือไม่ที่จะเลือกแบบจำลองการกระชับที่ดีที่สุดจากแบบจำลองเชิงเส้นเอ็กซ์โพเนนเชียลและลอการิทึมตามการเปรียบเทียบสถิติแบบเต็ม?
  • ถ้าเป็นเช่นนั้นวิธีที่เหมาะสมที่สุดในการทำเช่นนี้คืออะไร?
  • หากการถดถอยช่วยค้นหาพารามิเตอร์ (สัมประสิทธิ์) ในฟังก์ชั่นเหตุใดจึงไม่มีพารามิเตอร์ที่แยกออกมาเพื่อเลือกว่าตระกูลใดในสามตระกูลที่ดีที่สุดมาจากไหน

1
ฉันได้เพิ่มแท็กการเลือกรุ่นเพื่อความสะดวกของคุณ: การเชื่อมโยงผ่านจะทำให้เกิดเธรดที่เกี่ยวข้องโดยตรงจำนวนมาก แท็กอื่น ๆ มูลค่ามอง ได้แก่AIC ในที่สุดคุณควรค้นพบว่าคำแถลงทางคณิตศาสตร์ของปัญหานี้หายไปสององค์ประกอบที่จำเป็น: คำอธิบายว่าทำไมและทำไมคะแนนอาจเบี่ยงเบนจากเส้นโค้งเชิงทฤษฎีและการบ่งชี้ว่าค่าใช้จ่ายของการไม่ได้เส้นโค้งที่ถูกต้อง ขาดองค์ประกอบเหล่านั้นมีวิธีการต่าง ๆ มากมายที่สามารถสร้างคำตอบที่แตกต่างกันแสดงว่า "ดีที่สุด" ไม่ถูกต้อง
whuber

1
คุณสามารถกำหนดเปอร์เซ็นต์ของข้อมูลของคุณเพื่อทำการตรวจสอบความถูกต้องของโมเดลและเลือกโมเดลที่เหมาะกับชุดข้อมูลการตรวจสอบที่ดีที่สุด ดังนั้นคุณจะต้องมีชุดข้อมูลที่แตกต่างกันสามชุดเพื่อแยกข้อมูลของคุณออกเป็น 1. ข้อมูลในการฝึกอบรมรุ่นเดียว 2. ข้อมูลที่ตรวจสอบแต่ละรุ่นที่ให้คุณเลือกรูปแบบที่ดีที่สุดและ 3. ข้อมูลการตรวจสอบความถูกต้องสุดท้ายของคุณ .
kleineg

1
@kleineg ฟังดูเหมือนทิศทางที่ถูก ตัวเลือกของแบบจำลอง (เช่นระหว่าง lin / exp / log) เป็นเหมือน hyperparameter โมเดลเดียวซึ่งในบางแง่ก็เป็นอีกขั้นของพารามิเตอร์ปกติและก้าวเข้าสู่มันโดยการแยกขบวนรถไฟ / การตรวจสอบ / การตรวจสอบ / การทดสอบที่แยกได้
มิทช์

สิ่งที่เกี่ยวข้อง: {วิธีที่ฉลาดเกินกว่าที่จะเหมาะสม] ( johndcook.com/blog/2015/03/17/a-subtle-way-to-over-fit ) - การเลือกฟังก์ชั่นแบบจำลองต่างๆ (เช่น exp กับ linear vs log) เป็นเพียง พารามิเตอร์อื่น คุณอาจคิดว่ามันเป็นไฮเปอร์พารามิเตอร์ (ซึ่งจะต้องมีขั้นตอนการตรวจสอบ) หรือพารามิเตอร์ปกติในฟังก์ชั่นที่ซับซ้อนของการรวมกัน (ซึ่งมันจะถูกทดสอบในขั้นตอนการทดสอบ)
Mitch

คำตอบ:


9
  • คุณอาจต้องการที่จะตรวจสอบซอฟแวร์ฟรีที่เรียกว่าEureqa มันมีจุดประสงค์เฉพาะของกระบวนการอัตโนมัติในการค้นหาทั้งรูปแบบการทำงานและพารามิเตอร์ของความสัมพันธ์การทำงานที่กำหนด
  • หากคุณกำลังเปรียบเทียบรุ่นด้วยจำนวนพารามิเตอร์ที่แตกต่างกันโดยทั่วไปคุณจะต้องการใช้ขนาดที่พอดีซึ่งลงโทษรุ่นที่มีพารามิเตอร์มากกว่า มีวรรณกรรมมากมายที่การวัดความเหมาะสมเหมาะสมที่สุดสำหรับการเปรียบเทียบแบบจำลองและปัญหามีความซับซ้อนมากขึ้นเมื่อแบบจำลองไม่ซ้อนกัน ฉันสนใจที่จะฟังสิ่งที่คนอื่นคิดว่าเป็นดัชนีเปรียบเทียบแบบจำลองที่เหมาะสมที่สุดในสถานการณ์ของคุณ (เป็นประเด็นข้างเคียงเมื่อเร็ว ๆ นี้มีการอภิปรายในบล็อกของฉันเกี่ยวกับดัชนีการเปรียบเทียบแบบจำลองในบริบทของการเปรียบเทียบแบบจำลองสำหรับการปรับเส้นโค้ง)
  • จากประสบการณ์ของฉันมีการใช้แบบจำลองการถดถอยแบบไม่เชิงเส้นด้วยเหตุผลเกินกว่าความเหมาะสมทางสถิติอย่างแท้จริงกับข้อมูลที่ได้รับ:
    1. ตัวแบบที่ไม่ใช่เชิงเส้นทำให้การทำนายมีความน่าเชื่อถือมากขึ้นนอกช่วงของข้อมูล
    2. โมเดลที่ไม่ใช่เชิงเส้นต้องการพารามิเตอร์น้อยลงเพื่อให้พอดี
    3. แบบจำลองการถดถอยแบบไม่เชิงเส้นมักถูกนำไปใช้ในโดเมนที่มีการวิจัยก่อนหน้านี้จำนวนมากและการเลือกรูปแบบการชี้นำทฤษฎี

5

นี่เป็นคำถามที่ใช้ได้ในโดเมนที่หลากหลายมาก

โมเดลที่ดีที่สุดคือโมเดลที่สามารถทำนายจุดข้อมูลที่ไม่ได้ใช้ระหว่างการประมาณค่าพารามิเตอร์ ในอุดมคติแล้วจะคำนวณพารามิเตอร์โมเดลด้วยชุดย่อยของชุดข้อมูลและประเมินประสิทธิภาพพอดีกับชุดข้อมูลอื่น หากคุณมีความสนใจในรายละเอียดทำการค้นหาด้วย "การตรวจสอบข้าม"

ดังนั้นคำตอบสำหรับคำถามแรกคือ "ไม่" คุณไม่สามารถใช้โมเดลที่เหมาะสมที่สุด ภาพที่คุณใส่พหุนามเหมาะสมกับจุดข้อมูล N ถึง N นี่จะเป็นแบบที่สมบูรณ์แบบเพราะทุกรุ่นจะผ่านจุดข้อมูลทุกจุด อย่างไรก็ตามรุ่นนี้จะไม่พูดคุยกับข้อมูลใหม่

วิธีที่เหมาะสมที่สุดเท่าที่ฉันจะบอกได้คือการคำนวณว่าแบบจำลองของคุณสามารถพูดคุยกับชุดข้อมูลอื่น ๆ ได้มากเพียงใดโดยใช้เมตริกที่ลงโทษความกว้างของส่วนที่เหลือและจำนวนพารามิเตอร์ในแบบจำลองของคุณ AIC และ BIC เป็นบางส่วนของการวัดเหล่านี้ฉันรู้


3

เนื่องจากผู้คนจำนวนมากสำรวจความพอดีของเส้นโค้งที่หลากหลายกับข้อมูลของพวกเขาเป็นประจำฉันจึงไม่ทราบว่าการจองของคุณมาจากที่ไหน ได้รับมีความจริงที่ว่าสมการกำลังสองจะพอดีอย่างน้อยเป็นเส้นตรงและลูกบาศก์อย่างน้อยเช่นเดียวกับกำลังสองดังนั้นมีวิธีการทดสอบความสำคัญทางสถิติของการเพิ่มคำไม่เป็นเชิงเส้นและดังนั้น หลีกเลี่ยงความซับซ้อนที่ไม่จำเป็น แต่การฝึกขั้นพื้นฐานของการทดสอบความสัมพันธ์ในรูปแบบต่าง ๆ นั้นเป็นเพียงการฝึกฝนที่ดี อันที่จริงแล้วเราอาจเริ่มต้นด้วยการถดถอยแบบยืดหยุ่นมากเพื่อดูว่าเส้นโค้งแบบไหนที่เหมาะสมที่สุด


3
ไม่ว่าสมการกำลังสองจะดีกว่าหรือไม่นั้นก็ขึ้นอยู่กับว่าคุณจะปฏิบัติงานได้อย่างไร โดยเฉพาะอย่างยิ่งหากคุณใช้การวัดความพอดีที่ลงโทษโมเดลที่มีพารามิเตอร์มากขึ้น (เช่น AIC) ตัวอย่างเช่นความพอดีอาจแย่กว่าสำหรับกำลังสองกับเชิงเส้น
Jeromy Anglim

9
@rolando บางทีฉันอาจเข้าใจผิด แต่ตรงไปตรงมาคำแนะนำ (ไม่มีเงื่อนไข) นี้เป็นประเภทของสิ่งที่ในฐานะนักสถิติเราใช้เวลามากในการ "ต่อสู้" โดยเฉพาะอย่างยิ่งหาก OP มีความสนใจในสิ่งใดนอกเหนือจากการปรับเส้นโค้งอย่างง่ายเช่นการทำนายหรือการอนุมานมันเป็นสิ่งสำคัญมากที่จะต้องเข้าใจความหมายของ "ลองสิ่งที่คุณคิดได้" กับสถิติ
พระคาร์ดินัล

2
ฉันมีปัญหาในการปรับความคิดเห็นเหล่านี้ด้วยประเพณีของ Anscombe, Tukey, Mosteller, Tufte และ Cleveland ซึ่งเน้นความจำเป็นที่จะต้องเห็นภาพและสำรวจข้อมูลและปรับขนาดรูปร่างของความสัมพันธ์แต่ละแบบก่อนสร้างแบบจำลองสร้าง coeffiencients หรือ สร้างสถิติอื่น ๆ
rolando2

8
มีข้อโต้แย้งมากมายเกี่ยวกับแนวทางของพวกเขา วิธีที่ง่ายเกินไปในการสรุปปัญหาเหล่านี้คือถ้าคุณต้องการเรียนรู้เกี่ยวกับรูปแบบและทำการค้นพบใหม่ที่ต้องมีการตรวจสอบในภายหลังการวิเคราะห์เชิงสำรวจนั้นเหมาะสม หากคุณต้องการวาดการอนุมาน (เหตุผลจากตัวอย่างโดยเฉพาะไปยังประชากรทั่วไปโดยใช้ค่า P ช่วงเวลาความมั่นใจ ฯลฯ ) ไม่มากนัก
Frank Harrell

4
นี่เป็นหัวข้อแสดงความคิดเห็นที่มีประสิทธิผลที่สุดที่ฉันเคยเห็นใน CV โดยเฉพาะการแลกเปลี่ยน b / t rolando2 (3 ^) & @FrankHarrell ฉันยังพบว่าทั้งสองวิธีน่าสนใจมาก ความละเอียดของตัวเองคือการวางแผนว่าจะทดสอบก่อนและเพียงการทดสอบ / พอดีว่ารูปแบบเพื่อประโยชน์ของการวาดข้อสรุป บริษัท แต่ยังอย่างทั่วถึงสำรวจข้อมูล (w / o เชื่อว่าผลจำเป็นต้องค้างไว้) เพื่อประโยชน์ในการค้นพบสิ่งที่อาจจะเป็นจริง & การวางแผนสำหรับการศึกษาต่อไป (ฉันควรใช้การศึกษาอื่น & ตรวจสอบบางอย่างมันน่าสนใจ / สำคัญหรือไม่) กุญแจสำคัญคือความเชื่อของคุณเกี่ยวกับผลลัพธ์ของการวิเคราะห์เหล่านี้
gung - Reinstate Monica

3

คุณต้องค้นหาความสมดุลระหว่างวิทยาศาสตร์ / ทฤษฎีที่นำไปสู่ข้อมูลและสิ่งที่ข้อมูลบอกคุณ เช่นเดียวกับที่คนอื่นพูดถ้าคุณปล่อยให้ตัวเองเข้ากับการเปลี่ยนแปลงที่เป็นไปได้ (พหุนามในระดับใด ฯลฯ ) จากนั้นคุณจะจบลงด้วยการฟิตและรับบางสิ่งที่ไร้ประโยชน์

วิธีหนึ่งในการโน้มน้าวตัวคุณเองคือการจำลองสถานการณ์ เลือกหนึ่งในโมเดล (เชิงเส้น, เอ็กซ์โปแนนเชียล, บันทึก) และสร้างข้อมูลที่ตามหลังโมเดลนี้ (พร้อมตัวเลือกพารามิเตอร์) หากความแปรปรวนแบบมีเงื่อนไขของคุณของค่า y มีค่าน้อยเมื่อเทียบกับการแพร่กระจายของตัวแปร x ดังนั้นพล็อตแบบง่ายจะทำให้เห็นได้ชัดว่าแบบจำลองใดถูกเลือกและความจริงคืออะไร แต่ถ้าคุณเลือกชุดพารามิเตอร์ที่ไม่ชัดเจนจากพล็อต (อาจเป็นกรณีที่โซลูชันการวิเคราะห์น่าสนใจ) จากนั้นวิเคราะห์แต่ละวิธีทั้ง 3 วิธีและดูว่าแบบใดที่เหมาะสมที่สุด ฉันคาดหวังว่าคุณจะพบว่าพอดี "ดีที่สุด" มักจะไม่พอดี "จริง"

ในทางกลับกันบางครั้งเราต้องการให้ข้อมูลบอกเราให้มากที่สุดและเราอาจไม่มีวิทยาศาสตร์ / ทฤษฎีเพื่อกำหนดลักษณะของความสัมพันธ์อย่างเต็มที่ กระดาษต้นฉบับโดย Box and Cox (JRSS B, vol. 26, no. 2, 1964) กล่าวถึงวิธีการเปรียบเทียบระหว่างการแปลงหลายครั้งในตัวแปร y ชุดการแปลงที่กำหนดมีเชิงเส้นและบันทึกเป็นกรณีพิเศษ (แต่ไม่ใช่เลขชี้กำลัง) แต่ไม่มีอะไรในทฤษฎีของกระดาษที่ จำกัด คุณไว้เพียงครอบครัวแห่งการเปลี่ยนแปลงวิธีการเดียวกันอาจขยายออกไปเพื่อรวมการเปรียบเทียบระหว่าง 3 แบบที่คุณสนใจ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.