ฉันได้ตั้งโปรแกรมนี้ตั้งแต่เริ่มต้นเมื่อไม่กี่ปีที่ผ่านมาและฉันมีไฟล์ Matlab สำหรับทำการถดถอยเชิงเส้นอย่างชาญฉลาดบนคอมพิวเตอร์ของฉัน จุดหยุดประมาณ 1 ถึง 4 สามารถคำนวณได้ประมาณ 20 จุดในการวัด จุดพัก 5 หรือ 7 จุดเริ่มมากเกินไป
วิธีการทางคณิตศาสตร์ที่บริสุทธิ์อย่างที่ฉันเห็นคือลองชุดค่าผสมที่เป็นไปได้ทั้งหมดตามที่ผู้ใช้ mbq แนะนำในคำถามที่เชื่อมโยงกับในความคิดเห็นด้านล่างคำถามของคุณ
เนื่องจากเส้นที่ติดตั้งนั้นต่อเนื่องกันและอยู่ติดกัน (ไม่มีการเหลื่อมกัน) คอมบิเนเตอร์จะตามสามเหลี่ยม Pascals หากมีการซ้อนทับกันระหว่างจุดข้อมูลที่ใช้โดยส่วนของเส้นผมเชื่อว่า combinatorics จะตามตัวเลขสเตอร์ลิงของชนิดที่สองแทน
ทางออกที่ดีที่สุดในใจของฉันคือการเลือกการรวมกันของสายการประกอบที่มีค่าเบี่ยงเบนมาตรฐานต่ำสุดของค่าความสัมพันธ์ R ^ 2 ของสายการประกอบ ฉันจะพยายามอธิบายด้วยตัวอย่าง โปรดทราบว่าการสอบถามว่ามีจุดพักจำนวนเท่าใดที่ควรพบในข้อมูลคล้ายกับการถามคำถาม "ชายฝั่งอังกฤษยาวเท่าไหร่" ในฐานะหนึ่งในเบอนัวต์แมนเดลบอต (นักคณิตศาสตร์) มีเอกสารเกี่ยวกับเศษส่วน และมีการแลกเปลี่ยนระหว่างจำนวนจุดพักและความลึกการถดถอย
ตอนนี้เป็นตัวอย่าง
YxxY
x12345678910111213141516171819202122232425262728Y123456789109876543212345678910R2l ฉันn e 11 , 0001 , 0001 , 0001 , 0001 , 0001 , 0001 , 0001 , 0001 , 0001 , 0000 , 97090 , 89510 , 77340 , 61340 , 43210 , 25580 , 11390 , 027200 , 00940 , 02220 , 02780 , 02390 , 01360 , 00320 , 00040 , 01180 , 04R2l i n e 20 , 04000 , 01180 , 00040 , 00310 , 01350 , 02380 , 02770 , 02220 , 0093- 1 , 9780 , 02710 , 11390 , 25580 , 43210 , 61340 , 77330 , 89510 , 97081 , 0001 , 0001 , 0001 , 0001 , 0001 , 0001 , 0001 , 0001 , 0001 , 000s U มo ฉR2v a l u e s1 , 04001 , 01181 , 00041 , 00311 , 01351 , 02381 , 02771 , 02221 , 00931 , 0000 , 99801 , 00901 , 02921 , 04551 , 04551 , 02911 , 00900 , 99801 , 0001 , 00941 , 02221 , 02781 , 02391 , 01361 , 00321 , 00041 , 01181 , 04s t a n dR dde v i a t i o n o fR20 , 67880 , 69870 , 70670 , 70480 , 69740 , 69020 , 68740 , 69130 , 70040 , 70710 , 66730 , 55230 , 36590 , 12810 , 12820 , 36590 , 55230 , 66720 , 70710 , 70040 , 69140 , 68740 , 69020 , 69740 , 70480 , 70680 , 69870 , 6788
ค่า y เหล่านี้มีกราฟ:
ซึ่งมีจุดแตกหักสองจุดอย่างชัดเจน เพื่อประโยชน์ในการโต้แย้งเราจะคำนวณค่าความสัมพันธ์ R ^ 2 (ด้วยสูตรเซลล์ Excel (สไตล์ดอทคอมม่าของยุโรป):
=INDEX(LINEST(B1:$B$1;A1:$A$1;TRUE;TRUE);3;1)
=INDEX(LINEST(B1:$B$28;A1:$A$28;TRUE;TRUE);3;1)
สำหรับการรวมกันที่เป็นไปได้ที่ไม่ทับซ้อนกันของสองเส้นที่ประกอบเข้าด้วยกัน คู่ที่เป็นไปได้ของค่า R ^ 2 มีกราฟ:
คำถามคือสิ่งที่เราควรเลือกคู่ค่า R ^ 2 และเราจะพูดถึงจุดพักหลายจุดตามที่ถามในชื่อเรื่องอย่างไร ทางเลือกหนึ่งคือการเลือกชุดค่าผสมที่ผลรวมของความสัมพันธ์ R-square มากที่สุด พล็อตเรื่องนี้เราได้เส้นโค้งสีน้ำเงินด้านบน:
1 , 0455
การถดถอยเชิงเส้นอย่างชาญฉลาด - Matlab - จุดพักหลายจุด