เหตุผลที่แปลงถูกนำมาใช้ในระดับสากลเพื่อแนะนำการถดถอยอย่างง่าย - การตอบสนองที่ทำนายโดยตัวทำนายเดียว - คือพวกเขาช่วยทำความเข้าใจ
อย่างไรก็ตามฉันเชื่อว่าฉันสามารถให้รสชาติที่อาจช่วยในการทำความเข้าใจว่าเกิดอะไรขึ้น ในส่วนนี้ฉันจะเน้นไปที่การพยายามถ่ายทอดความเข้าใจที่พวกเขาให้ซึ่งอาจช่วยในด้านอื่น ๆ ที่คุณมักจะพบเจอในการอ่านเกี่ยวกับการถดถอย ดังนั้นคำตอบนี้ส่วนใหญ่จะเกี่ยวข้องกับลักษณะเฉพาะของโพสต์ของคุณ
ลองนึกภาพคุณกำลังนั่งอยู่หน้าโต๊ะทรงสี่เหลี่ยมขนาดใหญ่เช่นโต๊ะทำงานธรรมดาโต๊ะยาวเต็มตัว (อาจยาว 1.8 เมตร) กว้างครึ่งหนึ่ง
คุณนั่งอยู่หน้าโต๊ะในตำแหน่งปกติตรงกลางด้านยาวด้านหนึ่ง บนโต๊ะนี้มีเล็บจำนวนมาก (ที่มีหัวค่อนข้างราบเรียบ) ถูกตอกลงบนพื้นผิวด้านบนเพื่อให้แต่ละเล็บโผล่ขึ้นมาเล็กน้อย (พอที่จะรู้สึกว่าพวกมันอยู่ที่ไหนและเพียงพอที่จะผูกเชือกกับพวกเขาหรือผูกยางรัด )
เล็บเหล่านี้อยู่ในระยะที่แตกต่างจากขอบโต๊ะของคุณในลักษณะที่ไปยังปลายด้านหนึ่ง (พูดถึงปลายด้านซ้าย) โดยทั่วไปพวกเขาจะอยู่ใกล้กับขอบโต๊ะของคุณและจากนั้นเมื่อคุณขยับไปทางปลายเล็บ มีแนวโน้มที่จะอยู่ห่างจากขอบของคุณ
ยิ่งไปกว่านั้นลองจินตนาการว่ามันจะมีประโยชน์หากมีความรู้สึกว่าเล็บอยู่ห่างจากขอบของคุณโดยเฉลี่ยเท่าไรในทุกตำแหน่ง
เลือกสถานที่บางแห่งตามขอบโต๊ะและวางมือตรงนั้นจากนั้นไปข้างหน้าตรงข้ามโต๊ะลากมือของคุณกลับมาหาคุณจากนั้นค่อยๆขยับมือไปมาบนหัวเล็บ คุณพบการกระแทกหลายสิบครั้งจากเล็บเหล่านี้ - เล็บที่อยู่ในความกว้างที่แคบของมือของคุณ (ขณะที่มันเคลื่อนตรงจากขอบของคุณในระยะทางคงที่จากปลายด้านซ้ายของโต๊ะ) ส่วนหรือแถบกว้างประมาณสิบเซนติเมตร .
แนวคิดก็คือหาระยะเฉลี่ยโดยเฉลี่ยจากเล็บของคุณในส่วนเล็ก ๆ นั้น โดยสัญชาตญาณมันเป็นแค่จุดศูนย์กลางของการกระแทกที่เราตี แต่ถ้าเราวัดระยะห่างแต่ละจุดในแต่ละส่วนของโต๊ะกว้างเราสามารถคำนวณค่าเฉลี่ยเหล่านั้นได้อย่างง่ายดาย
ตัวอย่างเช่นเราสามารถใช้ประโยชน์จากT-Squareที่หัวเลื่อนไปตามขอบโต๊ะและเพลาที่วิ่งไปทางด้านอื่น ๆ ของโต๊ะทำงาน แต่อยู่เหนือโต๊ะดังนั้นเราจึงไม่ต้องตะปูเพราะมันเลื่อนไปทางซ้าย หรือขวา - เมื่อเราผ่านตะปูที่กำหนดเราจะได้ระยะทางตามแกนของ T-Square
ดังนั้นเมื่อสถานที่ต่าง ๆ ตามขอบของเราเราทำแบบฝึกหัดนี้เพื่อค้นหาเล็บทั้งหมดในแถบมือกว้างวิ่งไปมาและออกไปจากเราและหาระยะเฉลี่ยของพวกเขาออกไป บางทีเราอาจแบ่งโต๊ะออกเป็นแถบกว้างมือไปตามขอบของเรา (ดังนั้นเล็บทุกอันจะถูกพบในแถบเดียว)
ทีนี้ลองนึกภาพว่ามีแถบ 21 เส้นบอกว่า, อันแรกที่ขอบด้านซ้ายและอันสุดท้ายที่ขอบด้านขวา หมายถึงห่างจากขอบโต๊ะของเราในขณะที่เราเดินข้ามเส้น
สิ่งเหล่านี้หมายถึงการประมาณค่าการถดถอยแบบไม่มีพารามิเตอร์อย่างง่ายของความคาดหวังของ y (ระยะทางห่างของเรา) ที่ได้รับ x (ระยะทางตามขอบของเราจากปลายด้านซ้าย) นั่นคือ E (y | x) นี่คือตัวประมาณการถดถอยแบบไม่มีพารามิเตอร์ที่เรียกว่า regressogram
ถ้าสตริปเหล่านั้นเพิ่มขึ้นอย่างสม่ำเสมอ - นั่นคือโดยทั่วไปค่าเฉลี่ยจะเพิ่มขึ้นตามจำนวนต่อแถบที่เท่ากันเมื่อเราเคลื่อนที่ข้ามสตริป - จากนั้นเราสามารถประมาณฟังก์ชันการถดถอยของเราได้ดีขึ้นโดยสมมติว่าค่าคาดหวังของ y ฟังก์ชั่นของ x - นั่นคือค่าที่คาดหวังของ y ที่ได้รับ x เป็นค่าคงที่บวกกับผลคูณของ x ค่าคงที่นี้แสดงให้เห็นว่าเล็บมีแนวโน้มที่จะเป็นอย่างไรเมื่อเราที่ x เป็นศูนย์ (บ่อยครั้งที่เราอาจวางไว้ที่ขอบด้านซ้ายสุดขีด แต่ไม่จำเป็นต้อง) และค่าเฉลี่ยของ x ที่รวดเร็วโดยเฉลี่ย การเปลี่ยนแปลงในขณะที่เราเลื่อนไปทางขวาหนึ่งเซนติเมตร (พูด)
แต่จะหาฟังก์ชั่นเชิงเส้นแบบนั้นได้อย่างไร?
ลองนึกภาพว่าเราผูกยางรัดหนึ่งเส้นไว้ที่หัวเล็บแต่ละอันแล้วยึดติดกับแท่งยางบางที่ยาววางเหนือโต๊ะบนเล็บเพื่อให้มันอยู่ใกล้กับ "กลาง" ของแต่ละแถบที่เรามี สำหรับ.
เราแนบแถบในลักษณะที่พวกเขาเพียงยืดในทิศทางไปและออกจากเรา (ไม่ซ้ายหรือขวา) - ซ้ายกับตัวเองพวกเขาจะดึงเพื่อให้ทิศทางของการยืดที่มุมขวาด้วยไม้ แต่ที่นี่เราป้องกันไม่ให้เพื่อให้ทิศทางของการยืดของพวกเขายังคงอยู่ในทิศทางไปทางหรือออกจากขอบของโต๊ะของเรา ตอนนี้เราปล่อยให้แท่งปักลงเมื่อวงดึงมันไปที่เล็บแต่ละอันด้วยเล็บที่อยู่ไกลกว่า (พร้อมกับแถบยางยืดที่ยาวกว่า) ซึ่งดึงยากกว่าเล็บที่อยู่ใกล้กับแท่ง
จากนั้นผลรวมของทุกวงที่ดึงบนแท่งจะเป็น (อย่างน้อยที่สุด) เพื่อดึงแท่งเพื่อลดผลรวมของความยาวกำลังสองของแถบยางยืด ในทิศทางนั้นตรงข้ามกับตารางระยะทางจากขอบของตารางของเราไปยังไม้ที่ตำแหน่ง x ที่กำหนดใด ๆ จะเป็นการประมาณค่าคาดหวังของ y ที่เราได้รับ x
นี่คือการประมาณการถดถอยเชิงเส้น
ลองจินตนาการว่าแทนที่จะเป็นเล็บเรามีผลไม้มากมาย (เช่นแอปเปิ้ลเล็ก ๆ ) แขวนจากต้นไม้ใหญ่และเราต้องการหาระยะเฉลี่ยของผลไม้เหนือพื้นดินเพราะมันแตกต่างกันไปตามตำแหน่งบนพื้นดิน ลองจินตนาการว่าในกรณีนี้ความสูงเหนือพื้นดินจะใหญ่ขึ้นเมื่อเราก้าวไปข้างหน้าและใหญ่ขึ้นเล็กน้อยในขณะที่เราเดินไปทางขวาอีกครั้งในแบบปกติดังนั้นแต่ละก้าวไปข้างหน้าโดยทั่วไปจะเปลี่ยนความสูงเฉลี่ยโดยประมาณเท่ากัน ด้านขวาจะเปลี่ยนค่าเฉลี่ยด้วยจำนวนคงที่อย่างคร่าว ๆ (แต่จำนวนก้าวที่ถูกต้องของการเปลี่ยนแปลงในค่าเฉลี่ยนั้นแตกต่างจากจำนวนการเปลี่ยนแปลงก้าวไปข้างหน้า)
หากเราลดผลรวมของระยะห่างแนวตั้งยกกำลังสองจากผลไม้เป็นแผ่นแบนบาง ๆ (อาจเป็นแผ่นบาง ๆ ของพลาสติกแข็งมาก) เพื่อหาว่าค่าเฉลี่ยความสูงเปลี่ยนแปลงอย่างไรเมื่อเราก้าวไปข้างหน้าหรือก้าวไปทางขวานั่นจะเป็น การถดถอยเชิงเส้นพร้อมตัวทำนายสองตัว - การถดถอยหลายครั้ง
นี่เป็นเพียงสองกรณีที่แผนการสามารถช่วยให้เข้าใจได้ (พวกเขาสามารถแสดงสิ่งที่ฉันเพิ่งอธิบายได้อย่างรวดเร็ว แต่หวังว่าคุณจะรู้ว่ามีพื้นฐานที่จะทำให้ความคิดเดียวกันนี้เป็นแนวคิด) นอกเหนือจากสองกรณีที่ง่ายที่สุดนั้นเราเหลือเพียงคณิตศาสตร์เท่านั้น
ตอนนี้นำตัวอย่างราคาบ้านของคุณ คุณสามารถแทนพื้นที่บ้านทุกหลังด้วยระยะทางตามขอบโต๊ะ - แทนขนาดบ้านที่ใหญ่ที่สุดเป็นตำแหน่งที่อยู่ใกล้กับขอบด้านขวาทุกขนาดของบ้านอื่น ๆ จะอยู่ในตำแหน่งที่อยู่ทางด้านซ้ายซึ่งจะมีบางเซนติเมตร จำนวนตารางเมตร ตอนนี้ระยะทางแสดงราคาขาย เป็นตัวแทนของบ้านที่แพงที่สุดเนื่องจากระยะทางใกล้กับขอบโต๊ะที่ไกลที่สุด (เช่นขอบที่ไกลที่สุดจากเก้าอี้ของคุณ) และทุก ๆ เซนติเมตรที่เลื่อนออกไปจะเป็นตัวแทนของ Rials
สำหรับจินตนาการปัจจุบันเราเลือกตัวแทนเพื่อให้ขอบด้านซ้ายของโต๊ะสอดคล้องกับพื้นที่บ้านเป็นศูนย์และใกล้กับราคาบ้านที่ 0 จากนั้นเราวางตะปูสำหรับแต่ละบ้าน
เราอาจจะไม่มีเล็บอยู่ใกล้กับขอบด้านซ้ายของเรา (ส่วนใหญ่จะอยู่ทางด้านขวาและอยู่ห่างจากเรา) เพราะนี่ไม่ใช่ทางเลือกที่ดีของเครื่องชั่ง แต่การเลือกแบบไม่มีการสกัดกั้นทำให้ วิธีที่ดีกว่าเพื่อหารือเกี่ยวกับมัน
ตอนนี้ในแบบจำลองของคุณคุณบังคับให้ไม้ผ่านห่วงของสตริงที่มุมซ้ายของขอบใกล้ของโต๊ะ - ดังนั้นบังคับให้แบบจำลองที่ติดตั้งให้มีราคาเป็นศูนย์สำหรับพื้นที่ศูนย์ซึ่งอาจดูเป็นธรรมชาติ - แต่ลองคิดดูว่ามี ส่วนประกอบของราคาค่อนข้างคงที่ซึ่งส่งผลต่อการขายทุกครั้ง จากนั้นมันก็สมเหตุสมผลที่จะมีการสกัดกั้นที่แตกต่างจากศูนย์
ไม่ว่าในกรณีใดเมื่อมีการเพิ่มของวงดังกล่าวการออกกำลังกายด้วยแถบยางเหมือนเดิมจะพบว่าการประมาณกำลังสองน้อยที่สุดของสาย