การใช้ตัวทำนายแบบวงกลมในการถดถอยเชิงเส้น


19

ฉันกำลังพยายามปรับโมเดลให้เหมาะสมโดยใช้ข้อมูลลม (0, 359) และช่วงเวลาของวัน (0, 23) แต่ฉันกังวลว่าพวกเขาจะไม่พอดีกับการถดถอยเชิงเส้นเนื่องจากพวกเขาไม่ใช่พารามิเตอร์เชิงเส้น ฉันต้องการแปลงพวกเขาโดยใช้ Python ฉันได้เห็นการกล่าวถึงการคำนวณค่าเฉลี่ยเวคเตอร์โดยวิธีการทำบาปและ cos ขององศาอย่างน้อยก็ในกรณีลม แต่ไม่มากนัก

มีห้องสมุดไพ ธ อนหรือวิธีการที่เกี่ยวข้องที่อาจเป็นประโยชน์หรือไม่?


1
ขอบคุณที่ถามคำถามนี้ โปรดทราบว่าการขอรหัสหรือไลบรารี่นั้นไม่ได้อยู่ในหัวข้อ (คำถามของคุณส่วนใหญ่นั้นอยู่ในหัวข้อ) ดังนั้นคำตอบที่อาจจะครอบคลุมหรืออาจไม่ครอบคลุม
gung - Reinstate Monica

ตัวแปรตอบสนอง (ผลลัพธ์, ตัวแปรตาม) คืออะไรที่นี่? ทิศทางลมและเวลาของทั้งวันเป็นตัวทำนายหรือไม่
Nick Cox

@NickCox ใช่ทั้งทิศทางลมและเวลาของวันเป็นตัวทำนาย ผลที่ได้คือค่าจำนวนเต็มแทนความเข้มข้นของอนุภาค (มลพิษทางอากาศ) นอกจากนี้ยังมีตัวทำนายอื่น ๆ รวมถึงอุณหภูมิความชื้น ฯลฯ ... แต่สิ่งเหล่านี้ไม่จำเป็นต้องเปลี่ยนฉันเชื่อ
compguy24

1
ฉันมีเสรีภาพในการแก้ไขชื่อเรื่อง ชื่อเรื่องก่อนหน้า "การกระจายตัวเชิงเส้นขององศารอบ ๆ วงกลม" ไม่ได้จับคำถามเลยในมุมมองของฉัน
Nick Cox

คำตอบ:


24

ทิศทางลม (วัดที่นี่ในองศาสมมุติว่าทิศทางเข็มทิศตามเข็มนาฬิกาจากทิศเหนือ) เป็นตัวแปรวงกลม การทดสอบก็คือจุดเริ่มต้นการชุมนุมของขนาดเป็นเช่นเดียวกับท้ายที่สุดคือ360 เมื่อได้รับการปฏิบัติในฐานะผู้ทำนายมันน่าจะเป็นแผนที่ที่ดีที่สุดกับไซน์และโคไซน์ ไม่ว่าซอฟต์แวร์ของคุณจะมีแนวโน้มว่าจะวัดมุมเป็นเรเดียนดังนั้นการแปลงจะเทียบเท่ากันบ้าง0=360

sin(π direction/180),cos(π direction/180)

ให้ที่เรเดียน360 เวลาเดียวกันของวันที่วัดเป็นชั่วโมงจากเที่ยงคืนสามารถแมปกับไซน์และโคไซน์ได้โดยใช้2π=360

sin(π time/12),cos(π time/12)

หรือ

sin(π(time+0.5)/12),cos(π(time+0.5)/12)

ขึ้นอยู่กับเวลาที่บันทึกหรือควรตีความ

บางครั้งธรรมชาติหรือสังคมนั้นมีภาระผูกพันและพึ่งพาตัวแปรแบบวงกลมบางรูปแบบซึ่งเป็นทิศทางที่ดีที่สุดสำหรับการตอบสนองและทิศทางตรงกันข้าม ในกรณีนั้นเทอมไซน์และโคไซน์เดียวอาจพอเพียง สำหรับรูปแบบที่ซับซ้อนมากขึ้นคุณอาจต้องใช้คำอื่น ๆ สำหรับรายละเอียดเพิ่มเติมสามารถดูการสอนเกี่ยวกับเทคนิคของการวนวงกลม, ฟูริเยร์, เป็นระยะ, ตรีโกณมิติถดถอยได้ที่นี่พร้อมกับการอ้างอิงเพิ่มเติม ข่าวดีก็คือว่าเมื่อคุณสร้างเงื่อนไขไซน์และโคไซน์แล้วพวกเขาเป็นเพียงตัวทำนายพิเศษในการถดถอยของคุณ

มีวรรณกรรมขนาดใหญ่เกี่ยวกับสถิติแบบวงกลมซึ่งตัวมันเองถูกมองว่าเป็นส่วนหนึ่งของสถิติทิศทาง เทคนิคนี้มักจะไม่ได้กล่าวถึงอย่างแปลกประหลาดเนื่องจากการมุ่งเน้นในวรรณคดีนั้นมักใช้กับตัวแปรตอบสนองแบบวงกลม การสรุปตัวแปรแบบวงกลมด้วยเวกเตอร์หมายความว่าเป็นวิธีการอธิบายแบบมาตรฐาน แต่ไม่จำเป็นหรือเป็นประโยชน์โดยตรงสำหรับการถดถอย

รายละเอียดเกี่ยวกับคำศัพท์ทิศทางลมและเวลาของวันอยู่ในตัวแปรคำศัพท์ทางสถิติไม่ใช่พารามิเตอร์ไม่ว่าจะใช้ในสาขาวิทยาศาสตร์ของคุณอย่างไร

การถดถอยเชิงเส้นถูกกำหนดโดย linearity ในพารามิเตอร์คือสำหรับเวกเตอร์ทำนายโดยมันคือเวกเตอร์ของพารามิเตอร์ไม่ใช่เมทริกซ์ของตัวทำนายซึ่งมีความสำคัญมากกว่า ดังนั้นในกรณีนี้ความจริงที่ว่าตัวทำนายเช่นไซน์และโคไซน์นั้นถูกวัดด้วยเครื่องชั่งแบบวงกลมและยัง จำกัด อยู่ที่จึงไม่มีสิ่งกีดขวางที่จะปรากฏในการถดถอยเชิงเส้นyXββX[1,1]

ความคิดเห็นเล็กน้อยสำหรับตัวแปรตอบสนองเช่นความเข้มข้นของอนุภาคฉันคาดหวังว่าจะใช้โมเดลเชิงเส้นทั่วไปพร้อมลิงก์ลอการิทึมเพื่อให้แน่ใจว่าการคาดการณ์เชิงบวก

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.