ชั่วโมงของวันเป็นตัวแปรเด็ดขาดหรือไม่?


24

"ชั่วโมงของวัน" คือค่าที่สามารถเป็น 0, 1, 2, ... , 23 เป็นตัวแปรเด็ดขาดหรือไม่ ฉันอยากจะปฏิเสธว่าตั้งแต่ 5 เป็นต้นไปว่า 'ใกล้' ถึง 4 หรือ 6 มากกว่าที่จะเป็น 3 หรือ 7

ในทางตรงกันข้ามมีความไม่ต่อเนื่องระหว่าง 23 และ 0

ดังนั้นโดยทั่วไปถือว่าเป็นหมวดหมู่หรือไม่ โปรดทราบว่า 'ชั่วโมง' เป็นหนึ่งในตัวแปรอิสระไม่ใช่ตัวแปรที่ฉันพยายามทำนาย


7
คุณพยายามทำอะไรให้สำเร็จ หากคุณกำลังปรับนางแบบให้เหมาะสมเป็นชั่วโมงโควาเรียตหรือการตอบสนองเช่น?
gung - Reinstate Monica

2
คุณสามารถใช้ตัวแปรดัมมี่สำหรับแต่ละชั่วโมงหากคุณมีอิสระมากพอที่จะสำรองไว้ (เช่นถือว่าเป็นหมวดหมู่) หรือใช้คำสองสามข้อแรกของฟูริเยร์หากคุณยังไม่มี โดยทั่วไปคิดว่าจะแสดงความสัมพันธ์ที่อาจเกิดขึ้นกับการตอบสนองได้ดีที่สุดอย่างไร - ตัวแปรจำลองเดียวเมื่อตั้งร้านเปิด
Scortchi - Reinstate Monica

บางอย่างเช่นชั่วโมงสามารถถือว่าเป็น "เด็ดขาด" หรือ "ตัวเลข" ขึ้นอยู่กับสิ่งที่ดีที่สุด ไม่มีคำตอบที่ถูกหรือผิดโดยทั่วไป - มันขึ้นอยู่กับสิ่งที่ดีที่สุด ฉันขอแนะนำให้ลองทำสิ่งต่าง ๆ และดูว่าอะไรดีที่สุดในสถานการณ์ของคุณ
roundsquare

คำตอบ:


29

ขึ้นอยู่กับสิ่งที่คุณต้องการสร้างแบบจำลองชั่วโมง (และคุณลักษณะอื่น ๆ เช่นฤดูกาล) เป็นตัวแปรวงจรตามลำดับ ในกรณีของฤดูกาลคุณสามารถพิจารณาให้มากขึ้นหรือน้อยลงอย่างแน่นอนและในกรณีของเวลาคุณสามารถจำลองได้อย่างต่อเนื่องเช่นกัน

อย่างไรก็ตามการใช้เวลาหลายชั่วโมงในแบบจำลองของคุณในรูปแบบที่ไม่ดูแลวงจรสำหรับคุณจะไม่เกิดผล พยายามเปลี่ยนรูปแบบมาแทน ใช้เวลาหลายชั่วโมงคุณสามารถใช้วิธีตรีโกณมิติได้

xhr = sin(2*pi*hr/24)
yhr = cos(2*pi*hr/24)

ดังนั้นคุณจะใช้xhrและyhrสำหรับการสร้างแบบจำลองแทน ดูโพสต์นี้ตัวอย่างเช่น: ใช้ทำนายวงกลมในการถดถอยเชิงเส้น


2
(+1) คุณช่วยอธิบายความแตกต่างระหว่างฤดูกาลและชั่วโมงได้ไหม?
Scortchi - Reinstate Monica

อืมฉันคิดว่าฤดูกาลมีความหมายคล้ายกันเช่นเช้าเที่ยงและเย็นเมื่อพูดถึงชั่วโมงในระหว่างวัน Imho เมื่อมีข้อมูลที่คลุมเครือเท่านั้นและการแก้ปัญหาไม่ดี (เช่น 4 ค่าในฤดูกาล) เมื่อพิจารณาว่าเป็นหมวดหมู่และการใช้ตัวแปรจำลองเพื่อการเข้ารหัสดูเหมือนสมเหตุสมผล :-)
Drey

1
ฉันคิดว่าประเด็นสำคัญคือเพราะมีเพียง 4 ฤดูกาลโดยใช้ตรีโกณมิติ เมื่อเปรียบเทียบกับการเป็นตัวแทนที่แสดงให้เห็นว่าคุณมีอิสระในระดับ 1 องศาเท่านั้นโดยมีชั่วโมงของวันที่คุณมีอิสระเหลือ 21 องศา (และถ้าคุณไม่จำเป็นต้องสำรองพวกเขาแล้วxhr = sin(4*pi*hr/24), yhr = cos(4*pi*hr/24)และอื่น ๆ สามารถเพิ่มขึ้นไปยังจุดที่มีการสังเกตพอที่คุณอาจชั่วโมงเป็นรักษาที่ดีของวันเป็นเด็ดขาด.)
Scortchi - คืนสิทธิ์ให้กับโมนิกา

หรือมีลักษณะเป็นเส้นโค้งเป็นวงกลม
kjetil b halvorsen

1

ชั่วโมงของวันนั้นไม่ได้เป็นตัวแทนที่ดีที่สุดของตัวแปรเด็ดขาดเนื่องจากมีการเรียงลำดับตามธรรมชาติของค่า ตัวอย่างเช่นสีผมจัดเป็นหมวดหมู่เนื่องจากการเรียงลำดับหมวดหมู่ไม่มีความหมาย - {สีแดง, สีน้ำตาล, สีบลอนด์} จะใช้ได้เท่ากับ {สีบลอนด์, สีน้ำตาล, สีแดง} ในทางกลับกันชั่วโมงของวันนั้นมีการสั่งซื้อแบบเป็นธรรมชาติ - 9.00 น. อยู่ใกล้กับ 10:00 น. หรือ 8:00 น. กว่าถึง 18:00 น. มันเป็นความคิดที่ดีที่สุดในฐานะตัวแปรลำดับแยก มันมีลักษณะที่เพิ่มขึ้นของการเป็นวัฏจักรตั้งแต่ 12.00 น. ถึง 23.00 น. และมาก่อน 1am


ไม่มีการเรียงลำดับตามธรรมชาติของค่าตัวแปรเด็ดขาดบางอย่างใช่หรือไม่
dsaxton

ใช่ แต่พวกเขาอธิบายได้ดีกว่าเป็นลำดับในกรณีนั้น ตัวแปรลำดับคือตัวแปรหมวดหมู่ที่มีลำดับตามธรรมชาติ
นิวเคลียร์วัง

1
ดังนั้นคุณจะแสดงถึงตัวแปรแบบแยก, ลำดับ, วงจรเป็นตัวพยากรณ์ในตัวแบบการถดถอยได้อย่างไร?
Scortchi - Reinstate Monica

0

ตามหลักวิชาแล้วมันขึ้นอยู่กับว่าคุณจัดรูปแบบตัวแปรอย่างไรซึ่งอาจเป็น "ต่อเนื่อง" (จำลองด้วยค่าสัมประสิทธิ์เดียว) หรือหมวดหมู่ (ค่าสัมประสิทธิ์ต่อ "ชั่วโมง" ของวัน) คุณสามารถผสมผสานทั้งฟังก์ชั่นที่ชาญฉลาดเช่นกัน

ในทางปฏิบัติเนื่องจาก 0 และ 23 เป็น "ชั่วโมง" ของวันเดียวกันฉันจึงจะพิจารณาจัดกลุ่มช่วงเวลาของวันให้มีขนาดใหญ่ขึ้นเป็นกลุ่มที่เป็นเนื้อเดียวกันและน่าเชื่อถือยิ่งขึ้น ตัวอย่างเช่นการเพิ่มขึ้น 8 ชั่วโมง - 8 am - 4 pm, 4 pm-12am, และ 12-8 am


4
0 และ 23 เป็นชั่วโมงที่แตกต่างกัน 0 และ 24 จะเป็นชั่วโมงเดียวกัน
Paul Reiners

BTW ฉันสมมติว่าตามความเห็นของ Gung ว่าชั่วโมงของวันนั้นเป็นตัวแปรอิสระไม่ใช่ตัวแปรตามโมเดล ประเด็นของฉันคือ 0 และ 23 นั้นไม่แตกต่างกันในความเป็นจริง - คุณจะบอกว่ามีความแตกต่างทางสถิติระหว่างเหตุการณ์จำลองของคุณที่เกิดขึ้นในเวลา 23.59 นเมื่อเทียบกับ 0:01?
แฟรงค์เอช

1
ไม่แน่ใจว่ามีปัญหาอะไรที่ทิ้งข้อมูลควรแก้ไข ดูประโยชน์ของการแยกตัวแปรตัวทำนายอย่างต่อเนื่องคืออะไร .
Scortchi - Reinstate Monica

@Scortchi - เช่นเดียวกับที่โพสต์กล่าวว่าคุณกำลังถือว่าความสัมพันธ์อย่างต่อเนื่องเช่นการ binning จะ "ทิ้ง" ข้อมูล แต่ถ้าไม่เป็นเช่นนั้นการทำสำเนาคือการเปลี่ยนแปลงที่เหมาะสมกว่า และนี่ถือว่าคุณมีข้อมูลเพียงพอที่จะเริ่มต้นด้วยซึ่ง OP ไม่ได้กล่าวถึง
แฟรงค์เอช

การกำหนดข้อ จำกัด เกี่ยวกับความสัมพันธ์ระหว่างตัวทำนายและการตอบสนองไม่ได้อยู่ในตัวของมันเอง - ในขณะที่คุณเป็นคนแรกในโพสต์นี้ที่จะนำมาใช้มีข้อสังเกตที่สำคัญจำนวนหนึ่ง การเป็นตัวแทนของชั่วโมงของวัน - แบนจากแปดถึงสิบห้าชั่วโมงด้วยการกระโดดหรือลดลงที่สิบหกและอื่น ๆ - ดูเหมือนว่าคำแนะนำที่แปลกสำหรับวิธีการที่เหมาะสมโดยทั่วไป
Scortchi - Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.