วิธีแสดงการใช้งาน kWh เป็นรายปีเทียบกับอุณหภูมิเฉลี่ย?


9

เพียงเพื่อความสนุกฉันต้องการจัดทำแผนภูมิการใช้พลังงานในครัวเรือนรายเดือนของฉันทุกปี อย่างไรก็ตามฉันต้องการรวมการอ้างอิงถึงอุณหภูมิรายเดือนเพื่อให้ฉันสามารถตรวจสอบว่าบ้านหรือพฤติกรรมของฉันดีขึ้นแย่ลงหรือคงที่เกี่ยวกับการใช้งาน kWh

ข้อมูลที่ฉันทำงานด้วย:

+----------+--------+-----------+----------------+----------+-----------+------------+
|  Month   | # Days | kWh Usage | Daily kWh Avg. | Avg. Low | Avg. High | Avg. Temp. |
+----------+--------+-----------+----------------+----------+-----------+------------+
| Mar 2015 |     32 |      1048 |             33 |       40 |        60 |         50 |
| Feb 2015 |     29 |      1156 |             40 |       32 |        54 |         43 |
| Jan 2015 |     33 |      1143 |             35 |       38 |        57 |         47 |
| Dec 2014 |     30 |       887 |             30 |       39 |        61 |         50 |
| Nov 2014 |     29 |       645 |             22 |       45 |        67 |         56 |
| Oct 2014 |     29 |       598 |             21 |       60 |        78 |         69 |
| Sep 2014 |     32 |       893 |             28 |       70 |        85 |         77 |
| Aug 2014 |     30 |       965 |             32 |       72 |        87 |         79 |
| Jul 2014 |     29 |       784 |             27 |       72 |        87 |         79 |
| Jun 2014 |     32 |      1018 |             32 |       69 |        87 |         78 |
| May 2014 |     30 |       702 |             23 |       63 |        82 |         72 |
| Apr 2014 |     33 |       722 |             22 |       50 |        71 |         60 |
| Mar 2014 |     29 |       830 |             29 |       41 |        62 |         52 |
| Feb 2014 |     28 |      1197 |             43 |       32 |        52 |         42 |
| Jan 2014 |     33 |      1100 |             33 |       38 |        59 |         49 |
| Dec 2013 |     30 |       856 |             29 |       40 |        63 |         51 |
| Nov 2013 |     33 |       686 |             21 |       48 |        70 |         59 |
| Oct 2013 |     30 |       527 |             18 |       61 |        77 |         69 |
| Sep 2013 |     30 |       817 |             27 |       69 |        86 |         77 |
| Aug 2013 |     28 |       991 |             35 |       72 |        86 |         79 |
| Jul 2013 |     31 |       993 |             32 |       73 |        86 |         79 |
| Jun 2013 |     30 |       847 |             28 |       66 |        83 |         74 |
| May 2013 |     29 |       605 |             21 |       59 |        76 |         67 |
| Apr 2013 |     34 |       791 |             23 |       47 |        66 |         57 |
+----------+--------+-----------+----------------+----------+-----------+------------+

ฉันเริ่มต้นด้วยแผนภูมิคอลัมน์เปรียบเทียบค่าเดือนต่อเดือนได้อย่างง่ายดาย:

แผนภูมิคอลัมน์การใช้เดือนต่อเดือน

ฉันจินตนาการถึงพื้นที่พื้นหลังที่ดีหรือกราฟเส้นที่แมปกับแกนแนวตั้ง (ขวา) รองที่แสดงช่วงสูง / ต่ำ แต่รู้ว่าจะเป็นปัญหากับการจัดกลุ่มหลายปี

มันจะง่ายด้วยปีเดียว:

การใช้งาน 2014 kWh พร้อมอุณหภูมิ

ฉันอยากรู้ว่าใครสามารถแนะนำวิธีรวมข้อมูลรายปีทั้งหมดลงในแผนภูมิเดียวกับการเปรียบเทียบอุณหภูมิได้หรือไม่

มีอัตราส่วนที่ฉันสามารถใช้ที่สามารถเชื่อมโยงการใช้งาน kWh กับอุณหภูมิเฉลี่ยได้อย่างมีประสิทธิภาพ ... หรือเทคนิคการแสดงอื่น ๆ ที่ฉันมองเห็น ... หรือฉันติดอยู่กับแผนภูมิหนึ่งต่อปีหรือไม่?

คำตอบ:


18

ฉันอยากจะแนะนำว่าสิ่งที่สำคัญคือการพัฒนารูปแบบของต้นทุนพลังงานที่เหมือนจริงในทางปฏิบัติ ที่จะทำงานได้ดีขึ้นในการตรวจสอบการเปลี่ยนแปลงค่าใช้จ่ายกว่าการแสดงข้อมูลดิบใด ๆ ที่สามารถบรรลุ ด้วยการเปรียบเทียบสิ่งนี้กับโซลูชันที่เสนอบน SOเรามีกรณีศึกษาที่ดีมากในความแตกต่างระหว่างการปรับเส้นโค้งให้เหมาะสมกับข้อมูลและทำการวิเคราะห์ทางสถิติที่มีความหมาย

(ข้อเสนอแนะนี้ขึ้นอยู่กับการปรับโมเดลให้เหมาะกับการใช้งานในบ้านของฉันเองเมื่อสิบปีก่อนและนำไปใช้เพื่อติดตามการเปลี่ยนแปลงในช่วงเวลานั้นโปรดทราบว่าเมื่อแบบจำลองนั้นพอดีแล้วสามารถคำนวณได้ง่ายในสเปรดชีต การเปลี่ยนแปลงดังนั้นเราไม่ควรรู้สึกถูก จำกัด โดยความสามารถ (ใน) ของซอฟต์แวร์สเปรดชีต)

สำหรับข้อมูลเหล่านี้แบบจำลองที่เป็นไปได้ทางกายภาพนั้นจะสร้างภาพค่าใช้จ่ายพลังงานและรูปแบบการใช้งานที่แตกต่างกันอย่างมีนัยสำคัญมากกว่าแบบจำลองทางเลือกแบบง่าย (รูปสี่เหลี่ยมจัตุรัสน้อยที่สุดกำลังสองของการใช้งานทุกวัน ดังนั้นแบบจำลองที่ง่ายกว่าจึงไม่สามารถใช้เป็นเครื่องมือที่เชื่อถือได้สำหรับการทำความเข้าใจทำนายหรือเปรียบเทียบรูปแบบการใช้พลังงาน


การวิเคราะห์

กฎหมายของนิวตันคูลลิ่งกล่าวว่าการประมาณการที่ดีค่าใช้จ่ายของเครื่องทำความร้อน (ในหน่วยของเวลา) ที่ควรจะเป็นสัดส่วนโดยตรงกับความแตกต่างระหว่างอุณหภูมิภายนอกและอุณหภูมิภายในt_0ให้คงที่ของสัดส่วนที่เป็น-ค่าใช้จ่ายของการระบายความร้อนนอกจากนี้ยังควรจะเป็นสัดส่วนกับความแตกต่างของอุณหภูมิที่มีคล้ายกัน - แต่ไม่จำเป็นต้องเหมือนกัน - คงที่ของสัดส่วน\(แต่ละเหล่านี้จะถูกกำหนดโดยความสามารถในการฉนวนของบ้านเช่นเดียวกับประสิทธิภาพของระบบทำความร้อนและความเย็น)tt0αβ

การประมาณและ (ซึ่งแสดงเป็นกิโลวัตต์ (หรือดอลลาร์) ต่อองศาต่อหน่วยเวลา) เป็นหนึ่งในสิ่งที่สำคัญที่สุดที่สามารถทำได้αβเพราะช่วยให้เราสามารถคาดการณ์ต้นทุนในอนาคตได้เช่นเดียวกับการวัดประสิทธิภาพของ บ้านและระบบพลังงาน

เนื่องจากข้อมูลเหล่านี้เป็นการใช้ไฟฟ้าทั้งหมดพวกเขาจึงรวมค่าใช้จ่ายที่ไม่ร้อนเช่นแสงการปรุงอาหารการคำนวณและความบันเทิง อีกอย่างที่น่าสนใจคือการประมาณการการใช้พลังงานพื้นฐานนี้ (ต่อหน่วยเวลา) ซึ่งฉันจะเรียกว่า : มันแสดงให้เห็นว่าสามารถประหยัดพลังงานได้มากน้อยเพียงใดและช่วยให้สามารถคาดการณ์ต้นทุนในอนาคตเมื่อทำการปรับปรุงประสิทธิภาพของขนาดที่รู้จัก . (ตัวอย่างเช่นหลังจากสี่ปีที่ผ่านมาฉันได้เปลี่ยนเตาหลอมโดยหนึ่งที่อ้างว่ามีประสิทธิภาพมากขึ้น 30% - และแน่นอนว่าเป็นเช่นนั้นγ

ในที่สุดการประมาณ (ขั้นต้น) ฉันจะสมมติว่าบ้านถูกเก็บรักษาไว้ที่อุณหภูมิคงที่เกือบตลอดทั้งปี (ในแบบจำลองส่วนบุคคลของฉันฉันถือว่าสองอุณหภูมิสำหรับฤดูหนาวและฤดูร้อนตามลำดับ - แต่ยังไม่มีข้อมูลเพียงพอในตัวอย่างนี้เพื่อประเมินทั้งสองอย่างน่าเชื่อถือและพวกเขาก็จะอยู่ใกล้ ๆ ) รู้เรื่องนี้ ค่าช่วยหนึ่งประเมินผลของการบำรุงรักษาบ้านที่อุณหภูมิแตกต่างกันเล็กน้อยซึ่งเป็นหนึ่งในตัวเลือกการประหยัดพลังงานที่สำคัญt0t0t1

ข้อมูลนำเสนอภาวะแทรกซ้อนที่สำคัญและน่าสนใจแปลกประหลาดพวกเขาสะท้อนให้เห็นถึงค่าใช้จ่ายทั้งหมดในช่วงเวลาที่อุณหภูมิภายนอกผันผวน - และพวกเขาผันผวนมากมักประมาณหนึ่งในสี่ของช่วงประจำปีของพวกเขาในแต่ละเดือน ดังที่เราจะได้เห็นสิ่งนี้จะสร้างความแตกต่างอย่างมากระหว่างโมเดลต้นแบบที่ถูกต้องทันทีที่อธิบายและค่าของผลรวมรายเดือน ผลกระทบจะเด่นชัดในช่วงเดือนที่มีการให้ความร้อนและความเย็นทั้ง (หรือไม่) แบบจำลองใด ๆ ที่ไม่ได้คำนึงถึงความผันแปรนี้จะผิดพลาด "คิดว่า" ต้นทุนพลังงานควรอยู่ที่อัตราฐานในช่วงเดือนใด ๆ ที่มีอุณหภูมิเฉลี่ยเท่ากับแต่ความเป็นจริงนั้นแตกต่างกันมากγt0

เราไม่ได้ (พร้อม) มีข้อมูลรายละเอียดเกี่ยวกับความผันผวนของอุณหภูมิรายเดือนนอกเหนือจากช่วงของพวกเขา ฉันเสนอการจัดการด้วยวิธีการที่ใช้งานได้จริง แต่มีความขัดแย้งเล็กน้อย ยกเว้นที่อุณหภูมิสูงแต่ละเดือนมักจะมีอุณหภูมิเพิ่มขึ้นหรือลดลงทีละน้อย ซึ่งหมายความว่าเราสามารถกระจายให้เป็นรูปแบบเดียวกัน เมื่อช่วงของตัวแปรเครื่องแบบมีความยาวตัวแปรที่มีความเบี่ยงเบนมาตรฐานของ{6} ฉันใช้ความสัมพันธ์นี้เพื่อแปลงช่วง (จากเป็น) เป็นค่าเบี่ยงเบนมาตรฐาน แต่โดยหลักแล้วเพื่อให้ได้แบบจำลองที่ดีฉันจะลดความแปรปรวนที่ส่วนท้ายของช่วงเหล่านี้โดยใช้NormalLs=L/6Avg. LowAvg. Highการแจกแจง (ด้วย SDs โดยประมาณและวิธีการที่กำหนดโดยAvg. Temp)

ในที่สุดเราจะต้องสร้างมาตรฐานให้กับหน่วยเวลาทั่วไป ถึงแม้ว่ามันจะมีอยู่แล้วในDaily kWh Avg.ตัวแปร แต่มันก็ขาดความแม่นยำดังนั้นให้เราทำการหารผลรวมด้วยจำนวนวันเพื่อรับความแม่นยำที่หายไปกลับมา

ดังนั้นรูปแบบของการทำความเย็นแบบเวลาหน่วยต้นทุนที่อุณหภูมิภายนอกของคือYt

y(t)=γ+α(tt0)I(t<t0)+β(tt0)I(t>t0)+ε(t)

ที่คือฟังก์ชั่นตัวบ่งชี้และแสดงถึงทุกสิ่งที่ไม่ได้บันทึกไว้อย่างชัดเจนในรุ่นนี้ มันมีพารามิเตอร์ทั้งสี่ในการประมาณการ:และt_0(หากคุณแน่ใจจริง ๆ ว่าคุณสามารถแก้ไขค่าได้แทนที่จะประเมินค่า)Iεα,β,γt0t0

รายงานค่าใช้จ่ายรวมในช่วงระยะเวลาที่เพื่อเมื่ออุณหภูมิแตกต่างกันไปมีเวลาจึงจะx0x1t(x)x

Cost(x0,x1)=x0x1y(t)dt=x0x1(γ+α(t(x)t0)I(t(x)<t0)+β(t(x)t0)I(t(x)>t0)+ε(t(x)))t(x)dx.

ถ้าแบบจำลองนั้นดีความผันผวนของควรจะเฉลี่ยกับค่าใกล้กับศูนย์และจะปรากฏขึ้นแบบสุ่มเปลี่ยนเดือนเป็นเดือน การประมาณความผันผวนในด้วยการแจกแจงปกติของค่าเฉลี่ย (ค่าเฉลี่ยรายเดือน) และค่าเบี่ยงเบนมาตรฐาน (ดังที่ได้รับก่อนหน้านี้จากช่วงรายเดือน) และทำการอินทิกรัลε(t)ε¯t(x)t¯s(t¯)

y¯(t¯)=γ+(βα)s(t¯)2ϕs(t¯t0)+(t¯t0)(β+(αβ)Φs(t0t¯))+ε¯(t¯).

ในสูตรนี้คือการแจกแจงสะสมของตัวแปรปกติที่มีค่าเฉลี่ยเป็นศูนย์และส่วนเบี่ยงเบนมาตรฐาน ; คือความหนาแน่นΦss(t¯)ϕ


รูปแบบที่เหมาะสม

รุ่นนี้แม้จะแสดงความสัมพันธ์ที่ไม่เป็นเชิงเส้นระหว่างต้นทุนและอุณหภูมิยังคงเป็นเชิงเส้นในตัวแปรและ\อย่างไรก็ตามเนื่องจากไม่เป็นเชิงเส้นในและไม่เป็นที่รู้จักเราจึงจำเป็นต้องมีขั้นตอนการปรับแบบไม่เชิงเส้น เพื่อแสดงให้เห็นผมก็ทิ้งมันกลายเป็น Maximizer โอกาส (ใช้สำหรับการคำนวณ) สมมติว่ามีความเป็นอิสระและจัดจำหน่ายเหมือนกันกับการกระจายปกติของศูนย์ค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐานทั่วไป\α,β,γt0t0Rε¯σ

สำหรับข้อมูลเหล่านี้การประมาณนั้น

(α^,β^,γ^,t0^,σ^)=(1.489,1.371,10.2,63.4,1.80).

หมายความว่า:

  • ค่าความร้อนประมาณ kWh / วัน / องศา F1.49

  • ค่าใช้จ่ายในการระบายความร้อนประมาณ kWh / วัน / องศา F. การทำความเย็นนั้นมีประสิทธิภาพมากกว่าเล็กน้อย1.37

  • การใช้พลังงานฐาน (ไม่ทำความร้อน / ความเย็น) คือ kWh / วัน (ตัวเลขนี้ค่อนข้างไม่แน่นอนข้อมูลเพิ่มเติมจะช่วยให้ดีขึ้น)10.2

  • บ้านถูกเก็บรักษาไว้ที่อุณหภูมิใกล้องศา F.63.4

  • รูปแบบอื่น ๆ ที่ไม่ได้คิดอย่างชัดเจนในโมเดลมีค่าเบี่ยงเบนมาตรฐานเท่ากับ kWh / วัน1.80

ช่วงความเชื่อมั่นและการแสดงออกเชิงปริมาณอื่น ๆ ของความไม่แน่นอนในการประมาณการเหล่านี้สามารถรับได้ในรูปแบบมาตรฐานพร้อมกับเครื่องจักรที่มีโอกาสสูงสุด


การแสดง

เพื่อแสดงให้เห็นถึงโมเดลนี้รูปต่อไปนี้จะทำการแปลงข้อมูลโมเดลพื้นฐานพอดีกับค่าเฉลี่ยรายเดือนและพอดีกำลังสองน้อยที่สุดกำลังสอง

รูป

ข้อมูลรายเดือนจะแสดงเป็นกากบาทสีเข้ม เส้นสีเทาแนวนอนที่พวกมันนอนแสดงช่วงอุณหภูมิรายเดือน รูปแบบพื้นฐานของเราสะท้อนให้เห็นถึงกฎหมายของนิวตันจะแสดงด้วยสีแดงและสีฟ้าสายส่วนการประชุมที่อุณหภูมิt_0 ความพอดีกับข้อมูลของเราไม่ใช่เส้นโค้งเนื่องจากมันขึ้นอยู่กับช่วงอุณหภูมิ มันจะแสดงเป็นจุดสีน้ำเงินและสีแดงแต่ละจุด (อย่างไรก็ตามเนื่องจากช่วงรายเดือนไม่ได้เปลี่ยนแปลงมากนักจุดเหล่านี้จึงดูเหมือนว่าจะติดตามเส้นโค้ง - เกือบจะเหมือนกับเส้นโค้งกำลังสองประที่ประ) ในที่สุดเส้นโค้งประคือสี่เหลี่ยมกำลังสองน้อยที่สุดพอดี (กับกากบาทสีเข้ม )t0

สังเกตุว่ามีขนาดพอดีออกจากโมเดล (ทันที) โดยเฉพาะอย่างยิ่งในอุณหภูมิกลาง! นี่คือผลกระทบของค่าเฉลี่ยรายเดือน (ลองนึกถึงความสูงของเส้นสีแดงและสีน้ำเงินที่ "smeared" ในแต่ละส่วนสีเทาแนวนอนที่อุณหภูมิสุดขั้วทุกอย่างอยู่ที่เส้นตรง แต่ที่อุณหภูมิกลางทั้งสองด้านของ "V" จะเฉลี่ยกันสะท้อนความต้องการ เพื่อให้ความร้อนในบางครั้งและเย็นในเวลาอื่น ๆ ในระหว่างเดือน)


เปรียบเทียบแบบจำลอง

สองชุด - หนึ่งที่พัฒนาอย่างระมัดระวังที่นี่และแบบที่ง่ายและง่ายกำลังสอง - ตกลงอย่างใกล้ชิดกับทั้งสองและจุดข้อมูล สมการกำลังสองค่อนข้างไม่ดี แต่ก็ยังดี: ค่าเฉลี่ยที่ปรับแล้วของมัน (สำหรับสามพารามิเตอร์) คือ kWh / วันในขณะที่ค่าเฉลี่ยที่เหลืออยู่ของโมเดลกฎหมายของนิวตัน (สำหรับพารามิเตอร์สี่ตัว) คือ kWh / วัน ลดลงประมาณ 5% หากสิ่งที่คุณต้องการทำคือเขียนเส้นโค้งผ่านจุดข้อมูลดังนั้นความเรียบง่ายและความเที่ยงตรงของสัมพัทธ์ของสมการกำลังสองจะแนะนำ2.071.97

อย่างไรก็ตามขนาดกำลังสองนั้นไม่มีประโยชน์อย่างเต็มที่สำหรับการเรียนรู้ว่าเกิดอะไรขึ้น! สูตรของมัน

y¯(t¯)=219.956.241t¯+0.04879(t¯)2,

ไม่พบการใช้งานใด ๆ โดยตรง ในความเป็นธรรมเราสามารถวิเคราะห์ได้เล็กน้อย:

  1. นี่คือพาราโบลาที่มีจุดสุดยอดที่องศา F เราสามารถใช้นี่เป็นค่าประมาณอุณหภูมิบ้านคงที่ ไม่แตกต่างอย่างมีนัยสำคัญจากการประมาณองศาแรกของเรา อย่างไรก็ตามค่าพยากรณ์ที่อุณหภูมินี้คือ kWh / วัน นี่เป็นสองเท่าของการใช้พลังงานพื้นฐานที่เหมาะสมกับกฎของนิวตันt^0=6.241/(2×0.04879)=64.063.4219.956.241(63.4)+0.04879(63.4)2=20.4

  2. ต้นทุนของความร้อนหรือการระบายความร้อนที่ได้จากค่าสัมบูรณ์ของอนุพันธ์ {t} ตัวอย่างเช่นการใช้สูตรนี้เราจะประมาณราคาเครื่องทำความร้อนในบ้านเมื่ออุณหภูมิภายนอกองศาเท่ากับ kWh / วัน / องศา F นี่เป็นสองเท่าของค่าประมาณของนิวตัน กฎหมายy¯(t¯)=6.241+2(0.04879)t¯906.241+2(0.04879)(90)=2.54

    ในทำนองเดียวกันค่าใช้จ่ายในการให้ความร้อนในบ้านที่อุณหภูมิภายนอกองศาจะเท่ากับ kWh / วัน / องศา F นี่เป็นค่าที่มากกว่าสองเท่าของค่าประมาณตามกฎของนิวตัน32|6.241+2(0.04879)(32)|=3.12

    ที่อุณหภูมิตรงกลางสมการกำลังสองจะไปในทิศทางตรงกันข้าม แน่นอนที่จุดสูงสุดในช่วงถึงองศานั้นทำนายค่าความร้อนหรือค่าใช้จ่ายในการทำความเย็นเกือบเป็นศูนย์ถึงแม้ว่าอุณหภูมิเฉลี่ยนี้จะประกอบด้วยวันที่เย็นองศาและอบอุ่นถึงองศา (มีคนไม่กี่คนที่อ่านโพสต์นี้จะยังคงความร้อนอยู่ที่องศา (=องศาเซลเซียส)!)606850785010

โดยสังเขปแม้ว่ามันจะดูดีในการสร้างภาพ แต่สมการกำลังสองมีความผิดพลาดอย่างมากในการประมาณปริมาณความสนใจพื้นฐานที่เกี่ยวข้องกับการใช้พลังงาน การใช้เพื่อประเมินการเปลี่ยนแปลงการใช้งานจึงเป็นปัญหาและควรทำให้หมดกำลังใจ


การคำนวณ

Rรหัสนี้ทำการคำนวณและการพล็อตทั้งหมด สามารถปรับให้พร้อมกับชุดข้อมูลที่คล้ายกันได้

#
# Read and process the raw data.
#
x <- read.csv("F:/temp/energy.csv")
x$Daily <- x$Usage / x$Length
x <- x[order(x$Temp), ]
#pairs(x)
#
# Fit a quadratic curve.
#
fit.quadratic <- lm(Daily ~ Temp+I(Temp^2), data=x)
# par(mfrow=c(2,2))
# plot(fit.quadratic)
# par(mfrow=c(1,1))
#
# Fit a simple but realistic heating-cooling model with maximum likelihood.
#
response <- function(theta, x, s) {
  alpha <- theta[1]; beta <- theta[2]; gamma <- theta[3]; t.0 <- theta[4]
  x <- x - t.0
  gamma + (beta-alpha)*s^2*dnorm(x, 0, s) +  x*(beta + (alpha-beta)*pnorm(-x, 0, s))
}
log.L <- function(theta, y, x, s) {
  #   theta = (alpha, beta, gamma, t.0, sigma)
  #   x = time
  #   s = estimated SD
  #   y = response
  y.hat <- response(theta, x, s)
  sigma <- theta[5]
  sum((((y - y.hat) / sigma) ^2 + log(2 * pi * sigma^2))/2)
}
theta <- c(alpha=-1, beta=5/4, gamma=20, t.0=65, sigma=2) # Initial guess
x$Spread <- (x$Temp.high - x$Temp.low)/sqrt(6)            # Uniform estimate
fit <- nlm(log.L, theta, y=x$Daily, x=x$Temp, x$Spread)
names(fit$estimate) <- names(theta)
#$
# Set up for plotting.
#
i.pad <- 10
plot(range(x$Temp)+c(-i.pad,i.pad), c(0, max(x$Daily)+20), type="n", 
     xlab="Temp", ylab="Cost, kWh/day",
     main="Data, Model, and Fits")
#
# Plot the data.
#
l <- matrix(mapply(function(l,r,h) {c(l,h,r,h,NA,NA)}, 
                   x$Temp.low, x$Temp.high, x$Daily), 2)
lines(l[1,], l[2,], col="Gray")
points(x$Temp, x$Daily, type="p", pch=3)
#
# Draw the models.
#
x0 <- seq(min(x$Temp)-i.pad, max(x$Temp)+i.pad, length.out=401)
lines(x0, cbind(1, x0, x0^2) %*% coef(fit.quadratic), lwd=3, lty=3)
#curve(response(fit$estimate, x, 0), add=TRUE, lwd=2, lty=1)
t.0 <- fit$estimate["t.0"]
alpha <- fit$estimate["alpha"]
beta <- fit$estimate["beta"]
gamma <- fit$estimate["gamma"]
cool <- "#1020c0"; heat <- "#c02010"
lines(c(t.0, 0), gamma + c(0, -alpha*t.0), lwd=2, lty=1, col=cool)
lines(c(t.0, 100), gamma + c(0, beta*(100-t.0)), lwd=2, lty=1, col=heat)
#
# Display the fit.
#
pred <- response(fit$estimate, x$Temp, x$Spread)
points(x$Temp, pred, pch=16, cex=1, col=ifelse(x$Temp < t.0, cool, heat))
#lines(lowess(x$Temp, pred, f=1/4))
#
# Estimate the residual standard deviations.
#
residuals <- x$Daily - pred
sqrt(sum(residuals^2) / (length(residuals) - 4))
sqrt(sum(resid(fit.quadratic)^2) / (length(residuals) - 3))

4
นี่อาจเป็นการตอบสนองที่ดีที่สุดสำหรับคำถามสแต็คล้นที่ฉันได้อ่าน ฉันซาบซึ้งอย่างยิ่งเวลาที่ใช้อธิบายเหตุผลและเหตุผลเบื้องหลังการแก้ปัญหา
Shawn

1
ฟิสิกส์มีขนดกมากกว่านี้ บทบาทของคอนเดนเซอร์และเครื่องระเหยกลายเป็นความร้อนและความเย็น ซึ่งหมายความว่าพวกเขาทำตัวเหมือนสองระบบที่แตกต่างกัน วันระดับการทำความร้อน, วันที่องศาการทำความเย็นและการลดความชื้นในระดับวันเป็นตัวแยกต้นทุนสามตัวและขึ้นอยู่กับที่ตั้งทางภูมิศาสตร์ (คิดว่า ak, wi, ca, az, mo และ fl) และปีสามารถกระทำได้ไม่ต่อเนื่อง ไม่เหมือนกับการเริ่มต้นของการระบายความร้อน) สถิติที่มีคุณค่าจากข้อมูลระบุว่ามี 5 ฤดูกาลไม่ใช่ 4 พฤษภาคมเป็นฤดูกาลของตนเองอย่างน้อยภายใน 5 ปีที่ผ่านมา
EngrStudent

@ EngrStudent ทุกจุดที่ดีและชื่นชมมาก ฉันจะยืนยันว่าวิธีที่นำเสนอที่นี่แม้จะง่ายขึ้นแสดงให้เห็นถึงสิ่งที่จำเป็นในการวางรากฐานเพื่อหยอกล้อเอฟเฟ็กต์ subtler เหล่านี้ เมื่อคุณจัดการคำศัพท์ขนาดใหญ่ในแบบจำลอง - และฉันคิดว่าไม่มีใครจะปฏิเสธว่าอุณหภูมิจะต้องมีส่วนร่วมที่สำคัญกับค่าใช้จ่าย - ถ้าคุณทำเช่นนั้นในลักษณะที่มีความหมายทางร่างกายคุณอาจจะสามารถระบุคำอื่น ๆ และอาจประเมินผลกระทบได้อย่างแม่นยำ หากคุณจัดการกับคำศัพท์ไม่ถูกต้องคุณจะไม่มีความหวังในการอธิบายลักษณะอื่น ๆ
whuber

ฉันรักรากฐาน / การวิเคราะห์ที่ดีนี้โปรดฟังสิ่งนี้เป็นเสียงปรบมือไม่ใช่คำวิจารณ์ กระบวนการทำความร้อนนั้นแตกต่างจากการระบายความร้อนดังนั้นกำลังสองที่ไม่ต่อเนื่องของทั้งสองด้านอาจจะขัดแย้งกับสิ่งนั้น คอยล์เย็นระเหยภายในอาคารระหว่างการระบายความร้อนและกลางแจ้งในระหว่างการทำความร้อน ในปั๊มความร้อนยังมีการขี่จักรยานละลายน้ำแข็งและ "สำรองความร้อน" นอกจากนี้คอมเพรสเซอร์ต้องทำงานหนักขึ้นเพื่อต่อสู้กับอุณหภูมิภายนอกที่สูงขึ้นดังนั้นไม่เพียง แต่คุณกำลังเคลื่อนย้ายความร้อนมากขึ้นเท่านั้น มันไม่เชิงเส้น ความชื้นมีขนาดใหญ่และสามารถเป็น 2/3 งบประมาณด้านพลังงาน การแทรกซึมของอากาศ
EngrStudent

@EngrStudent ขอบคุณอีกครั้ง - นั่นคือจุดที่น่าสนใจทั้งหมด ฉันไม่ทราบว่าความชื้นอาจเป็นสาเหตุของงบประมาณจำนวนมาก นั่นคือประเภทของการสังเกตที่เป็นตัวอย่างค่าที่เป็นไปได้ของการมีเพศสัมพันธ์ทฤษฎีที่ดี (หรือ "แบบจำลองแนวคิด" ในบางวงการ) ด้วยการวิเคราะห์ทางสถิติ
whuber

0

ผมได้รับคำตอบมากกว่าที่StackOverflow หากใครมีความคิดเพิ่มเติมฉันยังคงสนใจในการแก้ปัญหาทางเลือก

/programming/29777890/data-visualization-how-to-represent-kwh-usage-by-year-against-average-temperatu


1
ทางออกของ SO นั้นไม่น่าเชื่อ กฎการระบายความร้อนของนิวตันซึ่งเป็นเหตุผลอันดับแรกที่มีประโยชน์ในฐานะที่เป็นจุดเริ่มต้นแสดงให้เห็นว่าพล็อตเรื่องการใช้พลังงานกับอุณหภูมิควรเป็นจุดรวมสองเส้น โดยเฉลี่ยแล้วจะมีการแกว่งของอุณหภูมิทุกวัน (และแม้กระทั่งทุกชั่วโมง) ซึ่งจะทำให้พื้นที่นั้นพร่ามัวที่จุดตัดของเส้นเหล่านั้น (ที่ไม่ต้องการความร้อนหรือความเย็น) พอดีกำลังสองอาจจะเหมาะสมมี แต่asymptotically ความต้องการที่เหมาะสมที่จะเป็นเชิงเส้น
whuber

ฉันรู้ว่าค่าเฉลี่ยเบลอความถูกต้อง แต่เป็นข้อมูลที่ฉันมี เนื่องจากความเข้าใจที่ดีของสถิติที่ฉันไม่เข้าใจวลี"ควรเป็นสหภาพของทั้งสองเส้น ..."และ"asymptotically ความต้องการที่เหมาะสมที่จะเป็นเชิงเส้น" จากสามเณร POV โพสต์ SO นั้นดูเหมือนจะเป็นสัญชาตญาณตามความคาดหวังของฉันว่าการใช้พลังงานเพิ่มขึ้นที่ปลายด้านตรงข้ามของระดับอุณหภูมิในขณะที่อยู่ต่ำที่สุดในช่วงกลางที่ไม่ต้องการความร้อนและความเย็น พอดีกำลังสองจะไม่สมมาตร? ฉันไม่เชื่อว่าการใช้พลังงานนั้นสมมาตรเพราะเราใช้พลังงานความร้อนมากกว่าเท่ห์ ฉันขอขอบคุณการแก้ไขหรือคำแนะนำใด ๆ
Shawn

แบบสมการกำลังสองแม้ว่าสมมาตรจะไม่ใช่ทางกายภาพที่สุดขั้วเพราะมันบอกว่าคุณจะจ่ายมากขึ้นสำหรับการทำความร้อนที่อุณหภูมิต่ำสุดและอื่น ๆ อีกมากมายสำหรับการทำความเย็นที่อุณหภูมิสูงสุดมากกว่าที่เป็นไปได้ทางร่างกาย ยิ่งไปกว่านั้นสมมาตรในพล็อตจะถูกคาดหวังก็ต่อเมื่อค่าความเย็นของบ้านต่อปริญญาเท่ากับค่าความร้อนต่อองศาซึ่งถือว่าระบบทำความร้อนและความเย็นนั้นมีประสิทธิภาพเท่ากัน อาจจะใช่หรือไม่ใช่ก็ได้ - แต่คุณไม่ควรกำหนดความสมมาตรนั้นในแบบจำลองของคุณ
whuber

ฉันเห็นด้วยว่ามันแตกต่างกันเนื่องจากค่าใช้จ่ายในการเย็นกว่าความร้อนต่อระดับ อย่างไรก็ตามดังนั้นฉันเข้าใจความคิดเห็นแรกคุณแนะนำให้สมการกำลังสองจากโพสต์ SO - แม้ว่าสมเหตุสมผล - ไม่ถูกต้องจริงและการเชิงเส้นพอดีเป็นคำตอบที่ถูกต้องทางเทคนิคเนื่องจากกฎของการระบายความร้อนของนิวตัน? มันเป็นไปไม่ได้ของโซลูชัน SOที่ฉันไม่เข้าใจ
Shawn

1
ฉันไม่เหมาะกับการตอบคำถามสุดท้ายของฉันในพื้นที่สำหรับความคิดเห็นดังนั้นฉันโพสต์มันเป็นคำตอบแทน ฉันไม่เห็นว่าคุณอนุมานได้ไหมว่าค่าใช้จ่ายในการทำความเย็นต่อระดับนั้นสูงกว่าค่าใช้จ่ายในการทำความร้อนต่อองศา ข้อมูลของคุณดูเหมือนจะบ่งบอกว่าสิ่งตรงกันข้ามเป็นจริง (แม้ว่าค่าใช้จ่ายจะค่อนข้างใกล้เคียงกัน และโปรดทราบว่ารูปแบบเชิงเส้นไม่ได้หมายความถึงการเชิงเส้นพอดี ! มีหลายอย่างเกิดขึ้นที่นี่เพื่อทำให้ข้อมูลเบี่ยงเบนอย่างเป็นระบบจากโมเดลพื้นฐานนี้
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.