ฉันชอบกฎของหัวแม่มือนี้:
หากคุณต้องการเส้นเพื่อนำทางดวงตา (เช่นแสดงแนวโน้มที่ไม่มีเส้นจะมองไม่เห็นอย่างชัดเจน) คุณไม่ควรใส่เส้น
มนุษย์ดีมากในการจดจำรูปแบบ (เราค่อนข้างจะมองเห็นแนวโน้มที่ไม่มีอยู่จริงนอกจากคิดถึงแนวโน้มที่มีอยู่แล้ว) หากเราไม่สามารถรับเทรนด์ที่ไม่มีเส้นได้เราค่อนข้างมั่นใจได้ว่าจะไม่มีเทรนด์ใดที่สามารถแสดงได้อย่างชัดเจนในชุดข้อมูล
เมื่อพูดถึงกราฟที่สองสิ่งเดียวที่บ่งบอกถึงความไม่แน่นอนของคะแนนการวัดของคุณคือสี่เหลี่ยมสีแดงสองอันของ C: O 1.2 ที่ 700 ° C การแพร่กระจายของทั้งสองหมายความว่าฉันจะไม่ยอมรับเช่น
- มีแนวโน้มสำหรับ C: O 1.2
- มีความแตกต่างระหว่าง 2.0 และ 3.6
- และเพื่อให้แน่ใจว่าแบบจำลองโค้งกำลังดึงข้อมูลมากเกินไป
ไม่มีเหตุผลที่ดีมากให้ อย่างไรก็ตามนั่นจะเป็นรูปแบบอีกครั้ง
แก้ไข: ตอบความคิดเห็นของ Ivan:
ฉันเป็นนักเคมีและฉันบอกว่าไม่มีการวัดที่ไม่มีข้อผิดพลาด - สิ่งที่ยอมรับได้จะขึ้นอยู่กับการทดลองและเครื่องมือ
คำตอบนี้ไม่ได้ต่อต้านการแสดงข้อผิดพลาดการทดลอง แต่ทั้งหมดสำหรับการแสดงและนำมาพิจารณา
แนวคิดเบื้องหลังการใช้เหตุผลของฉันคือกราฟแสดงการวัดซ้ำหนึ่งครั้งดังนั้นเมื่อการอภิปรายคือความซับซ้อนของแบบจำลองที่เหมาะสม (เช่นเส้นแนวนอน, เส้นตรง, กำลังสอง, ... ) สิ่งนี้ทำให้เรามีความคิดในการวัด ความผิดพลาด ในกรณีของคุณนี่หมายความว่าคุณจะไม่สามารถใส่กำลังสองที่มีความหมาย (spline) แม้ว่าคุณจะมีแบบจำลองที่ยาก (เช่นสมการทางอุณหพลศาสตร์หรือการเคลื่อนไหว) แนะนำว่ามันควรเป็นกำลังสอง - คุณมีข้อมูลไม่เพียงพอ .
เพื่อแสดงสิ่งนี้:
df <-data.frame (T = c ( 700, 700, 800, 900, 700, 800, 900, 700, 800, 900),
C.to.O = factor (c ( 1.2, 1.2, 1.2, 1.2, 2 , 2 , 2 , 3.6, 3.6, 3.6)),
tar = c (21.5, 18.5, 19.5, 19, 15.5, 15 , 6 , 16.5, 9, 9))
นี่คือเส้นตรงที่พอดีกับช่วงความมั่นใจ 95% สำหรับอัตราส่วน C: O แต่ละตัว:
ggplot (df, aes (x = T, y = tar, col = C.to.O)) + geom_point () +
stat_smooth (method = "lm") +
facet_wrap (~C.to.O)
โปรดทราบว่าสำหรับอัตราส่วน C: O ที่สูงกว่าช่วงความเชื่อมั่นต่ำกว่า 0 ซึ่งหมายความว่าสมมติฐานโดยนัยของตัวแบบเชิงเส้นนั้นผิด อย่างไรก็ตามคุณสามารถสรุปได้ว่าโมเดลเชิงเส้นสำหรับเนื้อหา C: O ที่สูงกว่านั้นมีความเหมาะสมแล้ว
ดังนั้นการก้าวถอยหลังและการปรับค่าคงที่เท่านั้น (เช่นไม่มีการพึ่งพา T):
ggplot (df, aes (x = T, y = tar, col = C.to.O)) + geom_point () +
stat_smooth (method = "lm", formula = y ~ 1) +
facet_wrap (~C.to.O)
ส่วนประกอบคือการไม่พึ่งพาโมเดล C: O:
ggplot (df, aes (x = T, y = tar)) + geom_point (aes (col = C.to.O)) +
stat_smooth (method = "lm", formula = y ~ x)
ยังคงช่วงความเชื่อมั่นจะครอบคลุมเส้นแนวนอนหรือแม้แต่น้อยไปหาน้อย
คุณสามารถลองต่อไปเช่นอนุญาตให้มีค่าออฟเซ็ตต่างกันสำหรับอัตราส่วน C: O สามตัว แต่ใช้ความลาดชันเท่ากัน
อย่างไรก็ตามการวัดเพิ่มเติมอีกเล็กน้อยจะช่วยปรับปรุงสถานการณ์ได้อย่างมากโปรดสังเกตว่าช่วงความเชื่อมั่นที่แคบลงสำหรับ C: O = 1: 1 คือที่ซึ่งคุณมีการวัด 4 รายการแทนที่จะเป็น 3 เพียงอย่างเดียว
สรุป: หากคุณเปรียบเทียบคะแนนของฉันซึ่งข้อสรุปที่ฉันไม่แน่ใจพวกเขากำลังอ่านวิธีมากเกินไปในบางจุดที่มี!