เป็นเรื่องผิดหรือไม่ที่จะใช้พล็อตสายสำหรับข้อมูลที่ไม่ต่อเนื่อง?


12

ฉันมักจะเห็นชุดข้อมูลที่แยกออกมาเป็นพล็อตบรรทัด แต่มันเกิดขึ้นกับฉันที่บรรทัด infers ค่าที่จุดระหว่างช่วงการวัดที่ไม่มีความหมายสำหรับชุดข้อมูลที่ไม่ต่อเนื่อง ดังนั้นจึงเป็นกรณีการใช้เส้นแปลงสำหรับข้อมูลที่ไม่ต่อเนื่องผิดหรือไม่?

ยกตัวอย่างเช่นใช้ชุดข้อมูลอนุกรมสองชุดหนึ่งชุดต่อเนื่อง (น้ำหนักของฉันวัดทุกวันในตอนเช้า) และหนึ่งชุดแยกกัน (จำนวนโดนัทที่ฉันกินต่อวัน) มันสมเหตุสมผลสำหรับชุดข้อมูลแรกที่เป็นพล็อตบรรทัดเนื่องจากมีความสมเหตุสมผลที่จะสรุปว่าน้ำหนักของฉันในช่วงบ่ายใด ๆ นั้นจะเกี่ยวข้องกับน้ำหนักของฉันในตอนเช้าก่อนหน้าและต่อไปนี้ อย่างไรก็ตามหากจำนวนโดนัทถูกแสดงเป็นกราฟเส้นบรรทัดระหว่างจุดจะไม่สามารถอนุมานความหมายจากบรรทัดนั้นได้

แก้ไข

นี่คืออีกตัวอย่าง: ค่าแรงขั้นต่ำของรัฐบาลกลางทุกชั่วโมงตั้งแต่พล็อตการลงทะเบียนเรียนที่http://mste.illinois.edu/courses/ci330ms/youtsey/lineinfo.html

การเปลี่ยนแปลงค่าแรงขั้นต่ำนั้นไม่ต่อเนื่องดังนั้นฉันจึงไม่สามารถค้นหาเวลาที่เลือกโดยพลการและกำหนดค่าแรงขั้นต่ำ ณ จุดโดยใช้บรรทัดที่เชื่อมต่อจุดต่าง ๆ


3
(+1) ตัวอย่างค่าแรงขั้นต่ำรายชั่วโมงนั้นยอดเยี่ยม การใช้คำถามของคุณเป็นอย่างมากแสดงให้เห็นคำตอบที่ดีนั่นคือจุดเชื่อมต่อบนกราฟนั้นไม่ถูกต้องเมื่อมันจะทำให้ผู้อ่านทำการแก้ไขที่ไม่ถูกต้อง (หรือไม่ถูกต้องทั้งหมด) การแยกความแตกต่างระหว่างความไม่ต่อเนื่องและความไม่ต่อเนื่องจะช่วยในการวิเคราะห์เพิ่มเติม: การบริโภคโดนัทนั้นไม่ต่อเนื่องในขณะที่ค่าแรงขั้นต่ำไม่ต่อเนื่อง แต่ละคนควรได้รับพล็อตรูปแบบที่แตกต่างกัน
whuber

มีพล็อตที่พล็อตกระจายที่มีข้อมูลไม่ต่อเนื่องทำให้เข้าใจผิดในพล็อตบรรทัด สำหรับกรณี eample ที่จำเป็นต้องมีลำดับเหตุการณ์ (hysteresis) หรือการแกว่งระหว่างสองระดับเกิดขึ้นและจำเป็นต้องติดตามการเปลี่ยนแปลงสถานะและตำแหน่งของพวกเขา ดังนั้น: อย่าใช้พล็อตบรรทัดเพื่อบ่งบอกถึงการแก้ไข แต่ใช้เป็นแนวทางหากเหมาะสม มันไม่ง่ายพอที่จะทำให้กฎทางเลือกง่าย ๆ แต่ต้องการการพิจารณาข้อมูลและรูปแบบในมือ
wirrbel

1
คำถามที่น่าสนใจ! ขอบคุณสำหรับสิ่งนั้น ฉันกำลังจัดการกับข้อมูลที่เกี่ยวข้องกับเวลาจำนวนมากซึ่งส่วนหนึ่งเกิดจากโมเดลที่ไม่ต่อเนื่องและข้อมูลที่วัดได้บางส่วน สิ่งที่เกี่ยวกับตัวเลือกในการใช้การแปลงบรรทัดแบบก้าวสำหรับข้อมูลแบบแยก (ซึ่งสามารถต่อเนื่องในทาง แต่เรายังไม่มีฟังก์ชั่นระหว่างจุดเดียวและไม่สามารถสันนิษฐานได้ว่ามี) และปกติสำหรับข้อมูลต่อเนื่อง นั่นคือวิธีที่ฉันจัดการกับมัน ..
Cord Kaldemeyer

@CordKaldemeyer ขอบคุณสำหรับการแสดงความคิดเห็น - ฉันไม่ทราบประเภทแผนภูมิ "ก้าวเส้นพล็อต" แต่นั่นคือสิ่งที่ฉันกำลังมองหา ฉันยังพบบทช่วยสอนที่เป็นประโยชน์ในการทำแปลงบรรทัดใน Excel: trumpexcel.com/step-chart-in-excel
user1379351

@ user1379351: ดีใจที่ฉันสามารถช่วยได้!
Cord Kaldemeyer

คำตอบ:


9

การเชื่อมต่อสายแปลงได้พิสูจน์แล้วว่ามีประโยชน์เกินกว่าที่จะ จำกัด เพียงการตีความเดียว การใช้ที่โดดเด่นบางประการ:

  • ค่า Interpolated กรณีที่คุณพูดถึงว่าตัวแปรทั้งสองนั้นต่อเนื่องกันและทุกจุดที่สอดแทรกตามเส้นเป็นการตีความที่มีความหมาย
  • อัตราการเปลี่ยนแปลง แม้ว่าค่าในระหว่างไม่มีความหมายความชันของแต่ละส่วนของเส้นเป็นตัวแทนที่ดีของอัตราการเปลี่ยนแปลง โปรดทราบว่าสำหรับการตีความนี้ค่า X และ Y จะต้องเว้นระยะอย่างเหมาะสมซึ่งไม่ใช่กรณีในพล็อตค่าจ้างที่คุณอ้างถึง
  • ข้อมูลส่วนตัวเปรียบเทียบ เมื่อเปรียบเทียบการวัดแบบทวีคูณขนาดเล็กหรือการวางซ้อนบรรทัดจะมีประโยชน์แม้กับปัจจัยที่เป็นหมวดหมู่ ในกรณีนี้เส้นใช้เพื่อเชื่อมต่อกลุ่มของการตอบสนองสำหรับการจดจำรูปแบบที่ จำกัด นี่คือตัวอย่างจากpeltiertech.comพร้อมตัวประกอบบนแกน Y (แทนแกน X) สำหรับการอ่านฉลาก:

ป้อนคำอธิบายรูปภาพที่นี่


1
จริง แต่กราฟที่ 2 และ 3 นั้นทรงพลังน้อยกว่าอย่างแรกเพราะจะไม่สามารถใช้แคลคูลัสได้เลย
Milind R

5

ดีโดนัทอาจจะเกี่ยวข้องกับน้ำหนัก :-)

ในขณะที่ฉันเห็นจุดของคุณฉันคิดว่าตัวอย่างนี้ไม่เลวเลยเพราะเวลา (บนแกนนอนซึ่งเป็นสิ่งที่เส้นอ้างอิงถึง) นั้นต่อเนื่อง สำหรับฉันความหมายของเส้นไม่มากนักในแต่ละวันคุณกินโดนัทจำนวนหนึ่ง แต่จำนวนของโดนัทต่อวันนั้นเปลี่ยนไปตามปกติ ดังนั้นเราอาจเพิ่มบางสิ่งบางอย่างอย่างนุ่มนวลให้กับเส้นและมันก็สมเหตุสมผล อย่างน้อยก็มีเหตุผลที่จะนึกถึงโดนัทที่กินในแต่ละชั่วโมงหรือแม้กระทั่งทุกนาที

สิ่งที่น่าเป็นห่วงคือเมื่อแกนนอนไม่ต่อเนื่องกัน (และโดยเฉพาะอย่างยิ่งเมื่อมีการระบุ) แต่มีการลากเส้น มันไม่สมเหตุสมผลเลย เช่นหากคุณกำลังดู% การออกเสียงลงคะแนนให้กับโอบามาในหมู่ผู้อาศัยในภูมิภาคต่าง ๆ ของสหรัฐอเมริกามันไม่มีเหตุผลที่จะวาดเส้นแบ่งระหว่างตะวันออกเฉียงเหนือและมิดเวสต์ โดยเฉพาะอย่างยิ่งเนื่องจากคำสั่งของภูมิภาคนั้นเป็นกฎเกณฑ์ แต่การเปลี่ยนคำสั่งจะเปลี่ยนเส้น แต่ฉันก็ได้เห็นกราฟเช่นนี้


1
เห็นด้วยอย่างแน่นอนว่ามีการละเมิดในกราฟเส้นที่แย่กว่านั้นมาก ฉันชอบวิธีการที่นุ่มนวลกว่าเพราะมันไม่ได้เชื่อมต่อจุดต่าง ๆ ดังนั้นจึงไม่ได้หมายความถึงข้อมูลที่ไม่มี แต่มันจะทำหน้าที่เพื่อเน้นแนวโน้มความกังวลในการบริโภคโดนัท ขอบคุณ!
user1379351

3
คุณดูเหมือนจะเสนอให้แทนที่หนึ่งตัวแปร - ปริมาณการใช้โดนัท - กับอีกตัวแปรหนึ่ง; คือความหนาแน่นของการบริโภคโดนัท(โดนัทต่อหน่วยเวลา) แม้ว่าจะทำได้บ่อยครั้งโดยเฉพาะอย่างยิ่งในการวิเคราะห์สองมิติ (เช่นแผนที่ความหนาแน่นของประชากร) - และอาจมีประสิทธิภาพมากมันจะเป็นการดีสำหรับผู้อ่านที่ต้องระวังว่ามีความแตกต่างและพิจารณาว่าความแตกต่างนั้นสามารถทำได้อย่างไร ถูกเปิดเผยกราฟิก
whuber

2
@whuber นั่นคือจุดยุติธรรม; บรรทัดดูเหมือนจะทำการแทนที่ กราฟที่ไม่ได้ทำการแทนที่นั้นอาจเป็นจุดไม่เกี่ยวข้องกัน แต่ดูเหมือนจะทำให้คำแนะนำเกี่ยวกับการบริโภคโดนัทเป็นอย่างน้อยอยู่ที่จุดใดจุดหนึ่ง ดังนั้นเราอาจให้เวลาต่อเนื่องและวางจุดในขณะที่โดนัทถูกใช้ไป
Peter Flom - Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.