เป็นวิธีที่ดีที่สุดในการเห็นภาพความสัมพันธ์ระหว่างตัวแปรที่ไม่ต่อเนื่องและตัวแปรต่อเนื่องคืออะไร?


19

วิธีที่ดีที่สุดในการแสดงความสัมพันธ์ระหว่าง:

  • ตัวแปรต่อเนื่องและไม่ต่อเนื่อง
  • ตัวแปรที่แยกกันสองตัว

จนถึงตอนนี้ฉันได้ใช้แผนการกระจายเพื่อดูความสัมพันธ์ระหว่างตัวแปรต่อเนื่อง อย่างไรก็ตามในกรณีที่จุดข้อมูลตัวแปรไม่ต่อเนื่องถูกสะสมในช่วงเวลาที่แน่นอน ดังนั้นเส้นที่ดีที่สุดอาจจะลำเอียง


4
สำหรับกรณีที่ไม่ต่อเนื่องคำตอบสำหรับคำถามที่ค่อนข้างเกี่ยวข้องกันที่นี่การวางแผนข้อมูลที่เป็นหมวดหมู่ที่สั่งอาจช่วยได้ ฉันไม่แน่ใจจริงๆว่าคุณคิดว่า 'อคติ' นี้เกิดขึ้นได้อย่างไร มันจะส่งผลกระทบต่อการแสดงผลภาพของจุดข้อมูล (นำไปใช้คาดว่าเส้นจะไปที่อื่นนอกเหนือจากที่ควร) แต่ไม่ใช่ข้อมูลจริง คุณช่วยอธิบายเหตุผลของคุณที่นี่ได้ไหม?
Glen_b -Reinstate Monica

คำตอบ:


26

ด้านล่าง: พล็อตดั้งเดิมอาจทำให้เข้าใจผิดเนื่องจากลักษณะที่ไม่ต่อเนื่องของตัวแปรทำให้จุดทับซ้อนกัน:

ป้อนคำอธิบายรูปภาพที่นี่

วิธีหนึ่งในการแก้ไขคือแนะนำความโปร่งใสให้กับสัญลักษณ์ข้อมูล:

ป้อนคำอธิบายรูปภาพที่นี่

อีกวิธีคือกำจัดตำแหน่งของสัญลักษณ์อย่างอ่อนโยนเพื่อสร้างสเมียร์ เทคนิคนี้เรียกว่า "การกระวนกระวายใจ:"

ป้อนคำอธิบายรูปภาพที่นี่

วิธีแก้ปัญหาทั้งสองจะยังช่วยให้คุณพอดีกับเส้นตรงเพื่อประเมินความเป็นเชิงเส้น

รหัส R สำหรับการอ้างอิงของคุณ:

x <- trunc(runif(200)*10)
y <- x * 2 + trunc(runif(200)*10)
plot(x,y,pch=16)
plot(x,y,col="#00000020",pch=16)
plot(jitter(x),jitter(y),col="#000000",pch=16)

1
คำตอบที่ดี สิ่งที่เกี่ยวกับแผนการกระจายฟองสบู่ที่มีอินสแตนซ์ตัวแปรนับอยู่? ฉันลองใช้เทคนิคเหล่านี้กับชุดข้อมูลขนาดใหญ่และใช้เวลาในการเรนเดอร์อัลฟานานเกินไป
josh

14

ฉันจะใช้ boxplots เพื่อแสดงความสัมพันธ์ระหว่างตัวแปรที่ไม่ต่อเนื่องและตัวแปรต่อเนื่อง คุณสามารถทำให้ boxplots ของคุณเป็นแนวตั้งหรือแนวนอนด้วยซอฟต์แวร์สถิติมาตรฐานดังนั้นจึงเป็นเรื่องง่ายที่จะเห็นภาพเป็น IV หรือ DV มันเป็นไปได้ที่จะใช้ scatterplot ที่มีตัวแปรที่ไม่ต่อเนื่องและต่อเนื่องเพียงแค่กำหนดหมายเลขให้กับตัวแปรที่ไม่ต่อเนื่อง (เช่น 1 & 2) และกระวนกระวายใจค่าเหล่านั้น (พล็อตบนบันทึกทางด้านขวาที่นี่ )

เกี่ยวกับความคิดเห็นของคุณว่าเส้นที่เหมาะสมที่สุดอาจจะลำเอียงขึ้นอยู่กับสิ่งที่คุณมี ตัวอย่างเช่นหากคุณมีตัวแปรที่ไม่ต่อเนื่องที่มีสองระดับเป็น IV ของคุณและตัวแปรต่อเนื่องเป็น DV ของคุณคุณสามารถวาดเส้นผ่านสองวิธีและสิ่งนี้จะไม่ลำเอียง (โดยทั่วไปเราจะคิดว่าสถานการณ์นี้เหมาะสมสำหรับการทดสอบ t-t แต่จริง ๆ แล้วเป็นรูปแบบ - เช่นกรณีง่าย ๆ - การถดถอยดูคำตอบของฉันที่นี่ ) ในทางกลับกันถ้าคุณมีการแยก ตัวแปรที่มีสองระดับเป็นคุณ DV มาตรฐาน (OLS) ถดถอยจะไม่เหมาะสม (การถดถอยโลจิสติกจะได้รับการเรียกร้องให้) และสายของแบบที่ดีที่สุดจะได้รับการลำเอียง แต่คุณสามารถพอดี (และพล็อต) กบรรทัด lowessเป็นส่วนหนึ่งของการเริ่มต้นของคุณ การสำรวจข้อมูล

สำหรับการแสดงความสัมพันธ์ระหว่างสองตัวแปรที่ไม่ต่อเนื่องผมจะใช้พล็อตโมเสค คุณสามารถใช้พล็อตแบบตะแกรงพล็อตการเชื่อมโยงหรือพล็อตแรงดันแบบไดนามิกกับการตั้งโปรแกรมบางอย่าง


8

เมื่อพิจารณาความสัมพันธ์ระหว่างตัวแปรผลไบนารีและทำนายอย่างต่อเนื่องผมจะใช้ความนุ่มนวลเหลือง (มีการตรวจสอบขอบเขตปิดเช่นใน lowess(x, y, iter=0)R

ในHmiscแพ็คเกจR ถัดไปคุณสามารถสร้างlatticeกราฟิคเดียวที่ทำให้ส่วนโค้งดังกล่าวเป็นจอแสดงผลแบบหลายแกนสำหรับตัวทำนายหลายตัวเช่น

summaryRc(heart.attack ~ age + blood.pressure + weight, data=mydata)

1

หากคุณไม่พอใจกับแผนการกระจายแบบง่ายคุณอาจต้องการเพิ่มความถี่ของจุดข้อมูลในแต่ละค่าของตัวแปรที่ไม่ต่อเนื่อง วิธีการทำเช่นนี้ขึ้นอยู่กับโปรแกรมสถิติที่คุณใช้ นี่คือตัวอย่างสำหรับ Stata คุณยังสามารถใช้สิ่งนี้กับพล็อตกระจายของตัวแปรเด็ดขาดสองตัว มิฉะนั้นพล็อตแบบกล่องหรือแผนภูมิแท่งที่วางซ้อนอาจใช้ได้ แต่ขึ้นอยู่กับว่าคุณต้องการนำเสนอตัวแปรเหล่านี้อย่างไร


1

ฉันพบกระดาษที่เกี่ยวข้องกับการเชื่อมโยงระหว่างตัวแปรไบนารีสองตัวในhttp://www.boekboek.com/xb130929113026 - ที่นี่ในบทความนั้นมีการแสดงและพิสูจน์ว่าความแข็งแกร่งของการเชื่อมโยงระหว่างสองตัวแปรไบนารีสามารถแสดงเป็นเศษส่วนของ สมาคมที่สมบูรณ์แบบ ดังนั้นจึงเป็นไปได้และเป็นที่ต้องการของรัฐ: ความสัมพันธ์ระหว่างตัวแปร A และตัวแปร B เป็นเช่น 50% แทนการระบุร่วมสมัย: OR = 9 (ไม่ใช่เรื่องง่ายที่จะตีความ) หรือความเสี่ยงจริง = 2 (ความเสี่ยงแบบสัมพัทธ์จะถูกพิจารณา เกินไปที่จะเป็นตัวชี้วัดของการเชื่อมโยงแม้ว่าในความเป็นจริงมันเป็นหน้าที่ของการเชื่อมโยงความชุกหรืออุบัติการณ์และ positivity)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.