มี "สวัสดีโลก" สำหรับกราฟิกสถิติหรือไม่


25

ในการเขียนโปรแกรมคอมพิวเตอร์มีโปรแกรมแรกสุดคลาสสิคสำหรับการเรียนรู้ / สอนภาษาหรือระบบใหม่ที่เรียกว่า "สวัสดีโลก" http://en.wikipedia.org/wiki/Hello_world_program

มีการสร้างภาพข้อมูลแบบคลาสสิกเป็นครั้งแรกสำหรับการใช้แพ็คเกจกราฟ ถ้าเป็นเช่นนั้นมันคืออะไร? และถ้าไม่ใช่ผู้สมัครที่ดีจะเป็นอย่างไร


3
ยินดีต้อนรับสู่เว็บไซต์ของเรา! คำถามที่พบบ่อยของเราจะถามว่า "คุณควรถามคำถามที่ตอบได้จริงและตอบได้ตามปัญหาจริงที่คุณเผชิญอยู่" คุณช่วยอธิบายปัญหาที่แท้จริงของคุณได้ไหม?
whuber

3
ฉันต้องการระบุ "รายการทดสอบมาตรฐาน" สำหรับกราฟิกสถิติหากมีอยู่เพื่อรวมไว้ในวัสดุฝึกอบรมที่ฉันกำลังพัฒนา
อับราฮัม D Flaxman

2
เนื่องจากแอปพลิเคชันกราฟิกแตกต่างกันอย่างกว้างขวางดังนั้นจึงยากที่จะเข้าใจถึงกราฟิกมาตรฐานหรือสากล มีเป็นมาตรฐานบางอย่างสำหรับบางประเภทของแพคเกจกราฟเช่นกระต่ายที่มีชื่อเสียงในอดีตและกาน้ำชาสำหรับกราฟิก 3D เพื่อให้คำถามของคุณตอบได้มันจะช่วยให้มีความเฉพาะเจาะจงมากขึ้นเกี่ยวกับแพคเกจวัสดุการฝึกอบรมที่คุณต้องการให้ครอบคลุม
whuber

1
จุดดีขอบคุณ ฉันจะรวมอย่างน้อยเกี่ยวกับกราฟิกสถิติใน R, STATA, Python และ Javascript
อับราฮัม D Flaxman

@AbrahamDFlaxman ฉันอยากรู้เกี่ยวกับเรื่องนี้ "วัสดุการฝึกอบรม" และใครและสิ่งที่มันมีไว้สำหรับ คุณพูดได้มากกว่านี้ไหม
Peter Flom - Reinstate Monica

คำตอบ:


9

สองความคิด:

A. เมื่อฉันพยายามทำให้เข้าใจถึง "Hello World" มันเป็นขั้นต่ำที่ต้องทำในภาษาการเขียนโปรแกรมเพื่อสร้างโปรแกรมที่ถูกต้องซึ่งพิมพ์ข้อความบรรทัดเดียว นั่นแสดงให้ฉันเห็นว่า "Hello World" ของคุณควรเป็นชุดข้อมูลแบบไม่แปรซึ่งเป็นสิ่งพื้นฐานที่สุดที่คุณสามารถเสียบเข้ากับโปรแกรมสถิติหรือกราฟิก

B. ฉันไม่รู้กราฟใด ๆ "Hello World" ชุดข้อมูลที่ใกล้เคียงที่สุดคือชุดข้อมูลทั่วไปที่รวมอยู่ในแพ็คเกจสถิติต่างๆเช่น AirPassengers ของ R ใน R คำสั่งสร้างกราฟของ Hello World จะเป็น:

plot (AirPassengers)  # Base graphics, prints line graph

หรือ

qplot (AirPassengers) # ggplot2, prints a bar chart

หรือ

xyplot (AirPassengers) # lattice, which doesn't have a generic plot

โดยส่วนตัวฉันคิดว่ากราฟที่ง่ายที่สุดคือกราฟเส้นที่คุณมีรายการ N ในช่วง Y และ X ตั้งแต่ 1: N แต่นั่นไม่ใช่มาตรฐาน


1
ฉันทามติจากคำตอบนี้และคำตอบอื่น ๆ คือปัจจุบันยังไม่มีกราฟฟิคสถิติ "สวัสดีโลก" ฉันคิดว่าคำแนะนำของคุณเกี่ยวกับชุดข้อมูลที่ไม่เปลี่ยนแปลงโดยมีรายการ N ใน Y และ X อยู่ในช่วงตั้งแต่ 1: N นั้นน่าสนใจ ในการเปรียบเทียบกับ "สวัสดีโลก" มันคงจะดีถ้ามีตัวเล็ก N และน่าจดจำ Y คุณคิดอย่างไรกับ N = 5 และ Y = (3,1,4,1,5,9) (เช่น หลักของ pi)? บางทีนั่นอาจเป็นคณิตศาสตร์เกินไป
อับราฮัม D Flaxman

1
@AbrahamDFlaxman: ฉันไม่คิดว่ามันเป็นคณิตศาสตร์ฉันคิดว่ามันยอดเยี่ยม จดจำสั้นและกราฟไม่ได้เป็นเพียงเส้นตรงหรืออะไรก็ตาม ข้อมูลดังกล่าวเป็นที่รู้จักและไม่เชื่อมโยงกับโปรแกรมใด ๆ และสามารถขยายออกไปได้อย่างอิสระโดยใครก็ตามที่ต้องการคะแนนเพิ่ม ฉันลงคะแนนให้มัน!
Wayne

24

ผมก็อาจจะเริ่มต้นด้วย scatterplots และแสดงให้เห็นทั้งสี่มีความสัมพันธ์ที่น่าเกลียด


2
+1 แต่คุณอาจต้องการพิจารณาบางสิ่งที่กว้างกว่าเดิมเล็กน้อยเช่นพล็อตบรรทัดบางรูปแบบ ท้ายที่สุดทันทีที่คุณสามารถวาดส่วนของเส้นคุณสามารถวาดอะไรก็ได้ สิ่งนี้สะท้อนถึงแนวคิดเบื้องหลัง "Hello, world!": เมื่อคุณสามารถรับเอาท์พุทที่อ่านได้จากโปรแกรมคุณรู้ว่าคุณสามารถสื่อสารกับคอมพิวเตอร์และส่วนที่เหลือเป็นเพียงรายละเอียด :-) (รายละเอียดอาจเป็นเรื่องยากเมื่อเรียนรู้การเขียนรหัสแอสเซมบลีสำหรับเมนเฟรม IBM 360 วิธีที่ง่ายที่สุดในการรับเอาท์พุทคือการเก็บไว้ใน RAM และสร้างข้อผิดพลาดเมื่อสิ้นสุดการประมวลผล !)
whuber

ฉันคิดว่าสี่รวมของ Anscombe มีจำนวนมากเกินกว่าที่จะใช้เป็น "Hello, world" ของกราฟิกสถิติ แต่รูปที่ 1 จากกระดาษของเขาอาจเป็นตัวเลือกที่ดี คำตอบอื่น ๆ ทำให้เป็นกรณีสำหรับชุดข้อมูลแบบ univariate ซึ่งฉันกำลังโน้มตัวไป
อับราฮัม D Flaxman

7

ฮิสโตแกรมของตัวอย่างของตัวแปรสุ่มแบบกระจาย


ฉันชอบวิธีที่จะดู แต่ฮิสโทแกรมอาจต้องการการประมวลผลข้อมูลมากกว่าการกระจายและการหาตัวอย่างจากการแจกแจงแบบปกติอาจทำให้เสียสมาธิ
อับราฮัม D Flaxman

ฉันเพิ่งสังเกตเห็นว่านี่เป็นตัวอย่างแรกจากหน้าเว็บ Matplotlib: matplotlib.org
Abraham D Flaxman

5

ฉันคิดว่าคำตอบคือ "ไม่" นั่นคือไม่มีการตกลงกันโดยทั่วไปเมื่อตอบคำถามของคุณ

@StasK ชี้ไปที่ scatterplot

แต่ฉันจะพิจารณาสิ่งที่plotเกิดขึ้นR: ขึ้นอยู่กับข้อมูล!

คุณสามารถยืนยันได้ว่าสถิติที่ไม่มีการเปลี่ยนแปลงนั้นง่ายกว่าสถิติที่แบ่งเป็นสองส่วน ดังนั้น ... บางทีสิ่งพื้นฐานที่สุดคือฮิสโตแกรม หรืออาจจะเป็นพล็อตบาร์; อาจเป็นพล็อตความหนาแน่น

หากจุดของ "Hello, World!" คือการแสดงให้เห็นว่าคุณสามารถทำให้คอมพิวเตอร์ทำอะไรบางอย่างได้แล้วฉันจะบอกว่าพล็อตใดจะทำ


1
บางทีการไม่มีรายการทดสอบมาตรฐานแสดงว่าคุณถูกต้องและเหมาะสมกว่าที่จะใช้พล็อตใดก็ตามที่ง่ายที่สุดในระบบที่กำลังแสดง ที่ทำให้มันยากที่จะเปรียบเทียบอย่างไรก็ตาม
อับราฮัม D Flaxman

5

ไม่แน่ใจว่ามันมีคุณสมบัติเหมือนโลกแห่งสวัสดีหรือไม่ แต่ใน R มีการสาธิตในแพ็คเกจจำนวนมาก เช่น

library(graphics)
demo(graphics)

จะทำขั้นตอนให้ผู้ใช้งานผ่านกราฟิคพื้นฐานบางอย่างที่มีในแพ็คเกจ เพียงคลิกเมาส์เหนือภาพแต่ละภาพเพื่อก้าวผ่านภาพประกอบกราฟิกขั้นพื้นฐาน มีเพียงสองบรรทัดผู้ใช้จะได้รับการแนะนำให้รู้จักกับความสามารถในการสร้างแรงบันดาลใจของกราฟิก R สำหรับสถิติ

รหัสที่เกี่ยวข้องในการสร้างกราฟิกจะแสดงในคอนโซล R

ป้อนคำอธิบายรูปภาพที่นี่


2

ฉันว่ามีโปรแกรมประเภท "Hello World" สองโปรแกรมสำหรับการแสดงข้อมูล:

พิมพ์ ("Hello World"): บางอย่างเช่นฮิสโตแกรมของตัวแปรกระจายปกติหรืออาจเป็น X, Y scatterplot แบบง่าย ๆ

สำหรับบางสิ่งที่ซับซ้อนกว่าเล็กน้อยเช่นในส่วนที่ใช้หลักการของ Hello World และเริ่มเล่นกับการป้อนข้อมูลของผู้ใช้ตัวละครหลบหนีและสิ่งที่คล้ายกันฉันจะบอกว่ามันจะเล่นกับชุดข้อมูล Iris

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.