คำถามติดแท็ก data-visualization

การแสดงข้อมูลคือการศึกษาการแสดงข้อมูลด้วยภาพ แผนที่และแผนภูมิเป็นประเภทการแสดงข้อมูลที่พบบ่อยที่สุด แต่ยังมีอีกมากมาย

10
วิธีการทำสมุดบันทึก IPython matplotlib แบบอินไลน์
ฉันกำลังพยายามใช้สมุดบันทึก IPython บน MacOS X ด้วย Python 2.7.2 และ IPython 1.1.0 ฉันไม่สามารถรับกราฟิก matplotlib เพื่อแสดงแบบอินไลน์ import matplotlib import numpy as np import matplotlib.pyplot as plt %matplotlib inline ฉันได้ลอง%pylab inlineแล้วและอาร์กิวเมนต์บรรทัดคำสั่ง ipython --pylab=inlineแต่ก็ไม่ได้สร้างความแตกต่าง x = np.linspace(0, 3*np.pi, 500) plt.plot(x, np.sin(x**2)) plt.title('A simple chirp') plt.show() แทนที่จะเป็นกราฟิกอินไลน์ฉันได้รับสิ่งนี้: <matplotlib.figure.Figure at 0x110b9c450> และmatplotlib.get_backend()แสดงให้เห็นว่าฉันมี'module://IPython.kernel.zmq.pylab.backend_inline'แบ็กเอนด์

8
ฉันจะแปลงอาเรย์ numpy เป็น (และแสดง) ภาพได้อย่างไร?
ฉันได้สร้างอาร์เรย์ดังนี้: import numpy as np data = np.zeros( (512,512,3), dtype=np.uint8) data[256,256] = [255,0,0] สิ่งที่ฉันต้องการให้ทำคือแสดงจุดสีแดงหนึ่งจุดที่กึ่งกลางของภาพ 512x512 (อย่างน้อยเริ่มต้นด้วย ... ฉันคิดว่าฉันสามารถหาที่เหลือได้จากที่นั่น)

11
พล็อตเมทริกซ์สหสัมพันธ์พล็อตโดยใช้แพนด้า
ฉันมีชุดข้อมูลที่มีคุณสมบัติจำนวนมากดังนั้นการวิเคราะห์เมทริกซ์ความสัมพันธ์จึงเป็นเรื่องยากมาก ฉันต้องการพล็อตเมทริกซ์สหสัมพันธ์ที่เราใช้dataframe.corr()ฟังก์ชั่นจากห้องสมุดแพนด้า มีฟังก์ชันในตัวที่จัดทำโดยห้องสมุดแพนด้าเพื่อพล็อตเมทริกซ์นี้หรือไม่?

14
เวิร์กโฟลว์สำหรับการวิเคราะห์เชิงสถิติและการเขียนรายงาน
ไม่มีใครมีภูมิปัญญาในเวิร์กโฟลว์สำหรับการวิเคราะห์ข้อมูลที่เกี่ยวข้องกับการเขียนรายงานที่กำหนดเองหรือไม่? การใช้เคสเป็นแบบนี้: ลูกค้ารายงานค่าคอมมิชชั่นที่ใช้การวิเคราะห์ข้อมูลเช่นการประมาณประชากรและแผนที่ที่เกี่ยวข้องสำหรับเขตน้ำ นักวิเคราะห์ดาวน์โหลดข้อมูลบางส่วนรวมข้อมูลและบันทึกผลลัพธ์ (เช่นการเพิ่มคอลัมน์สำหรับประชากรต่อหน่วยหรือการย่อยข้อมูลตามขอบเขตเขต) นักวิเคราะห์วิเคราะห์ข้อมูลที่สร้างใน (2) เข้าใกล้เป้าหมายของเธอ แต่เห็นว่าต้องการข้อมูลมากขึ้นและกลับไปที่ (1) ล้างซ้ำจนกระทั่งตารางและกราฟิกตรงตาม QA / QC และทำให้ลูกค้าพึงพอใจ เขียนรายงานผสมผสานตารางและกราฟิก ปีหน้าลูกค้าที่มีความสุขกลับมาและต้องการการอัปเดต สิ่งนี้ควรเป็นเรื่องง่ายเหมือนการอัปเดตข้อมูลอัปสตรีมด้วยการดาวน์โหลดใหม่ (เช่นได้รับใบอนุญาตก่อสร้างจากปีที่แล้ว) และกดปุ่ม "คำนวณ" เว้นแต่ว่าข้อกำหนดจะเปลี่ยนไป ในขณะนี้ฉันเพิ่งเริ่มไดเรกทอรีและเฉพาะกิจมันที่ดีที่สุดที่ฉันสามารถทำได้ ฉันต้องการวิธีการที่เป็นระบบมากขึ้นดังนั้นฉันหวังว่าจะมีใครบางคนคิดออก ... ฉันใช้สเปรดชีต, SQL, ARCGIS, R และ Unix ขอบคุณ! PS: ด้านล่างเป็น Makefile พื้นฐานที่ตรวจสอบการพึ่งพาชุดข้อมูลกลาง (w / .RDataส่วนต่อท้าย) และสคริปต์ ( .Rส่วนต่อท้าย) ต่างๆ Make ใช้ timestamps เพื่อตรวจสอบการขึ้นต่อกันดังนั้นหากคุณคุณtouch ss07por.csvจะเห็นว่าไฟล์นี้ใหม่กว่าไฟล์ / เป้าหมายทั้งหมดที่ขึ้นอยู่กับมันและรันสคริปต์ที่กำหนดเพื่ออัปเดตให้สอดคล้องกัน …

12
ฉันจะเรียกใช้ Tensorboard บนเซิร์ฟเวอร์ระยะไกลได้อย่างไร
ฉันยังใหม่กับ Tensorflow และจะได้รับประโยชน์อย่างมากจากการแสดงภาพสิ่งที่ฉันกำลังทำ ฉันเข้าใจว่า Tensorboard เป็นเครื่องมือสร้างภาพที่มีประโยชน์ แต่ฉันจะเรียกใช้งานบนเครื่อง Ubuntu ระยะไกลได้อย่างไร

4
ย้ายแกน x ไปที่ด้านบนสุดของพล็อตใน matplotlib
จากคำถามนี้เกี่ยวกับแผนที่ความร้อนใน matplotlibฉันต้องการย้ายชื่อแกน x ไปที่ด้านบนสุดของพล็อต import matplotlib.pyplot as plt import numpy as np column_labels = list('ABCD') row_labels = list('WXYZ') data = np.random.rand(4,4) fig, ax = plt.subplots() heatmap = ax.pcolor(data, cmap=plt.cm.Blues) # put the major ticks at the middle of each cell ax.set_xticks(np.arange(data.shape[0])+0.5, minor=False) ax.set_yticks(np.arange(data.shape[1])+0.5, minor=False) # want a more natural, table-like …

3
หนังสือดีเพื่อการเรียนรู้ D3.js [ปิดแล้ว]
ปิด. คำถามนี้ไม่เป็นไปตามหลักเกณฑ์กองมากเกิน ขณะนี้ยังไม่ยอมรับคำตอบ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นหัวข้อสำหรับ Stack Overflow ปิดให้บริการใน6 ปีที่ผ่านมา ปรับปรุงคำถามนี้ เห็นD3.jsแล้วสนใจเลยซื้อหนังสือเล่มนี้! ฉันอาจจะคิดผิด แต่ฉันพบว่ามันไม่สมหวัง มีใครบ้างที่มีเนื้อหาหลักสำหรับการเรียนรู้การD3.jsแสดงข้อมูล ฉันมองเห็นศักยภาพมากมายD3.jsและฉันกระตือรือร้นและสนใจมาก ขอบคุณล่วงหน้า! อัปเดต: ฉันเพิ่งอ่านInteractive Data Visualizationสำหรับเว็บโดย Scott Murray หนังสือที่ยอดเยี่ยม! ลองใช้งานได้ฟรี

5
วิธีการลงจุดฮิสโตแกรมโดยใช้ Matplotlib ใน Python พร้อมรายการข้อมูล
ฉันกำลังพยายามพล็อตฮิสโตแกรมโดยใช้matplotlib.hist()ฟังก์ชัน แต่ไม่แน่ใจว่าจะทำอย่างไร ฉันมีรายชื่อ probability = [0.3602150537634409, 0.42028985507246375, 0.373117033603708, 0.36813186813186816, 0.32517482517482516, 0.4175257731958763, 0.41025641025641024, 0.39408866995073893, 0.4143222506393862, 0.34, 0.391025641025641, 0.3130841121495327, 0.35398230088495575] และรายชื่อ (สตริง) ฉันจะทำให้ความน่าจะเป็นเป็นค่า y ของแต่ละแท่งและชื่อเป็นค่า x ได้อย่างไร

4
Heatmap ใน matplotlib ด้วย pcolor?
ฉันต้องการสร้างแผนที่ความร้อนเช่นนี้ (แสดงในFlowingData ): แหล่งข้อมูลอยู่ที่นี่แต่ข้อมูลแบบสุ่มและป้ายกำกับจะใช้ได้ดีเช่น import numpy column_labels = list('ABCD') row_labels = list('WXYZ') data = numpy.random.rand(4,4) การสร้างแผนที่ความร้อนนั้นง่ายพอใน matplotlib: from matplotlib import pyplot as plt heatmap = plt.pcolor(data) และฉันยังพบข้อโต้แย้งcolormap ที่ดูถูกต้อง:heatmap = plt.pcolor(data, cmap=matplotlib.cm.Blues) แต่นอกเหนือจากนั้นฉันไม่สามารถหาวิธีแสดงป้ายกำกับสำหรับคอลัมน์และแถวและแสดงข้อมูลในการวางแนวที่เหมาะสม (จุดเริ่มต้นที่ด้านซ้ายบนแทนที่จะเป็นด้านล่างซ้าย) ความพยายามที่จะจัดการheatmap.axes(เช่นheatmap.axes.set_xticklabels = column_labels) ทั้งหมดล้มเหลว ฉันขาดอะไรไปที่นี่?

5
การเพิ่มป้ายกำกับค่าบนแผนภูมิแท่ง matplotlib
ฉันติดอยู่กับบางสิ่งที่รู้สึกว่าน่าจะค่อนข้างง่าย โค้ดที่ฉันนำมาด้านล่างเป็นตัวอย่างจากโครงการขนาดใหญ่ที่ฉันกำลังทำอยู่ ฉันไม่เห็นเหตุผลที่จะโพสต์รายละเอียดทั้งหมดดังนั้นโปรดยอมรับโครงสร้างข้อมูลที่ฉันนำมาตามที่เป็นอยู่ โดยพื้นฐานแล้วฉันกำลังสร้างแผนภูมิแท่งและฉันสามารถหาวิธีเพิ่มป้ายกำกับค่าบนแท่งได้ (ตรงกลางแท่งหรือด้านบน) ดูตัวอย่างในเว็บ แต่ไม่ประสบความสำเร็จในการติดตั้งโค้ดของตัวเอง ฉันเชื่อว่าวิธีแก้ปัญหานั้นใช้ 'text' หรือ 'annotate' แต่ฉัน: a) ไม่รู้ว่าจะใช้อันไหน (และโดยทั่วไปแล้วยังไม่ทราบว่าจะใช้เมื่อใด) b) มองไม่เห็นเพื่อนำเสนอป้ายกำกับค่า ขอขอบคุณสำหรับความช่วยเหลือของคุณรหัสของฉันด้านล่าง ขอบคุณล่วงหน้า! import numpy as np import pandas as pd import matplotlib.pyplot as plt pd.set_option('display.mpl_style', 'default') %matplotlib inline # Bring some raw data. frequencies = [6, 16, 75, 160, 244, 260, 145, 73, …

7
GUI สำหรับข้อมูล statsd อื่นที่ไม่ใช่ Graphite? [ปิด]
ปิด. คำถามนี้ไม่เป็นไปตามหลักเกณฑ์กองมากเกิน ขณะนี้ยังไม่ยอมรับคำตอบ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นหัวข้อสำหรับ Stack Overflow ปิดให้บริการใน6 ปีที่ผ่านมา ปรับปรุงคำถามนี้ ฉันเพิ่งติดตั้งแกรไฟต์ / statsd เพื่อใช้ในการผลิต ฉันมีความสุขกับมันมาก แต่เพื่อนร่วมงานคนหนึ่งของฉันถามฉันว่ามีวิธีทำให้ดูสวยขึ้นไหม สุจริตฉันไม่สามารถพูดได้ว่าฉันไม่ได้สงสัยเหมือนกัน มีทางเลือกอื่นสำหรับ Graphite UI ที่ให้ข้อมูลการเรนเดอร์งานที่ดีกว่าหรือไม่อาจใช้ไลบรารีกราฟส่วนหน้าที่ยอดเยี่ยมและการพุช http

1
ggplot2 ระยะขอบพื้นที่แปลง?
มีวิธีง่ายๆในการเพิ่มช่องว่างระหว่างหัวเรื่องพล็อตและพื้นที่พล็อตด้านล่าง (ช่องที่มีข้อมูล) ในทำนองเดียวกันฉันต้องการเว้นวรรคระหว่างชื่อแกนและป้ายชื่อแกน กล่าวอีกนัยหนึ่งมีวิธี "เลื่อนหัวเรื่องขึ้นเล็กน้อยชื่อแกน y ไปทางซ้ายเล็กน้อยและหัวเรื่องแกน x ลดลงเล็กน้อย" หรือไม่?

8
มีวิธีแปลงคอลัมน์ CSV เป็นความสัมพันธ์แบบลำดับชั้นหรือไม่
ฉันมีบันทึกความหลากหลายทางชีวภาพ 7 ล้าน csv ซึ่งระดับอนุกรมวิธานเป็นคอลัมน์ ตัวอย่างเช่น RecordID,kingdom,phylum,class,order,family,genus,species 1,Animalia,Chordata,Mammalia,Primates,Hominidae,Homo,Homo sapiens 2,Animalia,Chordata,Mammalia,Carnivora,Canidae,Canis,Canis 3,Plantae,nan,Magnoliopsida,Brassicales,Brassicaceae,Arabidopsis,Arabidopsis thaliana 4,Plantae,nan,Magnoliopsida,Fabales,Fabaceae,Phaseoulus,Phaseolus vulgaris ฉันต้องการสร้างการสร้างภาพข้อมูลใน D3 แต่รูปแบบข้อมูลจะต้องเป็นเครือข่ายโดยที่แต่ละคอลัมน์มีค่าต่างกันเป็นลูกของคอลัมน์ก่อนหน้าสำหรับค่าที่แน่นอน ฉันต้องเปลี่ยนจาก csv เป็นอย่างนี้: { name: 'Animalia', children: [{ name: 'Chordata', children: [{ name: 'Mammalia', children: [{ name: 'Primates', children: 'Hominidae' }, { name: 'Carnivora', children: 'Canidae' }] }] }] } ฉันไม่ได้คิดเกี่ยวกับวิธีการทำสิ่งนี้โดยไม่ใช้ลูปเป็นพัน ไม่มีใครมีข้อเสนอแนะเกี่ยวกับวิธีการสร้างเครือข่ายนี้ในหลามหรือจาวาสคริปต์?

3
ใช้ gganimate เพื่อสร้างการสังเกตฮิสโตแกรมโดยการสังเกต? ต้องการทำงานกับชุดข้อมูลขนาดใหญ่ (~ n = 5,000)
รางวัลจะหมดอายุในวันที่ 2 คำตอบสำหรับคำถามนี้มีสิทธิ์ได้รับค่าหัว+200ชื่อเสียง maxกำลังมองหาคำตอบจากแหล่งที่เชื่อถือได้ ฉันต้องการสุ่มตัวอย่างคะแนนจากการแจกแจงแบบปกติแล้วสร้าง dotplot ทีละตัวโดยใช้gganimateแพ็คเกจจนกว่าเฟรมสุดท้ายจะแสดง dotplot แบบเต็ม โซลูชันที่ใช้งานได้กับชุดข้อมูลที่มีขนาดใหญ่ขึ้น ~ 5,000 - 20,000 จุดเป็นสิ่งจำเป็น นี่คือรหัสที่ฉันมี: library(gganimate) library(tidyverse) # Generate 100 normal data points, along an index for each sample samples <- rnorm(100) index <- seq(1:length(samples)) # Put data into a data frame df <- tibble(value=samples, index=index) df มีลักษณะเช่นนี้: > …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.