มีชื่อสำหรับแผนภูมินี้ - เรียงลำดับของการข้ามระหว่างแผนภูมิวงกลมและพล็อต mekko


9

มีชื่อของแผนภูมิประเภทนี้ด้านล่าง (ที่มาจากกระทรวงธุรกิจนวัตกรรมและการจ้างงานของนิวซีแลนด์สำหรับคนที่ฉันทำงาน แต่ฉันไม่ได้เกี่ยวข้องกับการสร้างพล็อตนี้)? มันประกอบด้วยสี่เหลี่ยมที่พื้นที่นั้นเป็นสัดส่วนกับตัวแปรและคล้ายกับการข้ามระหว่างแผนภูมิวงกลมพล็อตโมเสคและพล็อต mekko มันอาจใกล้เคียงกับเนื้อเรื่องของ mekko แต่มีความยุ่งยากว่าเราไม่ได้ทำงานกับคอลัมน์ แต่เป็นตัวต่อที่ซับซ้อนมากขึ้น

ต้นฉบับดูดีขึ้นเล็กน้อยเนื่องจากมีเส้นขอบสีขาวระหว่างสี่เหลี่ยมสำหรับแต่ละภูมิภาค

น่าแปลกที่จริง ๆ แล้วมันทำให้ฉันรู้สึกว่ากราฟิกทางสถิติไม่ได้แย่จนเกินไปแม้ว่ามันจะสามารถปรับปรุงให้ดีขึ้นได้จากการใช้สีที่แมปกับสิ่งที่มีความหมาย รุ่นที่มีประสิทธิภาพแบบโต้ตอบแสดงงบประมาณ 2011 สหรัฐได้ถูกนำมาใช้โดยนิวยอร์กไทม์ส

ความท้าทายที่น่าสนใจคือการคิดอัลกอริธึมอัตโนมัติในการวาดและทำให้มันดูสมเหตุสมผลเช่นกัน สี่เหลี่ยมต้องได้รับอนุญาตให้มีอัตราส่วนกว้างยาวต่างกันภายในช่วงที่ยอมรับได้

ป้อนคำอธิบายรูปภาพที่นี่


ผลลัพธ์ที่ได้จากโครงการที่เริ่มต้นด้วยคำถามนี้สามารถมองเห็นได้ในเครื่องมือเว็บแบบโต้ตอบการเชื่อมโยงจากที่นี่: mbie.govt.nz/what-we-do/business-growth-agenda/regions
ปีเตอร์เอลลิส

คำตอบ:


11

ฉันคิดว่า ( http://en.wikipedia.org/wiki/Treemapping )

มีหลายแพ็คเกจเช่นใน R ที่สร้าง treemaps หนึ่งในแพ็คเกจเรียกว่า treemap และอีกอันก็คือแฟ้มสะสมผลงาน ตัวอย่างเช่น Nathan Yau มีการสอนเกี่ยวกับวิธีสร้าง treemap โดยใช้ R ( http://flowingdata.com/2010/02/11/an-easy-way-to-make-a-treemap/ R )


12

คำถามคือชื่อ แต่มันทำงานได้ดีแค่ไหนในการเปิดอภิปราย

นี่คือสิ่งที่น่าเบื่อหน่ายมากกว่าเป็นทางเลือกแผนภูมิแท่งแนวนอน

ป้อนคำอธิบายรูปภาพที่นี่

สิ่งที่เราอาจต้องการทำกับกราฟนั้นแตกต่างจากความเข้าใจในรูปแบบโดยรวมไปถึงการพิจารณาบางกรณี (สิ่งที่เกี่ยวกับ Hawke's Bay และอื่น ๆ ) ฉันขอยืนยันว่าทั้งสองอย่างง่ายขึ้นด้วยแผนภูมิแท่ง รายละเอียดเล็ก ๆ คือฉันใช้ตัวพิมพ์เล็กในชื่อและชื่อที่ง่ายและไม่ทำเครื่องหมาย% ฉันลอกเลียนแบบการเข้ารหัสสีโดยไม่ทราบว่ามันมีความหมายอย่างไรจึงชัดเจนหรือคลุมเครือเหมือนกับสิ่งที่คุณคัดลอก

ฉันขอแนะนำให้บางส่วนของการอุทธรณ์ของ treemaps อยู่ในความแปลกใหม่ของญาติ พวกเขาอาจทำงานได้ดีหรือดีกว่าแผนภูมิแท่งหากมีชื่อหลายสิบชื่อซึ่งสามารถกระจายไปทั่วพื้นที่สองมิติแทนที่จะแสดงในคอลัมน์ยาว แต่สำหรับชื่อ 15 ชื่อขึ้นไปแผนภูมิแท่งยังคงเป็นคู่แข่งที่แข็งแกร่งในมุมมองของฉัน

ฉันมีความสุขกับทุกคนที่ชอบแผนภูมิจุด (คลีฟแลนด์) ที่นี่ แผนภูมิแท่งแนวตั้งจะเผชิญกับความยากลำบากในการวางชื่อภูมิภาคอย่างสะดวกสบาย (แค่จินตนาการหมุนกราฟนี้เพื่อดูว่า) ฉันชอบความคิดในการให้ตัวเลขด้วยแม้ว่าอนุรักษ์นิยมไม่ชอบการผสมกราฟและความคิดตาราง

กราฟถูกวาดใน Stata


4
ฉันจะต้องขุดมันขึ้นมา แต่ถ้าหน่วยความจำของฉันทำหน้าที่ฉันอย่างถูกต้องหนึ่งในแรงจูงใจดั้งเดิมของแผนผังต้นไม้สำหรับองค์กรที่มีลำดับชั้นของข้อมูล (เช่นอนุญาตให้คุณดูขนาดรวมของระดับลำดับชั้นที่แตกต่างกัน) และ สำหรับตัวเลขอื่น ๆ อีกมากมาย ความตั้งใจนั้นไม่เคยมีอยู่ในรายการตัวเลขขนาดเล็กและมีการดึงดูดความสนใจมากขึ้นดูแนวทางการรับรู้การสร้าง Treemaps เป็นรูปสี่เหลี่ยมผืนผ้า ( Kong et al. 2010 )
Andy W

1
นั่นคือความประทับใจของฉันด้วยดังนั้นชื่อ treemap มีเพียงหนึ่งระดับของลำดับชั้นที่ชัดเจนที่นี่
Nick Cox

4
Bill Shneiderman รวบรวมประวัติความเป็นมาที่ดีของการสำรวจความคิดเห็นพร้อมลิงก์ไปยังสิ่งตีพิมพ์ที่เกี่ยวข้อง ( cs.umd.edu/hcil/treemap-history ) Treemaps มีจุดประสงค์เพื่อแสดงลำดับชั้นหลายระดับในวิธีที่ยุ่งเหยิงน้อยกว่า dendrograms หรือต้นไม้ที่สามารถทำได้และในตอนแรกพวกมันถูกใช้เพื่อแสดงภาพเนื้อหาของฮาร์ดดิสก์ ทุกวันนี้ treemaps ใช้สำหรับการมองเห็นต้นไม้สายวิวัฒนาการขนาดใหญ่ (พวกมันแสดงความสัมพันธ์ระหว่างสปีชีส์) ท่ามกลางการใช้งานอื่น ๆ สำหรับตัวอย่างเพิ่มเติมโปรดดูบทความโดย Shneiderman ที่perceptualedge.com/articles/b-eye/treemaps.pdf
JTT

ขอบคุณ; สำหรับสิ่งที่คุ้มค่าฉันเห็นด้วยในกรณีนี้โดยเฉพาะ
Peter Ellis

3

แก้ไข / เพิ่ม

ฉันมีตั้งแต่ค้นพบว่าTreeMapแพคเกจให้ผลดีกว่า map.market () ฟังก์ชันกล่าวถึง (และดัดแปลง) ด้านล่าง; แต่ฉันจะทิ้งคำตอบไว้ด้วยเหตุผลทางประวัติศาสตร์

คำตอบเดิม

ขอบคุณสำหรับคำตอบ การสร้างดาต้าลิงค์ที่ไหลลื่นโดย @JTT แต่ไม่ชอบความจำเป็นในการปรับแต่งด้วยมือใน Illustrator หรือ Inkscape เพียงเพื่อให้ได้กราฟิคที่เหมาะสมฉันได้ปรับแต่งฟังก์ชั่น map.market () ในแพ็คเกจผลงานของ Jeff Enos และ David Kane ผู้ใช้ควบคุมฉลากจะแตกต่างกันไปตามขนาดสี่เหลี่ยมผืนผ้าและหลีกเลี่ยงความแตกต่างสีแดงสีเขียว ตัวอย่างการใช้งาน:

library(portfolio)
library(extrafont)
data(dow.jan.2005)

with(dow.jan.2005, 
    treemap(id    = symbol,
        area  = price,
        group = sector,
        color = 100 * month.ret,
        labsc = .12,  # user-chosen scaling of labels 
        fontfamily="Comic Sans MS")
    )

ป้อนคำอธิบายรูปภาพที่นี่

สำหรับสิ่งที่คุ้มค่าฉันก็เห็นด้วยกับ @NickCox ว่าในตัวอย่างในคำถามเดิมของฉันพล็อตจุดดีกว่า รหัสของฟังก์ชั่น treemap () ที่ปรับของฉันมีดังนี้

treemap <- function (id, area, group, color, scale = NULL, lab = c(group = TRUE, 
    id = FALSE), low="red", middle="grey60", high="blue", main = "Map of the Market", labsc = c(.5, 1), print = TRUE, ...) 
{
    # Adapted by Peter Ellis from map.market() by Jeff Enos and David Kane in the portfolio package on CRAN
    # See map.market for the original helpfile.  The changes are:
    # 1. low, middle and high are user-set color ramp choices
    # 2. The font size now varies with the area of the rectangle being labelled; labsc is a scaling parameter to make it look ok.
    #    First element of labsc is scaling parameter for size of group labels.  Second element is scaling for id labels.
    # 3. ... extra arguments to be passed to gpar() when drawing labels; expected use is for fontfamily="whatever"
    require(portfolio)
    if (any(length(id) != length(area), length(id) != length(group), 
        length(id) != length(color))) {
        stop("id, area, group, and color must be the same length.")
    }
    if (length(lab) == 1) {
        lab[2] <- lab[1]
    }
    if (missing(id)) {
        id <- seq_along(area)
        lab["id"] <- FALSE
    }
    stopifnot(all(!is.na(id)))
    data <- data.frame(label = id, group, area, color)
    data <- data[order(data$area, decreasing = TRUE), ]
    na.idx <- which(is.na(data$area) | is.na(data$group) | is.na(data$color))
    if (length(na.idx)) {
        warning("Stocks with NAs for area, group, or color will not be shown")
        data <- data[-na.idx, ]
    }
    zero.area.idx <- which(data$area == 0)
    if (length(zero.area.idx)) {
        data <- data[-zero.area.idx, ]
    }
    if (nrow(data) == 0) {
        stop("No records to display")
    }
    data$color.orig <- data$color
    if (is.null(scale)) {
        data$color <- data$color * 1/max(abs(data$color))
    }
    else {
        data$color <- sapply(data$color, function(x) {
            if (x/scale > 1) 
                1
            else if (-1 > x/scale) 
                -1
            else x/scale
        })
    }
    data.by.group <- split(data, data$group, drop = TRUE)
    group.data <- lapply(data.by.group, function(x) {
        sum(x[, 3])
    })
    group.data <- data.frame(area = as.numeric(group.data), label = names(group.data))
    group.data <- group.data[order(group.data$area, decreasing = TRUE), 
        ]
    group.data$color <- rep(NULL, nrow(group.data))
    color.ramp.pos <- colorRamp(c(middle, high))
    color.ramp.neg <- colorRamp(c(middle, low))
    color.ramp.rgb <- function(x) {
        col.mat <- mapply(function(x) {
            if (x < 0) {
                color.ramp.neg(abs(x))
            }
            else {
                color.ramp.pos(abs(x))
            }
        }, x)
        mapply(rgb, col.mat[1, ], col.mat[2, ], col.mat[3, ], 
            max = 255)
    }
    add.viewport <- function(z, label, color, x.0, y.0, x.1, 
        y.1) {
        for (i in 1:length(label)) {
            if (is.null(color[i])) {
                filler <- gpar(col = "blue", fill = "transparent", 
                  cex = 1)
            }
            else {
                filler.col <- color.ramp.rgb(color[i])
                filler <- gpar(col = filler.col, fill = filler.col, 
                  cex = 0.6)
            }
            new.viewport <- viewport(x = x.0[i], y = y.0[i], 
                width = (x.1[i] - x.0[i]), height = (y.1[i] - 
                  y.0[i]), default.units = "npc", just = c("left", 
                  "bottom"), name = as.character(label[i]), clip = "on", 
                gp = filler)
            z <- append(z, list(new.viewport))
        }
        z
    }
    squarified.treemap <- function(z, x = 0, y = 0, w = 1, h = 1, 
        func = add.viewport, viewport.list) {
        cz <- cumsum(z$area)/sum(z$area)
        n <- which.min(abs(log(max(w/h, h/w) * sum(z$area) * 
            ((cz^2)/z$area))))
        more <- n < length(z$area)
        a <- c(0, cz[1:n])/cz[n]
        if (h > w) {
            viewport.list <- func(viewport.list, z$label[1:n], 
                z$color[1:n], x + w * a[1:(length(a) - 1)], rep(y, 
                  n), x + w * a[-1], rep(y + h * cz[n], n))
            if (more) {
                viewport.list <- Recall(z[-(1:n), ], x, y + h * 
                  cz[n], w, h * (1 - cz[n]), func, viewport.list)
            }
        }
        else {
            viewport.list <- func(viewport.list, z$label[1:n], 
                z$color[1:n], rep(x, n), y + h * a[1:(length(a) - 
                  1)], rep(x + w * cz[n], n), y + h * a[-1])
            if (more) {
                viewport.list <- Recall(z[-(1:n), ], x + w * 
                  cz[n], y, w * (1 - cz[n]), h, func, viewport.list)
            }
        }
        viewport.list
    }
    map.viewport <- viewport(x = 0.05, y = 0.05, width = 0.9, 
        height = 0.75, default.units = "npc", name = "MAP", just = c("left", 
            "bottom"))
    map.tree <- gTree(vp = map.viewport, name = "MAP", children = gList(rectGrob(gp = gpar(col = "dark grey"), 
        name = "background")))
    group.viewports <- squarified.treemap(z = group.data, viewport.list = list())
    for (i in 1:length(group.viewports)) {
        this.group <- data.by.group[[group.data$label[i]]]
        this.data <- data.frame(this.group$area, this.group$label, 
            this.group$color)
        names(this.data) <- c("area", "label", "color")
        stock.viewports <- squarified.treemap(z = this.data, 
            viewport.list = list())
        group.tree <- gTree(vp = group.viewports[[i]], name = group.data$label[i])
        for (s in 1:length(stock.viewports)) {
            stock.tree <- gTree(vp = stock.viewports[[s]], name = this.data$label[s], 
                children = gList(rectGrob(name = "color")))
            if (lab[2]) {
                stock.tree <- addGrob(stock.tree, textGrob(x = unit(1, 
                  "lines"), y = unit(1, "npc") - unit(1, "lines"), 
                  label = this.data$label[s], gp = gpar(col = "white", fontsize=this.data$area[s] * labsc[2], ...), 
                  name = "label", just = c("left", "top")))
            }
            group.tree <- addGrob(group.tree, stock.tree)
        }
        group.tree <- addGrob(group.tree, rectGrob(gp = gpar(col = "grey"), 
            name = "border"))
        if (lab[1]) {
            group.tree <- addGrob(group.tree, textGrob(label = group.data$label[i], 
                name = "label", gp = gpar(col = "white", fontsize=group.data$area[i] * labsc[1], ...)))
        }
        map.tree <- addGrob(map.tree, group.tree)
    }
    op <- options(digits = 1)
    top.viewport <- viewport(x = 0.05, y = 1, width = 0.9, height = 0.2, 
        default.units = "npc", name = "TOP", , just = c("left", 
            "top"))
    legend.ncols <- 51
    l.x <- (0:(legend.ncols - 1))/(legend.ncols)
    l.y <- unit(0.25, "npc")
    l.cols <- color.ramp.rgb(seq(-1, 1, by = 2/(legend.ncols - 
        1)))
    if (is.null(scale)) {
        l.end <- max(abs(data$color.orig))
    }
    else {
        l.end <- scale
    }
    top.list <- gList(textGrob(label = main, y = unit(0.7, "npc"), 
        just = c("center", "center"), gp = gpar(cex = 2, ...)), segmentsGrob(x0 = seq(0, 
        1, by = 0.25), y0 = unit(0.25, "npc"), x1 = seq(0, 1, 
        by = 0.25), y1 = unit(0.2, "npc")), rectGrob(x = l.x, 
        y = l.y, width = 1/legend.ncols, height = unit(1, "lines"), 
        just = c("left", "bottom"), gp = gpar(col = NA, fill = l.cols), 
        default.units = "npc"), textGrob(label = format(l.end * 
        seq(-1, 1, by = 0.5), trim = TRUE), x = seq(0, 1, by = 0.25), 
        y = 0.1, default.units = "npc", just = c("center", "center"), 
        gp = gpar(col = "black", cex = 0.8, fontface = "bold")))
    options(op)
    top.tree <- gTree(vp = top.viewport, name = "TOP", children = top.list)
    mapmarket <- gTree(name = "MAPMARKET", children = gList(rectGrob(gp = gpar(col = "dark grey", 
        fill = "dark grey"), name = "background"), top.tree, 
        map.tree))
    if (print) {
        grid.newpage()
        grid.draw(mapmarket)
    }
    invisible(mapmarket)
}

รหัสนั้นไม่ต้องสงสัยเลยว่ามีประโยชน์ ฉันไม่ต้องการลากการอภิปรายไปยังส่วนที่มันจะไม่ไป แต่เป็นตัวอย่างโดยพลการหรือมีเหตุผลที่ให้พื้นที่แสดงราคาหุ้นหรือไม่ สิ่งที่เราควรจะเห็นหรือกำลังมองหาในเรื่องนี้? (ฉันไม่ได้เป็นศัตรูเพียงแค่ไม่มีประสบการณ์โดยสิ้นเชิงกับการพยายามใช้การออกแบบนี้จริงแม้ว่าฉันจะได้เห็นตัวอย่างมากมาย)
นิคค็อกซ์

1
อันที่จริงฉันเพิ่งดูตัวอย่างจากไฟล์ช่วยเหลือสำหรับ map.market () โดย Enos และ Kane ฉันไม่เห็นว่าทำไมพวกเขาถึงเลือกที่จะแสดงราคาพื้นที่ มาตรการที่สมเหตุสมผลกว่านั้นก็คือการแสดงการใช้ตัวพิมพ์ใหญ่ทั้งหมดเช่นราคา x จำนวนหุ้น (ทั้งจำนวนหุ้นในตลาดหรือจำนวนหุ้นที่ฉันเกิดขึ้นเองตามวัตถุประสงค์) จากนั้นคุณจะต้องใช้พล็อตที่ใช้งานง่ายเพื่อแสดงความสำคัญของหุ้นที่แตกต่างกัน
Peter Ellis

ฉันงงด้วยการใช้ราคา
Nick Cox

1

มันเป็น TreeMap, คุณสามารถทำมันได้อย่างง่ายดายด้วย Tableau 8 และฟรีสาธารณะ Tableau ดูตัวอย่างที่นี่: http://www.tableausoftware.com/new-features/new-view-types คุณยังสามารถดู @this URL ที่ Treemap สามารถใช้ร่วมกับแผนภูมิแท่งได้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.