ทักทาย,
ขณะนี้ฉันกำลังทำสิ่งต่อไปนี้ใน R:
require(zoo)
data <- read.csv(file="summary.csv",sep=",",head=TRUE)
cum = zoo(data$dcomp, as.Date(data$date))
data = zoo(data$compressed, as.Date(data$date))
data <- aggregate(data, identity, tail, 1)
cum <- aggregate(cum, identity, sum, 1)
days = seq(start(data), end(data), "day")
data2 = na.locf(merge(data, zoo(,days)))
plot(data2,xlab='',ylab='compressed bytes',col=rgb(0.18,0.34,0.55))
lines(cum,type="h",col=rgb(0,0.5,0))
สนิปของ summary.csv:
date,revision,file,lines,nclass,nattr,nrel,bytes,compressed,diff,dcomp
2007-07-25,16,model.xml,96,11,22,5,4035,991,0,0
2007-07-27,17,model.xml,115,16,26,6,4740,1056,53,777
2007-08-09,18,model.xml,106,16,26,7,4966,1136,47,761
2007-08-10,19,model.xml,106,16,26,7,4968,1150,4,202
2007-09-06,81,model.xml,111,16,26,7,5110,1167,13,258
...
เส้นสองเส้นสุดท้ายเขียนข้อมูลที่ฉันต้องการและผลลัพธ์คล้ายกับสิ่งต่อไปนี้: เส้นสีน้ำเงินคือเอนโทรปีของสิ่งประดิษฐ์ที่ฉันสนใจ เส้นสีเขียวแสดงถึงเอนโทรปีของการเปลี่ยนแปลง
ตอนนี้ในกราฟนี้มันใช้งานได้ดีเพราะไม่มีความแตกต่างกันมากในเครื่องชั่ง แต่ฉันมีกราฟอื่นที่เส้นสีเขียวเล็กจนมองไม่เห็น
วิธีการแก้ปัญหาที่ฉันกำลังมองหาเกี่ยวข้องกับสองสิ่ง:
- หากต้องการย้ายเส้นแนวตั้งสีเขียวไปยังกราฟที่สองให้ต่ำกว่าเส้นแรกด้วยแกน y ของตัวเอง แต่ใช้แกน x ร่วมกัน
- เพื่อให้มันเป็นมาตราส่วนลอการิทึมเนื่องจากฉันสนใจ "ขนาด" มากกว่าค่าที่ระบุ
ขอบคุณล่วงหน้า!
ป.ล. ถ้าใครบางคนสามารถบอกฉันได้ว่าฉันจะใส่ "ติ๊กเล็ก ๆ น้อย ๆ " ในระดับ x ที่อ้างถึงเดือนฉันขอบคุณ :-) หากคำถามเหล่านี้มีคำถามมากเกินไปสำหรับโพสต์เดียวฉันสามารถแบ่งพวกเขาต่อไป