วิธีง่ายๆในการค้นหาว่าแต่ละคอลัมน์ใน data frame คืออะไร
วิธีง่ายๆในการค้นหาว่าแต่ละคอลัมน์ใน data frame คืออะไร
คำตอบ:
ทางเลือกหนึ่งคือการใช้lapplyและclass. ตัวอย่างเช่น:
> foo <- data.frame(c("a", "b"), c(1, 2))
> names(foo) <- c("SomeFactor", "SomeNumeric")
> lapply(foo, class)
$SomeFactor
[1] "factor"
$SomeNumeric
[1] "numeric"
อีกทางเลือกหนึ่งคือstr:
> str(foo)
'data.frame': 2 obs. of 2 variables:
$ SomeFactor : Factor w/ 2 levels "a","b": 1 2
$ SomeNumeric: num 1 2
unlist(lapply(foo, class))ซึ่งสะดวกสำหรับกรอบข้อมูลที่มีคอลัมน์จำนวนมาก
unlistด้วยlapplyเป็นความคิดที่แย่มากเพราะเป็นไปได้ว่าlength(class(x))>1 (ดูความคิดเห็นด้านบน) - sapplyปลอดภัยกว่าunlist + lapplyมาก วิธีที่ปลอดภัยคือsapply(lapply(foo, class), "[", 1)- เนื่องจาก foo เป็นกรอบข้อมูล
คุณสามารถใช้ฟังก์ชันlapplyหรือsapplyฟังก์ชันในตัวได้อย่างง่ายดาย
lapplyจะส่งคืนคุณlist-
lapply(dataframe,class)
ในขณะที่sapplyจะใช้ประเภทผลตอบแทนที่ดีที่สุดเท่าที่จะเป็นไปได้เช่น เวกเตอร์ ฯลฯ -
sapply(dataframe,class)
คำสั่งทั้งสองจะส่งคืนชื่อคอลัมน์ทั้งหมดให้กับคุณด้วยคลาสตามลำดับ
สวัสดีกำลังมองหาสิ่งเดียวกันและอาจเป็นเช่นกัน
unlist(lapply(mtcars,class))
คุณสามารถใช้ได้purrrเช่นกันซึ่งคล้ายกับapplyฟังก์ชันครอบครัว:
as.data.frame(purrr::map_chr(mtcars, class))
purrr::map_df(mtcars, class)
ฉันต้องการเอาต์พุตที่กะทัดรัดกว่าคำตอบที่ดีข้างต้นlapplyดังนั้นนี่คือทางเลือกอื่นที่รวมเป็นฟังก์ชันขนาดเล็ก
# Example data
df <-
data.frame(
w = seq.int(10),
x = LETTERS[seq.int(10)],
y = factor(letters[seq.int(10)]),
z = seq(
as.POSIXct('2020-01-01'),
as.POSIXct('2020-10-01'),
length.out = 10
)
)
# Function returning compact column classes
col_classes <- function(df) {
t(as.data.frame(lapply(df, function(x) paste(class(x), collapse = ','))))
}
# Return example data's column classes
col_classes(df)
[,1]
w "integer"
x "character"
y "factor"
z "POSIXct,POSIXt"
classส่งคืนเวกเตอร์อักขระของคลาสทั้งหมดที่อ็อบเจ็กต์สืบทอดมาผลลัพธ์ของsapply(foo, class)อาจเป็นรายการไม่ใช่เวกเตอร์อักขระอย่างที่คนส่วนใหญ่คาดหวังเสมอไป ซึ่งอาจเป็นอันตรายได้เล็กน้อย ... ฉันพบว่าlapplyปลอดภัยกว่ามาก