หลังจากอ่านชุดข้อมูลแล้ว:
dataset <- read.csv("forR.csv")
- ฉันจะได้รับ R เพื่อให้จำนวนกรณีมันมี?
- นอกจากนี้ค่าที่ส่งคืนจะรวมถึงกรณียกเว้นที่ไม่รวมด้วย
na.omit(dataset)
หรือไม่
หลังจากอ่านชุดข้อมูลแล้ว:
dataset <- read.csv("forR.csv")
na.omit(dataset)
หรือไม่คำตอบ:
dataset
จะเป็นกรอบข้อมูล เนื่องจากฉันไม่มีforR.csv
ฉันจะสร้างกรอบข้อมูลขนาดเล็กสำหรับประกอบภาพประกอบ:
set.seed(1)
dataset <- data.frame(A = sample(c(NA, 1:100), 1000, rep = TRUE),
B = rnorm(1000))
> head(dataset)
A B
1 26 0.07730312
2 37 -0.29686864
3 57 -1.18324224
4 91 0.01129269
5 20 0.99160104
6 90 1.59396745
ในการรับจำนวนเคสให้นับจำนวนแถวโดยใช้nrow()
หรือNROW()
:
> nrow(dataset)
[1] 1000
> NROW(dataset)
[1] 1000
หากต้องการนับข้อมูลหลังจากไม่NA
ใช้งานให้ใช้เครื่องมือเดียวกัน แต่ใส่dataset
ในna.omit()
:
> NROW(na.omit(dataset))
[1] 993
ความแตกต่างระหว่างNROW()
และNCOL()
กับตัวแปรตัวพิมพ์เล็ก ( ncol()
และnrow()
) คือเวอร์ชันตัวพิมพ์เล็กจะทำงานกับวัตถุที่มีมิติ (อาร์เรย์เมทริกซ์เฟรมข้อมูล) เท่านั้น เวอร์ชันตัวพิมพ์ใหญ่จะทำงานกับเวกเตอร์ซึ่งถือว่าเป็นเมทริกซ์คอลัมน์ 1 และจะมีประสิทธิภาพหากคุณสิ้นสุดการเซ็ตอัพข้อมูลของคุณเช่นนั้น R จะปล่อยมิติที่ว่างเปล่า
หรือใช้complete.cases()
และsum
มัน ( complete.cases()
ผลตอบแทนเวกเตอร์ตรรกะ [ TRUE
หรือFALSE
] ระบุถ้าสังเกตใด ๆNA
สำหรับแถวใด ๆ
> sum(complete.cases(dataset))
[1] 993
สั้น ๆ :
เรียกใช้dim(dataset)
เพื่อดึงทั้งnและkคุณยังสามารถใช้nrow(df)
และncol(df)
(และแม้NROW(df)
และNCOL(df)
- ตัวแปรจำเป็นสำหรับประเภทอื่นด้วย)
หากคุณแปลงเช่นผ่านdataset <- na.omit(dataset)
กรณีจะหายไปและจะไม่ถูกนับ แต่ถ้าคุณทำเช่น summary(dataset)
กรณี NA มีการพิจารณา
str()
มันให้รายละเอียดที่เป็นประโยชน์อื่น ๆ เกี่ยวกับวัตถุของคุณ มักจะสามารถอธิบายได้ว่าทำไมคอลัมน์จึงไม่ทำงานตามที่ควร (ปัจจัยแทนตัวเลข ฯลฯ )