ถ้าอย่างนั้น: ยินดีต้อนรับสู่โลก R ;-)
ไปเลย
การตั้งค่ารหัส
urls <- c(
"http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
"http://en.wikipedia.org/wiki/Xz",
"xxxxx"
)
readUrl <- function(url) {
out <- tryCatch(
{
# Just to highlight: if you want to use more than one
# R expression in the "try" part then you'll have to
# use curly brackets.
# 'tryCatch()' will return the last evaluated expression
# in case the "try" part was completed successfully
message("This is the 'try' part")
readLines(con=url, warn=FALSE)
# The return value of `readLines()` is the actual value
# that will be returned in case there is no condition
# (e.g. warning or error).
# You don't need to state the return value via `return()` as code
# in the "try" part is not wrapped insided a function (unlike that
# for the condition handlers for warnings and error below)
},
error=function(cond) {
message(paste("URL does not seem to exist:", url))
message("Here's the original error message:")
message(cond)
# Choose a return value in case of error
return(NA)
},
warning=function(cond) {
message(paste("URL caused a warning:", url))
message("Here's the original warning message:")
message(cond)
# Choose a return value in case of warning
return(NULL)
},
finally={
# NOTE:
# Here goes everything that should be executed at the end,
# regardless of success or error.
# If you want more than one expression to be executed, then you
# need to wrap them in curly brackets ({...}); otherwise you could
# just have written 'finally=<expression>'
message(paste("Processed URL:", url))
message("Some other message at the end")
}
)
return(out)
}
การใช้รหัส
> y <- lapply(urls, readUrl)
Processed URL: http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html
Some other message at the end
Processed URL: http://en.wikipedia.org/wiki/Xz
Some other message at the end
URL does not seem to exist: xxxxx
Here's the original error message:
cannot open the connection
Processed URL: xxxxx
Some other message at the end
Warning message:
In file(con, "r") : cannot open file 'xxxxx': No such file or directory
กำลังตรวจสอบผลลัพธ์
> head(y[[1]])
[1] "<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">"
[2] "<html><head><title>R: Functions to Manipulate Connections</title>"
[3] "<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\">"
[4] "<link rel=\"stylesheet\" type=\"text/css\" href=\"R.css\">"
[5] "</head><body>"
[6] ""
> length(y)
[1] 3
> y[[3]]
[1] NA
ข้อสังเกตเพิ่มเติม
tryCatch
tryCatch
ส่งคืนค่าที่เกี่ยวข้องกับการดำเนินการexpr
เว้นแต่ว่ามีข้อผิดพลาดหรือคำเตือน ในกรณีนี้สามารถระบุค่าส่งคืนเฉพาะ (ดูreturn(NA)
ด้านบน) โดยการจัดหาฟังก์ชันตัวจัดการตามลำดับ (ดูอาร์กิวเมนต์error
และwarning
ใน?tryCatch
) สิ่งเหล่านี้อาจเป็นฟังก์ชั่นที่มีอยู่แล้ว แต่คุณสามารถกำหนดได้ภายในtryCatch()
(ตามที่ฉันทำด้านบน)
ความหมายของการเลือกค่าส่งคืนเฉพาะของฟังก์ชันตัวจัดการ
ในฐานะที่เราได้ระบุไว้ว่าNA
ควรจะกลับในกรณีของข้อผิดพลาดองค์ประกอบที่สามในการเป็นy
NA
ถ้าเราต้องการได้รับการแต่งตั้งNULL
ให้เป็นค่าตอบแทน, ความยาวของy
ก็จะได้รับการ2
แทน3
เป็นlapply()
ก็จะ "ละเว้น" NULL
ค่าผลตอบแทนที่มี โปรดทราบว่าหากคุณไม่ได้ระบุค่าส่งคืนอย่างชัดเจนผ่านทางreturn()
ฟังก์ชันตัวจัดการจะส่งคืนNULL
(เช่นในกรณีที่เกิดข้อผิดพลาดหรือเงื่อนไขคำเตือน)
ข้อความเตือน "ไม่ต้องการ"
ในฐานะที่warn=FALSE
ดูเหมือนจะไม่ได้มีผลกระทบใด ๆ ทางเลือกในการปราบปรามการเตือน (ซึ่งในกรณีนี้ไม่ได้จริงๆที่น่าสนใจ) คือการใช้งาน
suppressWarnings(readLines(con=url))
แทน
readLines(con=url, warn=FALSE)
หลายนิพจน์
โปรดทราบว่าคุณยังสามารถวางหลายนิพจน์ใน "ส่วนนิพจน์ที่เกิดขึ้นจริง" (อาร์กิวเมนต์expr
ของtryCatch()
) ถ้าคุณใส่ไว้ในวงเล็บปีกกา (เช่นเดียวกับที่ฉันแสดงในfinally
ส่วน)
paste
ฟังก์ชันของคุณลงท้ายด้วยช่องว่างทำไมไม่เว้นช่องว่างและsep=""
?