นี่คือตัวอย่างทั้งหมดที่อ่านเนื้อหาของหน้าเว็บที่ระบุ หน้าเว็บอ่านจากรูปแบบ HTML เราใช้InputStream
คลาสมาตรฐานแต่สามารถทำได้ง่ายกว่าด้วยไลบรารี JSoup
<dependency>
<groupId>javax.servlet</groupId>
<artifactId>javax.servlet-api</artifactId>
<version>3.1.0</version>
<scope>provided</scope>
</dependency>
<dependency>
<groupId>commons-validator</groupId>
<artifactId>commons-validator</artifactId>
<version>1.6</version>
</dependency>
สิ่งเหล่านี้คือการพึ่งพา Maven เราใช้ไลบรารี Apache Commons เพื่อตรวจสอบสตริง URL
package com.zetcode.web;
import com.zetcode.service.WebPageReader;
import java.io.IOException;
import java.nio.charset.StandardCharsets;
import javax.servlet.ServletException;
import javax.servlet.ServletOutputStream;
import javax.servlet.annotation.WebServlet;
import javax.servlet.http.HttpServlet;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;
@WebServlet(name = "ReadWebPage", urlPatterns = {"/ReadWebPage"})
public class ReadWebpage extends HttpServlet {
@Override
protected void doGet(HttpServletRequest request, HttpServletResponse response)
throws ServletException, IOException {
response.setContentType("text/plain;charset=UTF-8");
String page = request.getParameter("webpage");
String content = new WebPageReader().setWebPageName(page).getWebPageContent();
ServletOutputStream os = response.getOutputStream();
os.write(content.getBytes(StandardCharsets.UTF_8));
}
}
ReadWebPage
เซิร์ฟเล็ตอ่านเนื้อหาของหน้าเว็บที่ได้รับและส่งกลับไปยังลูกค้าในรูปแบบข้อความธรรมดา WebPageReader
งานของการอ่านหน้านี้มีการมอบหมายให้
package com.zetcode.service;
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.URL;
import java.nio.charset.StandardCharsets;
import java.util.logging.Level;
import java.util.logging.Logger;
import java.util.stream.Collectors;
import org.apache.commons.validator.routines.UrlValidator;
public class WebPageReader {
private String webpage;
private String content;
public WebPageReader setWebPageName(String name) {
webpage = name;
return this;
}
public String getWebPageContent() {
try {
boolean valid = validateUrl(webpage);
if (!valid) {
content = "Invalid URL; use http(s)://www.example.com format";
return content;
}
URL url = new URL(webpage);
try (InputStream is = url.openStream();
BufferedReader br = new BufferedReader(
new InputStreamReader(is, StandardCharsets.UTF_8))) {
content = br.lines().collect(
Collectors.joining(System.lineSeparator()));
}
} catch (IOException ex) {
content = String.format("Cannot read webpage %s", ex);
Logger.getLogger(WebPageReader.class.getName()).log(Level.SEVERE, null, ex);
}
return content;
}
private boolean validateUrl(String webpage) {
UrlValidator urlValidator = new UrlValidator();
return urlValidator.isValid(webpage);
}
}
WebPageReader
ตรวจสอบความถูกต้องของ URL และอ่านเนื้อหาของเว็บเพจ ส่งคืนสตริงที่มีโค้ด HTML ของเพจ
<!DOCTYPE html>
<html>
<head>
<title>Home page</title>
<meta charset="UTF-8">
</head>
<body>
<form action="ReadWebPage">
<label for="page">Enter a web page name:</label>
<input type="text" id="page" name="webpage">
<button type="submit">Submit</button>
</form>
</body>
</html>
สุดท้ายนี่คือโฮมเพจที่มีรูปแบบ HTML นำมาจากบทแนะนำของฉันเกี่ยวกับหัวข้อนี้
servlets
แท็ก ที่นี่ไม่มีjavax.servlet.*
API ที่เกี่ยวข้อง คุณจะมีปัญหาเดียวกันmain()
ทุกประการเมื่อทำเช่นนั้นในคลาสวานิลลา Java ธรรมดาด้วยวิธีการ