Le robot d'exploration Java télécharge des images de pages Web

En Java, vous pouvez utiliser HttpURLConnection, Jsoup et d'autres bibliothèques pour implémenter l'exploration de pages Web et le téléchargement d'images. Voici un exemple de base :

Tout d'abord, vous devez ajouter la bibliothèque Jsoup à votre projet. Si vous utilisez Maven, vous pouvez ajouter les dépendances suivantes à votre fichier pom.xml :

XML

<dependencies> <dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.13.1</version> </dependency> </dependencies>

Ensuite, vous pouvez utiliser le code suivant pour télécharger l'image sur la page Web :

classe publique Principale {

public static void main (String[] arguments) {

URL de chaîne = "http://exemple.com" ;

//Remplacez par la page Web que vous souhaitez explorer

Chaîne URL saveDir = "./";

// Répertoire où sont enregistrées les images

essayer {

HttpURLConnection conn = (HttpURLConnection) new URL(url).openConnection(); conn.setRequestMethod("GET");

conn.connect();

Chaîne html = Jsoup.parse(new InputStreamReader(conn.getInputStream()));

Document doc = Jsoup.parse(html); Éléments imgElements = doc.select("img");

// Sélectionne tous les éléments img

pour (Élément img : imgElements) {

Chaîne imgUrl = img.absUrl("src");

// Récupère l'image

Chaîne URL fileName = imgUrl.substring(imgUrl.lastIndexOf("/") + 1);

// Récupère le nom du fichier de l'image

Fichier fichier = nouveau fichier (saveDir + fileName);

//Créer le fichier à sauvegarder

essayez (InputStream in = new java.net.URL(imgUrl).openStream()) {

Files.copy(in, file.toPath(), StandardCopyOption.REPLACE_EXISTING);

// Téléchargez l'image et enregistrez-la dans le répertoire spécifié

} catch (IOException e) {

e.printStackTrace();

} } } catch (IOException e) {

e.printStackTrace(); } } } 

Ce code ouvre d'abord l'URL spécifiée, puis analyse le code HTML et sélectionne tous imgles éléments. Pour chaque imgélément, il obtient l'URL de l'image, puis télécharge l'image et l'enregistre dans le répertoire spécifié. Veuillez noter qu'il ne s'agit que d'un exemple simple, les pages Web réelles peuvent avoir une structure plus complexe et nécessiter une logique d'analyse et de sélection plus complexe.

Guess you like

Origin blog.csdn.net/qq_25462179/article/details/132471349