Cours 4 - Préparation du projet
N.B.
Les explications de chaque commande ou de chaque bloc de codes sont données dans les commentaires.
Configuration du terrain
Nous avons créé l’arborescence de travail à l’aide du script bash suivant nommé
prepare-environnement-projet.sh
#!/bin/bash mkdir PROJET_MOT_SUR_LE_WEB cd PROJET_MOT_SUR_LE_WEB # on peut désormais créer l'arborescence de travail mkdir ./CONTEXTES; mkdir ./DUMP_TEXT; mkdir ./IMAGES; mkdir ./PAGES_ASPIREES; mkdir ./PROGRAMMES; mkdir ./TABLEAUX; mkdir ./URLS; # les lignes précédentes peuvent tenir sur une seule ligne # à savoir mkdir ./CONTEXTES ./DUMP_TEXT etc.... # le dossier URLS contiendra le fichier initial d'URLs
Il suffit de nous positionner dans le même répertoire que ce script et de l’exécuter avec bash
bash prepare-environnement-projet.sh
Lecture des fichiers URL et écriture de leurs contenus dans un nouveau fichier
Nous avons une remarque sur la manière de récupérer tous les fichiers dans un répertoire. Nous avons utilisé /chemin/* au lieu de $(ls /chemin) car ce dernier nous paraît un peu lourd mais nous ne voyons pas leur différence au niveau de la sortie
# !/bin/bash
# on commence par effacer l'éventuel contenu de ficher que l'on doit réécrire
echo "" > "$2/tableau.html";
# on récupère les 2 arguments que l'on a passé au programme
# le premier : chemin vers le dossier contenant les fichiers d'URL
# le second : chemin vers le dossier devant contenir le fichier HTML final
echo "les urls sont dans : $1";
echo "chemin de stockage : $2";
# pour tous les fichiers dans le répertoire 1
for fichier in $1/*
# on exécute les commandes suivantes
do
# compteur destiné à compter les URLs pour chaque fichier d'URL
compteur=1;
echo "$fichier";
for ligne in $(cat "$fichier")
do
echo "$compteur : $ligne" >> "$2/tableau.html";
# on incrémente le compteur des URLs
compteur=$((compteur+1))
done
done