Qu'est ce que le "Persée OAI light harvester"
Il s'agit d'un ensemble de scripts PHP permettant d'interroger, via le protocole OAI-PMH, le portail Persée afin de générer une copie locale de certaines de ses informations.
Cet outil est destiné à tous ceux qui souhaitent présenter les descriptions des collections (listes des numéros disponibles et tables des matières) diffusées par Persée mais qui ne souhaitent pas mettre en oeuvre de technologies lourdes telles qu'un "moissonneur OAI". Il produit un ensemble de pages HTML dont le rendu peut être personnalisé et qu'il est ensuite simple de poser dans l'arborescence d'un site web.
Installation
Le présent outil a été écrit en PHP ; pour l'exécution des scripts, il suffit de disposer d'un serveur apache supportant ce langage (options de compilation du serveur apache), et d'une version de php 5 ou supérieure.
Composition du "package":
/persee_oai_harvester/ /scripts // SCRIPTS index.php // Récupération de la liste des revues add_journal.php // Construction de la liste des numéros d'une revue add_issue.php // Construction de la table des matières d'un numéro url_oai.php // Adresse du serveur OAI à interroger admin.css // CSS générique logo_persee_2.gif // (...) showhide.js // script java : affichage/masquage de div toggle.js // script java : affichage/masquage de div /xsl // XSLT permettant la manipulation des réponses OAI du portail Persée serie.xsl issue.xsl article.xsl /html // PAGES WEB, contenu par défaut /css // Arborescence à copier sur le site local après exécution des scripts persee_default.css /images logo_persee_2.gif access_free.gif access_restricted.gif index.html // cette page
L'ensemble de ces fichiers doit être copié dans l'arborescence de votre serveur web.
Aucune installation particulière n'est à prévoir, par contre, il convient de vérifier quelques éléments de la configuration php.
- la communication OAI avec le portail (et donc les scripts PHP) s'appuyant sur le XML et mettant en oeuvre des transformations XSLT, les outils génériques permettant de manipuler le XML doivent être activés.
- le temps de traitement d'un numéro varie de 1 à 3 secondes. Le traitement de collections longues (>20 numéros) peut entraîner une erreur de type "time-out". Il convient donc de supprimer cette limite (paramètre de time-out mis à 0).
- les scripts (l'uid de votre serveur http) doivent avoir un accès en écriture sur l'ensemble de l'arboresecnce copiée.
Pour vérifier facilement la configuration sur laquelle vous exécutez ces scripts, une fois les fichiers copiés sur votre serveur web, vous pouvez utiliser cette page (fonction phpinfo).
Pour tous ceux qui ne disposent pas d'un serveur web et d'un espace permettant d'exécuter les scripts, nous recommandons l'utilisation d'EasyPhp.
Fonctionnement
Pour exécuter les scripts, il suffit de charger, depuis votre navigateur, la page ./scripts/index.php.
Ce script permet d'envoyer une première requête au serveur OAI de Persée (verb=ListSets) et de récupérer la liste des collections disponibles.
En cliquant sur l'un des titres de revue, vous lancerez les scripts permettant de récupérer la liste des numéros disponibles ainsi que leurs tables des matières et de générer les fichiers HTML correspondant.
L'ensemble des fichiers (HTML, CSS, GIF) nécessaires à l'affichage des collections est placé dans le répertoire ./html/. Il suffit de copier ces données dans l'arborescence du site web local pour les rendre disponibles.
Personnalisation
Le rendu des pages HTML peut être très facilement personnalisé :
- en modifiant la CSS ;
- en modifiant les scripts PHP : l'en-tête et le pied des pages sont clairement identifiés et peuvent être modifiés sans que cela n'altère le contenu des pages (utilisation de <div> identifiées header/content/footer) ;
- en modifiant les XSLT : il est par exemple possible d'enrichir le traitement qui est fait sur les métadonnées des articles et de générer des notices bibliographiques complètes pour chacun d'entre eux ;
- etc.
Licence
Licence GPL (consultez la General Public License).
Recopiez, modifiez, diffusez ce code à volonté.
La mention de l'origine des scripts doit figurer au moins dans les métadonnées des pages qu'ils auront servi à générer. Ceci dans le seul but de faciliter leur ré-utilisation par d'autres sites.
La mention de l'origine des données (Persée dans la configuration par défaut) que vous diffuserez doit également figurer sur chacune des pages générées.
Bonne moisson !
L'équipe Persée