Ban3

Pdf-128x128 Télécharger le PDF

Manuel de PISTOU

V9- Février 2010

Isabelle Guillet - Joëlle Prévost

Présentation

PISTOU (http://pistou.imag.fr) est une application web de gestion des notices bibliographiques, développé au LIG, en logiciel libre.

Il répond au besoin de collecte et de consultation des notices bibliographiques individuelles aussi bien que des équipes de recherche.

C'est un outil collaboratif: les données peuvent être mises à jour par tout utilisateur disposant du droit d'accès.

Le format d'entrée des données est le format bibtex. La description d'une notice comprend tous les champs habituellement utilisés dans notre discipline.

Il implémente des heuristiques pour détecter les doublons (d' auteurs ou de publications) et les fusionne. Le déposant n'intervient qu'en cas de conflit non résolu par l'application.

1.Qu'est-ce qu'on peut faire avec:

    • Consulter: Un visiteur effectue des recherches sur les publications par auteur, par éditeur, par titre, par équipe, par type de publication, ainsi que par année ou intervalle d'années. La recherche peut bien sûr réunir tous ces critères.
      Le visiteur choisit l'affichage de chaque publication sous la forme de HTML ou BIBTEX. Il peut sélectionner des publications pour les copier dans un panier. Ce panier peut ensuite être exporté sous forme de fichier avec un choix de formats (bibtex, latex, pdf, XML, JSON)

    • Exploiter: La base peut être interrogée via des URL comportant des arguments pour sélectionner, trier et indiquer le format de sortie.

    • Déposer: Un utilisateur disposant d'un accès « déposant », charge des fichiers BibTex ou bien coupe/colle des portions de fichiers, puis règle les conflits sur les noms d'auteurs ou les publications non résolus par l'application: Homonymies, Orthographe, Respect des notations standard...
      Le déposant peut clore sa session avant d'avoir réglé les conflits. Il retrouvera sa session avec toutes les publications qu’il a déposées.

    • Maintenir: Unutilisateur disposant d'un accès « déposant » peut contribuer à la qualité des données en faisant des mises à jour sur tout auteur ou notice de la base. Pistou peut être utilisé pour la gestion de listes de publications personnelles ou d'équipe.


2.Qu'est-ce qu'on ne peut pas faire

L'application n'est pas une archive, on peut cependant préciser une adresse où se trouve un document.



Mode d'emploi

1.La consultation de la base est en libre accès

    • La recherche de publications se fait sur des chaînes de caractères dans le(s) nom(s) d'auteur(s) ou le titre. Des critères d'année ( ou d'intervalle d'années) de publication , de type de publication peuvent être ajoutés.

    • L'affichage de chaque notice peut être basculé en format bibtex.

    • Une fonction de tri permet un classement par année puis par type de publication ou l'inverse, et un classement selon les critères élaborés par le Ministère de l'Enseignement Supérieur et de la Recherche, en se basant sur http://www.ifris.org/IMG/pdf/NoteMethodoBiblio.pdf

    • La liste obtenue , ou une sélection manuelle déposée dans un panier peut être exportée en formats bibtex, pdf, LaTex, rtf, xml, json. Voir le détail des formats sur la FAQ n° 19


2.Déposer des notices bibliographiques

Le principe général:
    1. Vous chargez dans la base toutes vos notices (qu'elles soient personnelles ou celles d'un collègue ou celles de votre équipe)

    2. Si l'application ne décèle aucun conflit possible avec des données déjà dans la base (chargées par un collègue par exemple, ou un de vos co-auteurs), c'est terminé.

    3. Sinon vous comparez vos notices et celles qui sont déjà dans la base et vous décidez s'il y a effectivement doublon ou non. Vous pouvez différer cette étape de correction, mais il est fortement conseillé de la faire AVANT de faire toute nouvelle introduction de notices.
      Attention ! : les auteurs ou notices détectés en conflit n'apparaitront pas dans le résultat de requêtes à la base.

Concrètement:
    1. Demandez un accès « déposant » en écrivant à pistou.lig@imag.fr

    2. Connectez vous sur http://pistou.imag.fr puis passez sur l'onglet « Déposer »

    3. Ajoutez des notices soit par couper/coller , soit en chargeant un fichier bibtex.
      Vous obtenez d'une part la liste des auteurs et des notices que vous avez ajoutés (onglet « Mes dépôts »), d'autre part la liste de ceux qui sont en conflit avec des informations déjà présentes dans la base (onglet « Mes conflits »).

    4. Réglez les conflits sur des noms d'auteurs : cliquez sur « Comparer » pour :

      • Corriger ou ajouter des attributs des auteurs (Nom, Prénom, email, URL, équipe d'appartenance)

      • Lever le doute sur le statut d'un nouvel auteur inséré: doublon ou réellement un nouvel auteur.
        L' auteur qui vient d'être inséré est à gauche, le ou les auteurs en conflit sont à droite.
        Dans la partie droite dépliez (bouton « Afficher ») l' auteur (ou un des auteurs) à comparer au nouveau

        • Si l' auteur est réellement un nouvel auteur, cliquez sur « Confirmer cet auteur», après l'avoir éventuellement mis à jour ou complété.

        • Si le nouvel auteur fait doublon avec un des auteurs affichés en partie droite, confirmez que les deux auteurs sont identiques (bouton « Confondre avec »), après avoir éventuellement mis à jour l' auteur affiché en partie droite.

    5. Retournez sur votre liste des conflits et réglez successivement les autres conflits sur noms d'auteurs.

    6. Régler les conflits sur les notices: cliquez sur « Comparer » pour :

      • Modifier des champs dans les notices, ajouter ou supprimer un auteur de la publication, ré-ordonner la liste des auteurs, modifier le type de la publication, ajouter ou modifier l'URL et le type d'un document.

      • Lever le doute sur le statut d' une notice insérée : doublon ou réellement nouvelle notice .
        La notice qui vient d'être insérée est à gauche, la ou les notices en conflit sont à droite.
        Dans la partie droite dépliez (bouton « Afficher ») la notice (ou une des notices) à comparer à la nouvelle.

        • Si la nouvelle notice est à ajouter, cliquez sur « Confirmer cette notice», après l'avoir éventuellement mise à jour ou complétée.

        • Si la nouvelle notice fait doublon avec une des notices affichées en partie droite, confondez les deux notices identiques (bouton « Confondre avec »), après avoir éventuellement mis à jour la notice dépliée en partie droite.

    7. Retournez sur votre liste des conflits et réglez successivement les autres conflits sur des notices..


3.Corriger ou mettre à jour des notices déjà dans la base

Connectez-vous sur http://pistou.imag.fr pour avoir accès aux fonctions de mise à jour et d'administration.

Vous pouvez alors faire des mises à jour d'auteurs, de notices ou d'équipes soit à partir d'une recherche, soit à partir de la liste de vos dépôts, soit via l'onglet « Administrer », qui vous donne la liste de tous les auteurs connus, de toutes les notices déposées, des différentes équipes saisies.

Sur les auteurs: corrections orthographiques et mise à jour d' email, URL, appartenance à une équipe, dates d'arrivée et départ.

Sur les notices: tous les attributs peuvent être édités.

Forcer la comparaison de 2 notices: La méthode consiste à mettre les 2 notices en conflit. Si vous avez des doutes sur 2 notices , faites une recherche sur l'une d'elles dans l'onglet « Administration », sous-onglet « Publications » , puis cliquez sur « Mettre en conflit » et saisissez le titre ou l'identifiant de la 2eme. La fenêtre suivante permet de décider si les 2 notices sont bien distinctes ou bien de les confondre. Attention ! : vous devez prendre un décision, car les notices en conflit n'apparaitront pas dans le résultat de requêtes à la base.

4.Gérer sa liste de publications personnelle ou d'équipe

Pour ajouter les notices de publications nouvelles, choisissez une des ces méthodes:

  • soit vous ajoutez dans Pistou uniquement les notices des publications nouvelles via un nouveau fichier bibtex

  • soit vous faites des ajouts sur un fichier bibtex personnel. Dans ces cas il est fortement conseillé de faire un export bibtex de Pistou, puis d'y ajouter les nouvelles notices avant de recharger le fichier complet. Chaque notice déjà présente dans Pistou sera silencieusement fusionnée avec son doublon.

5.Exporter sa liste de publication ou celle de son équipe

Pistou permet de récupérer sa liste personnelle ou la liste des notices d'équipe sous différents formats :

  • Format HTML : 2 formes possibles :
    • http://pistou.imag.fr/authors/show/id[?tri=xxx] pour un auteur ou
      http://pistou.imag.fr/teams/show/id[?tri=xxx], pour une équipe, le paramètre tri (MESR par défaut) étant optionnel.

    • http://pistou.imag.fr/site/author/id [?tri=xxx][&year=AAAA] pour un auteur,
      http://pistou.imag.fr/site/team/id[?tri=xxx][&year=AAAA] pour une équipe
      http://pistou.imag.fr/site/publication/?id[]=xxx[&id[]=xyz][&id[]=zzz][&id[]=...][&type=yyy][&tri=xxx] pour une ou plusieurs publications. Remplacez les valeurs « xxx », « xyz », « zzz » par les id de publications.

    Comment récupérer une id ? FAQ20

    La différence entre ces deux formes d'url est que la deuxième forme n'affichera pas la bannière Pistou,permettant ainsi d'être plus facilement intégrée dans une page de site via une frame. La première URL contenant la bannière Pistou, il est conseiller d'effectuer un lien vers cette page dans une nouvelle fenêtre.

    Valeur du paramètre TRI :
    "MESR" : tri par critères du MESR (par défaut)
    "type date" : tri par type bibtex puis date,
    "date type" : tri par date puis type bibtex

    Valeur possible du paramètre TYPE:
    « Unpublished » « Misc » « Manual » « Booklet » « TechReport » « MastersThesis » « InCollection »
    « InProceedings » « Proceedings » « Article » « InBook » « Book » « PhDThesis » « MESR-TH »
    « MESR-ACL » « MESR-ACLN » « MESR-INV » « MESR-ACT » « MESR-ACTN » « MESR-COM »
    « MESR-AFF » « MESR-OS » « MESR-OV » « MESR-DO » « MESR-AP »

    Dans la deuxième URL, il est possible d'indiquer une année [year=AAAA] ou un intervalle d'année [year=AAAAA-AAAAA+x] pour restreindre la sélection.

    Dans ce deuxième format, il est aussi possible d'indiquer une liste spécifique de publication(s) en précisant leur id de cette façon : http://pistou.imag.fr/site/publications/?id[]=xxx[&id[]=xyz][&id[]=zzz][&id[]=...][&tri=xxx] Remplacez les valeurs « xxx », « xyz », « zzz » par les id de publications.

  • Format BIBTEX LATEX, BIBTEX UTF8, BIBTEX INRIA ((bibtex avec les champs X_), LATEX
  • L'url est du même format que ci-dessus (deuxième forme) avec le paramètre supplémentaire [&export=xxx]. Les possibilités de de tri et de sélection de publications particulières sont les mêmes.

    Le paramètre export prend alors les valeurs : [bibtex latex ou bibtex utf8 ou bibtex inria ou latex]. Ceci vous renvoie un fichier à télécharger ou à traiter dans un script.

    Ex : http://pistou.imag.fr/site/author/5?tri=MESR&export=bibtex latex
    http:/pistou.imag.fr/site/team/10?year=2000&export=bibtex inria
    http:/pistou.imag.fr/site/publication/id[]=11200,id[]=1201,id[]=1202,id[]=1203&export=bibtex utf8

  • Format PDF
  • Idem que ci-dessus avec le paramètre &export=pdf. Ceci renvoie un fichier pdf contenant la liste des publications spécifiées.

  • FORMAT RTF
  • Idem que ci-dessus avec le paramètre &export=rtf. Ceci renvoie un fichier au format rtf contenant la liste des publications spécifiées.

  • FORMAT XML ou JSON
  • Idem que ci-dessus avec le paramètre &export=xml ou &export=json. Ceci renvoie un fichier du format indiqué contenant la liste des publications spécifiées, à afficher tel quel ou à traiter dans un script.

    Par exemple, vous désirez afficher la liste des publications de votre équipe, mais en y appliquant votre propre style (celui de votre site) : récupérez la liste dans un de ces deux formats et traiter via un script php l'affichage des notices.

Pour l'explication des différents formats d'exportation, voir FAQ19

FAQ

1.A l'aide !

Contactez pistou.lig@imag.fr

2.Mais qui a réalisé ce merveilleux outil ?

Emile Morel, stagiaire IUT (son rapport de stage), puis contractuel, sur un cahier des charges et avec l'encadrement de Arnaud Legrand, Isabelle Guillet, Joëlle Prévost, et les contributions de Vincent Danjean . Le déploiement et la maintenance du serveur sont du ressort de Christian Séguy. L'application est aujourd'hui maintenue par Isabelle Guillet.

PISTOU a repris les meilleurs fonctionnalités de «Basilic» ( http://artis.imag.fr/Software/Basilic) et

«Basilic Plus» ( http://lsiit.u-strasbg.fr/Software/BasilicPlus)

3.Pérennité

Le service MISI, en les personnes de Isabelle Guillet et Christian Séguy, assure le développement, la maintenance et l'exploitation.

4.J'ai vu des bugs, je fais des propositions...

Merci de les adresser à pistou.lig@imag.fr

5.C'est long ce chargement !

Pour chaque nouvelle notice, l'application calcule des clés et les compare avec les clés de toutes les autres publications de la base,. Jusqu'à trois algorithmes de comparaison sont appliqués. Mais vous pouvez laisser faire la machine en choisissant le traitement « différé »et revenir le lendemain.

Des mesures dans Figure 7, page 24 du rapport de stage.

6.Je ne sais plus ce que j'ai déjà chargé...

Après une session de chargement et le règlement des conflits vous pouvez retrouver dans « Mes dépôts » la liste des notices que vous avez insérées.

A noter que vous pouvez supprimer vos dépôts, sauf si d'autres déposants les ont également déposés (avant ou après vous )

7.Le fichier bibtex doit être encodé en quel format ?

Pistou traite correctement 3 encodages possibles de votre fichier : soit UTF-8, soit ISO-8859-1 , soit ASCII (avec codage de tout caractère accentué au format « TeX »).

Cependant il ne peut détecter les éventuels mélanges d'encodage dans la valeur d'un attribut.

Voici un exemple d'encodage ASCII :


@TECHREPORT{guillemin93,

AUTHOR = {F. Guillemin},

TITLE = { Un m\'{e}canisme de d\'{e}clencheurs dans un {SGBD} Orient\'{e} Objet. Le prototype {ELEN-2} : application a la documentation d'un logiciel},

TYPE = {M\'{e}moire d'ing\'{e}nieur {CNAM} en informatique - {MEM}018},

INSTITUTION = {LGI},

MONTH = {Septembre},

YEAR = {1993}

}


Voici un exemple d'encodage UTF-8 ou ISO-8859-1 :


@PHDTHESIS{mulhem93b,

AUTHOR = {Philippe Mulhem},

TITLE = {La Correspondance d'Objets dans la Recherche d'Informations : Une Expérimentation sur un SGBD OO},

SCHOOL = {Université Joseph Fourier, Grenoble},

YEAR = {1993},

KEYWORDS = {base de données, recherche d'informations, langage de requête, correspondance d'objets, logique modale.}

}



8.Quels attributs des notices sont conservés dans PISTOU ?

Les champs décrits ci-après sont ceux gérés par bibtex. Pour plus d'information, le mieux est de consulter une documentation bibtex ou latex.

author = {Berthier, Marie-Jeanne and Dupond, Paul}
Liste des auteurs séparés par "and". Pour chaque auteur son nom, une virgule puis son nom.

abstract = {texte décrivant le résumé...}

address = {Bénodet, France}
La ville de la maison d'édition ou de la conférence.

annote = {une annotation quelconque.}

booktitle = {78th International Conference on..}
Titre du "livre" qui inclut la référence. Pour une notice de type "Book" il faut utiliser le champ "Title" pour en décrire le titre.

chapter = {5}
Numéro de chapitre (ou de section).

edition = {Quinzième}
L'édition pour un livre. Ici, la 15e édition (quel succès !).

editor = {Berthier, Marie-Jeanne and Dupond, Paul}
Liste des personnes qui ont effectués l'édition.

howpublished = {Disponible sur demande à...}
S'applique généralement à des publications non standards.

institution = {Université Joseph Fourier}
Le nom de l'institution dont dépend la publication. S'applique en général aux rapports de recherche ou aux thèses

journal = {Le Canard enchaîné}
Nom de la revue ou du magazine dans lequel est apparaît la publication

lang = {néerlandais}
Langue dans laquelle est rédigée la publication

month = {January}

note = {une annotation quelconque.}

number = {199}
Numéro du magazine, d'une série. Dans certains cas vient avec "volume".

organization = {LIG}
Nom de l'organisme dont dépend la conférence ou qui publie le manuel

pages = {43--78}
pages = {78}

publisher{Elsevier}
Nom de la maison d'édition

school = {Université Joseph Fourier}
Spécifique au type "phdthesis", indique le nom de l'université.

title = {Alice au pays des merveilles}
Le titre de la publication

{url| pdf | ps }= {http://....}
Une adresse où est disponible le texte de la publication

doi = {10.1000/186}

Le Digital Object Identifier (http://www.doi.org/) du document

type = {....texte...}
Spécifique aux Rapports Techniques

volume = {5}
Le volume d'un journal. Voir aussi "number".

year = {1965}
L'année de publication.

Les champs ci-dessous ont été ajoutés afin de permettre les classifications habituelles nécessaires (les valeurs données sont celles affectées par défaut) :

x-proceedings = {yes}
Le texte est publié dans une conférence avec actes ("no" sinon)

x-editorial-board = {yes}
Le texte est publié dans une conférence/un journal avec comité de sélection ("no" sinon)

x-international-audience = {yes}
La conférence est d'audience internationale ("no" sinon)

x-invited-conference = {no}
L'article ne fait pas suite à une invitation ("yes" sinon).

x-scientific-popularization = {no}
La publication n'est pas un article de vulgarisation ("yes" sinon)

x-hdr = {yes}
La publication est un rapport de HDR ("no" sinon).

x_poster = {no}

x_short_communication = {no}

Deux champs complémentaires peuvent être indiqués :

x-pays = {GB,BR}
Permet d'indiquer des pays collaborateurs à la publication. Pour la codification, cf http://www.iso.org/iso/fr/english_country_names_and_code_elements

x-id-hal = {hal-123456789}
Identifiant de la notice dans l'archive HAL. Cet identifiant peut-être récupéré lors d'un export BibTeX à partir de HAL. Lors du dépôt, si deux publications ont le même identifiant, une fusion est tentée.

Les autres attributs spécifiés dans vos fichiers bibtex sont ignorés.


Si vous estimez que d'autres sont également importants, faites des propositions à pistou.lig@imag.fr

9.Et si mon nom d'usage est différent de mon nom d'auteur ?

Un alias entre 2 noms peut être mis en place entre 2 auteurs créés dans la base.

Via l'onglet « Administrer », sous-onglet Auteurs, créez éventuellement l'auteur sous son deuxième nom, puis éditez-le et indiquez son alias.

10.J'ai constaté des erreurs sur une liste de notices

Informez un membre de votre équipe qui a l'accès « déposant » sur PISTOU.

11.Qui peut obtenir un accès « déposant » ?

Tout membre du LIG en charge de la maintenance de listes de notices bibliographiques. L'ouverture de l'accès est à demander à pistou.lig@imag.fr.

Le login et mot de passe seront ceux du serveur LDAP du LIG ou du serveur LDAP INRIA.

12.Est-ce que je peux supprimer une notice de la base ?

Oui , si vous avez déposé cette notice et que vous êtes le seul à l'avoir déposée.

13.La clé de mon article n'est pas celle que j'avais saisie !

Il faut vous authentifier pour retrouver la clé que vous aviez saisie.

Lorsque 2 notices sont saisies par deux déposants différents, avec des clés différentes, elles sont déclarées en conflit, puis le déposant effectue la fusion des 2 notices.

Les clés fournies par chaque déposant sont conservées dans la base. Mais le système ne peut retrouver la vôtre que si vous vous êtes authentifié.

14.Quel est l'algorithme de comparaison entre 2 publications ?

Pour identifier les publications, nous utilisons la clé fournie par le déposant (comme bib2hal) ainsi que 2 clés spécifiques que nous avons spécialement créées (comme on aurait pu faire avec bibtool).

La première clé est faite sur les auteurs de la publication et l’autre sur le titre de la publication :

– La clé sur les auteurs se construit ainsi en prenant les premières lettres des noms des auteurs associés à la publication, en les mettant en majuscules puis en triant ces lettres par ordre alphabétique. On évite ainsi les situations, hélas courantes, où il y a eu une erreur lors de la saisie dans l’ordre des auteurs.

– La clé sur le titre est construite avec les premières lettres du champs titre en enlevant des mots trop communs tel que “of ”, “and”, “on” etc. Ces deux clés sont associées à une publication dans la base afin de pouvoir les utiliser pour l’identification et le dédoublonnage par la suite.

À partir de ces trois clés nous pouvons effectuer une recherche stricte sur les 2 clés générées ainsi que sur la clé du déposant. Ainsi, lors du dépôt d’une nouvelle publication, il est possible de chercher des publications potentiellement identiques. Si une seule telle publication est trouvée, une tentative de fusion est effectuée : s’il y

a uniquement des champs en plus dans la nouvelle publication et qu’aucun champs n’est en conflit, l’ancienne publication est simplement augmentée. Si la fusion n’est pas possible ou s’il y avait plusieurs publications potentiellement identiques, la nouvelle publication est marquée comme en conflit potentiel avec tous ces candidats.

15.Le classement du ministère

Les critères de classement sont décrits dans le document http://www.ifris.org/IMG/pdf/NoteMethodoBiblio.pdf . Il est réalisé en se basant sur les attributs :

x-proceedings

x-editorial-board

x-international-audience

x-invited-conference

x-scientific-popularization

x-hdr pour faire la distinction entre thèse et HDR.


16.Je ne connais pas bien bibtex

http://bibtexml.sourceforge.net/btxdoc.pdf (C'est une version corrigée de ce qui est dans le livre original de Lamport sur LaTeX.)

http://nwalsh.com/tex/texhelp/bibtx-4.html ; Description de la syntaxe d'un fichier .bib

17.Pas de commentaire en BibTeX

% est un marqueur de commentaire (La)TeX et pas BibTeX. L'outil bibtool qui est utilisé en interne pour reformater les entrées BibTeX de manière cohérente ne sait pas les traiter. 

Le plus simple est sans doute de d'ôter ces commentaires LaTeX avant de charger le fichier dans Pistou. Voici une ligne de commande qui supprime toute ligne commençant par '%' et fonctionne au moins sur un système Linux :

grep -v '^%' fichier_original.bib > fichier_pour_pistou.bib

18.Des doublons en pagaille !

Des clés identiques sur deux ou plusieurs notices provoquent la détection de doublons. Cela peut se produire dans des listes de notices exportées d'applications de gestion de notices comme EndNote par exemple.
  Voici  une ligne de commande en langage « perl » pour attribuer une clé différente à chaque publication (exemple avec une clé unique « CleUnique », qui sera remplacée par CleUnique1, CleUnique2, ...):



perl -e 'while(<>) { if(~/CleUnique,/) { $c++; s/CleUnique,/CleUnique$c,/}print; }' < fichier_original.bib > fichier_pour_pistou.bib

19.Les formats d'exportation particuliers

Bibtex latex: l'encodage est en ASCII, les caractères accentués et spéciaux sont exprimés suivant la convention « latex ».
  Bibtex UTF-8 :  l'encodage est en UTF-8
  Bibtex INRIA RA : Des champs non standards, spécifiques aux rapports d'activité de l'INRIA, sont inclus dans l'export. L'encodage est en ASCII, les caractères accentués et spéciaux sont exprimés suivant la convention « latex ».
  LaTeX: Archive (.zip) des fichiers nécessaires à la compilation en LaTeX
  PDF quadriennal: Comporte des clés spécifiques à la liste de publications demandée pour le dossier quadriennal.
  

20.Comment récupérer un id (d'auteur, d'équipe, de publication)

En mode « connecté » : aller dans l'onglet « Administrer », puis dans le sous-onglet correspondant à votre recherche (auteur, publication équipe). Rechercher l'auteur, l'équipe ou la publication via les champs de recherche.Dans le résultat de votre recherche, l'id s'affiche en tout début de ligne, juste avant le nom de l'auteur, de l'équipe ou de la publication.

En mode « non connecté », faites une recherche sur la page d'accueil, puis cliquez sur le nom de l'auteur ou de l'équipe désiré. L'id est indiqué à la fin de la zone "URL externe de la liste des publications".