Ceci est une ancienne révision du document !


Compte-rendu de la réunion du 24 septembre 2002

Réunion tenue au CEA

Prochaine réunion : Le mercredi 15 janvier 2003 au siège du CNES à Paris

Informations générales - événements passés et à venir

  • Salon IDT/Net à Paris en juin dernier. Session de conférences dédiée à la pérennisation de l'information numérique. 4 interventions
    • Didier Courtaud : Quelques réflexions sur la mise en place d'une chaîne informatique de pérennisation
    • Valérie Sédaillan : Archivage électronique : aspects juridiques - voir site Web
    • Claude Huc : la pérennisation et valorisation des informations scientifiques
    • Catherine Lupovici : Pérennisation des bibliothèques numériques (périodiques numériques, patrimoine, dépôt légal des sites Web, …)
  • Conférence européenne sur les bibliothèques numériques à Rome (semaine du 16/9/2002) incluant plusieurs ateliers de travail dont un consacré à l'archivage du Web. Deux pistes de coopérations internationales sur le sujet : l'une aux États-Unis, l'autre dans le cadre du dépôt de projet de recherche européen. Julien Masanès a participé à cette conférence,
  • Emergence du protocole OAI (Open Archive Initiative) d'interopérabilité pour les publications et le domaine documentaire - Possibilité d'une présentation future de ce standard dans une prochaine réunion PIN,
  • Le projet pilote BnF-DAF sur l'archivage des sites Web a démarré,
  • 5-6-7 novembre 2002 : colloque International CNES sur le thème 'Pérennisation et Valorisation des Informations Scientifiques et Techniques' http://www.cnes.fr/pvdst
  • Projet Interpares 2 : http://www.interpares.org/
    • International Research on Permanent Authentic Records in Electronic Systems
    • Démarrage de la seconde phase du projet : 2002-2006
  • Normalisation ISO de l'OAIS : ISO/DIS 14721.2 Space data and information transfer systems – Open Archival Information System Reference Model
  • Normalisation ISO de l'AP232 - voir la possibilité d'en parler au sein du groupe - point de contact sur ce sujet : JC. Benech

Erpanet : Electronic Resource Preservation and Access Network -

PRESENTATIONS

Projet de constitution d'une base d'information sur les formats de représentation de l'information

Accès à la présentation de C. Huc sur le sujet http://www.aristote.asso.fr/PIN/presentations/2002/formats_representation.pdf

La discussion a permis de dégager les points suivants :

  • Un intérêt certain se manifeste sur le sujet, d'autant qu'un partage du travail au sein des institutions participant au groupe PIN devrait permettre d'aboutir à un résultat qu'aucune de ces institutions ne peut atteindre seule,
  • J. Masanès juge ce travail très important, il indique que 800 formats de documents ont été recensé sur le Web. Ce type de travail peut aussi contribuer à inciter les éditeurs de logiciels à publier leurs formats.
  • Les règles permettant de caractériser les formats de données pérennes doivent, dans ce cadre être précisées,
  • L'objectif a un intérêt international, il serait donc souhaitable de disposer à terme d'un relais international sur le sujet. Ce point est d'autant plus important qu'un tel projet n'a de véritable utilité que si la base d'information est vivante et à jour. Le démarrage du travail au sein du groupe PIN apparaît néanmoins comme le meilleur moyen de le rendre ultérieurement crédible dans un cadre international.
  • Le projet est vivement soutenu par Didier Courtaud en temps que président d'Aristote. Il précise que des documents utiles à cet objectif (CEA, Université d'Evry…) pourront utilement être mis à disposition du groupe.
  • Ce projet rejoint par ailleurs l'idée de définir et de mettre en place à terme un programme de formation ou d'enseignement sur la pérennité des informations numériques.
  • Un appel à participation sera lancé par C. Huc dans le cadre du groupe PIN

Archivage sur CD : Quelles pistes ? Le choix de la BnF (Laurent Duplouy - Jacques Lafosse)

Accès à la présentation de L. Duplouy et de J. Lafosse sur le sujet http://www.aristote.asso.fr/PIN/presentations/2002/cd_choix_bnf/index.htm

Cette présentation a permis d'expliquer de façon claire le choix de la BnF d'utiliser le Century Disc et ce qui a conduit à ce choix.

L'ensemble des éléments de la problématique de la pérennité physique de l'information a été analysé dans ce cadre : pérennité des médias, moyens de contrôler leur état, fréquence et coût des recopies, pérennité de la technologie…

L'archivage sur Century Disc à la BnF ne concerne que certaines catégories de documents. Pour ces documents, il constitue la référence patrimoniale sachant que l'accès par les utilisateurs à ces mêmes documents est effectué sur un système séparé qui dispose de copies des documents archivés.

Le retour d'expérience du CEA sur la veille technologique autour de XML (Denis Malavielle)

Accès à la présentation de D. Malavielle sur le sujet http://www.aristote.asso.fr/PIN/presentations/2002/xml_experience_cea.pdf

Dans le but d’intégrer l’usage de XML dans le système d’information de l’entreprise, un certain nombre de pré requis techniques et organisationnels sont nécessaires. La Direction des Technologies de l'Information (DTI) du CEA réalise une veille technologique sur ce thème, afin d'identifier et de positionner les outils, les normes, les principes d'architectures et les meilleurs pratiques.

Dans ce contexte, D. Malavielle a présenté les premiers retour d'expérience de cette veille concernant les outils d'édition :

  • Quels usages pour XML
  • L'impact de l'approche XML sur les éditeurs
  • Positionnement d'un éditeur dans le système d'information
  • Les catégories d'éditeurs
  • Comparatif des outils étudiés et utilisés à la DTI
  • Démonstration des principes fonctionnels actuellement privilégiés :
    • Boîte à outil pour le spécialiste : XML Spy
    • Edition graphique : Epic et XML Spy
    • Edition graphique par une application Web via un navigateur :
      • Xopus
      • Prototype DTI en environnement J2EE

L'objectif de la veille est de préparer le terrain pour déployer XML au CEA.

L'exposé a été suivi d'une discussion animée et de nombreuses questions.

A noter les possibilités nouvelles et très intéressantes de génération automatique du code XSLT (XML Spy par exemple).

Les outils de saisie de documents XML construits en intégrant l'environnement Word fonctionnent (c'est le cas de I4/text) mais ils devront être adaptés de façon constante aux évolutions de Word avec un coût et un temps de retard important.

La question des tableurs (documents Excel en particulier) ne paraît pas résolue de façon évidente par XML.

La question du suivi des évolutions et des versions des documents relève en pratique de la GED et non pas des outils de saisie des documents.

Groupe SAPIN

Travail en cours : complément au manuel pratique portant sur les documents bureautiques (incluant la messagerie).

L'objectif est de finir fin 2002.

En ce qui concerne la typologie des formats de document utilisés et les méthodes à proposer, il n'est pas facile de faire la synthèse des points de vue des membres du groupe.

Dernier point : accompagner le document d'une petite bibliographie.

Le document sera enrichi avec des retours d'expérience de travaux au ministère de la justice.

L'étape suivante sera consacrée au retour d'expérience sur l'archivage des sites internets.

Variations du vocabulaire autour des concepts majeurs de l'archivage

Une première discussion sur les différentes terminologies utilisées pour désigner les mêmes concepts dans le domaine de l'archivage a été animée par M.A. Chabin et C. Huc.

Les bases documentaires principales pour une telle discussion sont notamment : la terminologie du Modèle de Référence OAIS, la terminologie de la norme 'Records Management', le glossaire défini par le groupe de terminologie du Conseil International des Archives' , la terminologie utilisée dans le ‘Model requirements for the management of electronic records’ préparé pour le programme IDA de la Commission Européenne.

La discussion a permis de conclure à une équivalence (relative) entre :

  • L'objet d'information défini par le modèle OAIS (incluant l'objet de données et son information de représentation) et le 'document d'archives' ou encore le 'Records'.

La discussion portant sur le modèle d'organisation de l'information (modèle structuré et hiérarchique) sera poursuivie à la prochaine réunion.

 
public/reunion_pleniere/cr/cr_20020924.1269448648.txt.gz · Dernière modification: 2010/11/09 10:09 (édition externe)     Haut de page
Recent changes RSS feed Creative Commons License Donate Powered by PHP Valid XHTML 1.0 Valid CSS Driven by DokuWiki Design by Chirripó