Compte-rendu de la réunion du 15 janvier 2004
Réunion tenue au CNES
Prochaine réunion : le mardi 4 mai 2004 au siège du CNES à Paris
Informations générales
Événements passés, publications, initiatives…
- 18 novembre 2003 : atelier sur l'archivage des e-mail, organisé par Legato-Software - Thibaud Girard y a participé – peu de chose à signaler que nous ne connaissions déjà,
- 17-18 octobre 2003 : colloque à Florence (organisé par la présidence italienne de l'UE) sur la pérennisation des ressources numériques en Europe (participation de J. Poivre). La problématique concernait aussi bien les données nées numériques que les données issues de la numérisation. Le colloque a donné lieu à d'intéressants débats sur les questions d’organisation. Des exposés à caractère très pratique sur l’évaluation technique et sur l'évaluation des coûts des méthodes de conservation ont suscité également beaucoup d'intérêt. Des recommandations de la Commission seront prochainement rédigées. On peut espérer que l'archivage soit pris en compte dans ces recommandations.
- 11 décembre 2003 : Séminaire Aristote sur la bureautique et XML - Un compte rendu détaillé de ce séminaire a été rédigé par Françoise Banat-Berger. Ce compte-rendu est disponible dans le bulletin N°14 (janvier 2004) des Archives de France sur l'archivage long terme des documents électroniques. (http://www.archivesdefrance.culture.gouv.fr/fr/publications/index.html) On peut observer une évolution sensible de la politique de Microsoft en matière bureautique : une petite ouverture semble apparaître, la DTD de WordML (office 2003) a été publiée. La compétition avec la suite Open Office apparaît salutaire dans le contexte actuel.
- Publication : La mémoire de la société de l'information - publication de l'Unesco pour le Sommet mondial de la société de l'information (Auteurs Jean-Michel Rodes, Geneviève Piejut, Emmanuel Plas) - Août 2003,
- Diffusion au sein du groupe PIN de la version 5 du document ' Critères d'évaluation des formats de données au regard de leur aptitude à la pérennisation de l'information',
- Revue Document numérique : préparation du numéro spécial sur le thème 'archivage et pérennisation' Une vingtaine de propositions d'articles a été reçue. Le processus de sélection a été entrepris,
- Airbus nous a fait parvenir 2 présentations relatives à l'avancement du projet LOTAR (Long Term Archiving and Retrieval of digital Technical Product Documentation).
- Bibliographie : Deux articles et deux documents à signaler
- dans la revue i-stockage (http://www.i-stockage.com/index.php) un article appelé ‘au delà d’une norme, un système d’archivage légal’,
- dans le numéro du 9 janvier de 01 informatique un article intitulé ‘Record management’ consacré à l’archivage électronique.
- Recommandations techniques pour les programmes de création de contenus culturels numériques http://www.numerique.culture.fr/fr/eeurope/documents/guide_technique.pdf : Ce guide, en version de travail, définit un cadre technique commun pour les projets de numérisation en Europe. Elaboré dans le cadre du projet européen Minerva (Réseau Ministériel pour la Valorisation des Activités de Numérisation - Ministerial Network for Valorising Digitisation Activities), il aborde les différents aspects du cycle numérisation: de la préparation des documents originaux à la diffusion des ressources et aux questions de droits de propriété intellectuelle.
- Collaborer pour de nouveaux services culturels en ligne http://www.culture.gouv.fr/mrt/numerisation/fr/technique/documents/guide_oai.pdf : le protocole OAI / Muriel Foulonneau, Relais Culture Europe. Réalisé dans l'optique d'un portail européen des ressources culturelles numériques, ce document décrit le protocole de collecte de métadonnées de l'initiative des archives ouvertes (OAI-PMH), notamment à destination des établissements culturels. Il présente l'ensemble de la chaîne, depuis la création d'un entrepôt jusqu'à l'exploitation des données, afin d'exploiter au mieux les potentialités de ce protocole.
Ces deux documents ont été réalisés pour le compte de la mission de la recherche et de la technologie du ministère de la culture et de la communication, partenaire français du projet Minerva.
Événements à venir pour le dernier trimestre 2003
Séminaire organisé conjointement par Aristote et la BnF, le 22 avril 2004 sous la responsabilité de Julien Masanès. Il aura pour thème 'Internet : la mémoire courte ? '
Le texte de présentation du séminaire est le suivant :
Internet est aujourd’hui devenu le principal espace de publication et d’échange d’information. Le volume d’information publié sur le Web dépasse depuis plusieurs années celui de l’ensemble des livres et périodiques publiés. Dans les entreprises, dans la recherche, Internet sert de plate-forme aux échanges et de principale mode d’accès à l’information. Cette situation nouvelle pose de manière aiguë le problème de la conservation et de la mémoire dans un environnement où aucune trace ne subsiste au-delà de la durée de vie active de l’information (c’est-à-dire jusqu’à effacement des serveurs). Si des siècles de pratique ont permis de définir des outils et des méthodes pour la constitution d’archives des supports traditionnels de l’information, l’utilisation massive des réseaux et des systèmes d’information ouverts oblige à les repenser, les redéfinir, voire pour certains aspects à inventer de nouvelles pratiques d’archivage. Ce séminaire tentera de faire le point sur le domaine émergent de l’archivage d’Internet, conçu à la fois comme espace de publication et comme espace de convergence de systèmes d’information hétérogènes.
Colloque de l'Agence Spatiale Européenne à Frascati (près de Rome) : “Ensuring the Long-Term Preservation and Adding Value to the Scientific and Technical Data”.
5 - 7 October 2004 Participation : 200 Euros
Texte de l'annonce :
Value to the Scientific and Technical Data”, organized in 2002 and hosted by CNES in Toulouse, France, the second event will be hosted by the European Space Agency in its ESRIN centre located in Frascati, Italy, from 5 to 7 October 2004. Important issues that have shown an evolution during the last years, and in some cases still require answers, span from storage technologies, to archive information systems architectures, to standards applied in information systems, to security in order to protect data from unintentional damage or intentional systems hackering, to data exchange among different archives. These issues are of great interest in different disciplines, ranging from Space Data to Experimental Physics to Industry Technical Data. The theme of the Symposium in 2004 will be “From Preservation to Access”, with emphasis on the extraction and utilization of the information contained in the data preserved for the long-term. The user point of view and the techniques available today to ensure a proper preservation and utilization of information by future generations is the main focus. The provision of the right information at the right moment to the proper person, through added-value data and services, will be the main concept that the programme committee would like to be explored by presenters.
MAIN TOPICS
- Technology and Standards
- Added-value services
- Users expectations
- Lessons learnt
- Future prospects
PRESENTATIONS
L'informatisation du 'livre foncier' en Alsace- Moselle
Présentation par F. Banat-Berger (DAF)
Le projet AMALFI d'informatisation du livre foncier en Alsace-Moselle est en cours de réalisation avec un budget de 60 Millions d'Euros. Il est tout à fait remarquable notamment au niveau des procédures de signature et de sécurité mises en œuvre pour garantir l'authenticité des documents.
Ce projet de dématérialisation, de par les moyens considérables mis en œuvre, est à mettre en parallèle avec le projet de dématérialisation du Journal Officiel réalisé avec des moyens extrêmement faibles.
L'ouvrage d'Isabelle Boydens "Informatique, normes et temps"
Il s'agit d'un résumé de lecture de l'excellent livre 'Informatique, norme et temps' d'Isabelle Boydens. Ce résumé de lecture a été préparé et présenté M. A. Chabin (Archive 17).
Open Archive Initiative
Laurent Duplouy, Sara Aubry (BnF) Présentation très instructive des origines d'OAI, du protocole mis en œuvre et d'exemples d'applications relatifs notamment à la diffusion d'articles scientifiques dans le contexte des 'archives ouvertes'.
Le manuel pratique d'archivage de la bureautique
J. Poivre a présenté le manuel pratique d'archivage de la bureautique qui est à présent achevé. Le manuel sera publié en mars prochain par la Documentation Française. Il sera tiré à 2500 exemplaires et diffusé gratuitement à l'ensemble des archives départementales.
L'étape de travail suivante sera consacrée à l'archivage du Web, travail qui sera conduit en collaboration avec la BnF. Le plan gouvernemental PSAE (Plan Stratégique pour l'Administration Electronique) doit faire l'objet en février prochain d'un comité interministériel dédié. Un chantier sur l'archivage électronique est envisagé à cette occasion. Voir sur ce point le bulletin des Archives de France sur l'archivage long terme des documents électroniques, N°14, janvier 2004. (http://www.archivesdefrance.culture.gouv.fr/fr/publications/index.html)
Gestion des videos dans une base de données XML XediX
Pierre Brochard et Didier Courtaud. Présentation d’une base de données XediX XML native : cinq secondes pour retrouver un document dans une base de données native XML de 1 téraoctets. Des annonces dans la presse ont été faites fin 2003 sur cette base de données.
Plusieurs besoins sont pris en comptes :
- Besoin de conservation de connaissances, fond très hétérogène, beaucoup de vidéo,
- Besoin de lier le document source et le document électronique en XML,
- Besoin de gérer des documents multimédia,
- Assurer la pérennité du fonds documentaire,
- Besoin d’accès à la granularité la plus fine.
L'architecture de la base a été présentée. Démonstration de la recherche et de l’accès à une certaine séquence de vidéo. La base orientée document et données - opérateurs existants dans la base – La base prend en compte les DTD mais pas les schémas XML. Les auteurs considèrent en effet qu'il appartient à l'application et non à la base de données, d'utiliser des types.
Le site Web du groupe PIN - comment en faire un outil plus efficace
Un débat sur une meilleure utilisation du serveur du groupe PIN a été engagé. Plusieurs points ont été abordés :
- La structure du site, avec les comptes-rendus de réunions, est à vocation interne alors que la matière qui s'y trouve pourrait être beaucoup mieux valorisée,
- Une présentation par thème devrait permettre de retrouver directement les diverses interventions,faites dans le cadre du groupe PIN,
- Les présentations devraient pouvoir disposer d'une adresse propre et pérenne.
Plusieurs actions ont été décidées :
- Identifier un ensemble de thèmes à partir desquels les présentations disponibles seront accessibles (J. Masanès)
- Modifier le serveur de façon à ce que les adresses des pages puissent être mémorisées (C. Huc)
- Améliorer le look (C. Huc)
En outre, un appel à volontaire a été lancé pour maintenir à jour une page de références normatives et bibliographiques.
Journées de formation sur la pérennisation des données numériques
Débat autour de l'organisation par le groupe PIN de journées de formation sur l'archivage long terme de l'information sous forme numérique. J. Masanès a présenté le retour d'expérience d'un stage de formation co-organisé par l'ENSSIB et la BnF sur le thème 'préserver les documents numériques' pour une quinzaine de stagiaires environ (essentiellement des conservateurs et des bibliothécaires) et dans lequel la recherche d'une unité pédagogique a été facilitée par le nombre réduit d'intervenants. Les aspects juridiques n’ont pas été traités – les stagiaires l’on regretté. L'appréciation des participants a été très positive en grande partie du fait du choix de la cohérence qui s'est révélé payant.
En ce qui concerne le projet du groupe PIN, on peut noter les points suivants :
- La période visée est le premier trimestre 2005 afin que ces journées de formation puissent être prises en compte dans les plans de formation des organismes,
- Le format peut être de 3 ou de 5 jours suivant l'orientation qui sera retenue,
- La cohérence pédagogique globale est un point fort et indispensable,
- Il est possible de viser à la fois un public d'archivistes, documentalistes et d'informaticiens et de trouver un langage compris par tous. Ceci n'empêche pas de prévoir pour une partie du stage, des sous-ensembles dédiés aux profils informaticiens et aux profils archivistes/documentalistes,
- L'objectif devrait être de faire comprendre la problématique dans son ensemble et de présenter des solutions pour les cas simples (aspects organisation, normes, méthodes, procédures, solutions techniques…). Il ne doit pas aborder les questions qui relèvent encore de la recherche,
- Aristote est habilité à organiser des formations et dispose d'une bonne expérience en matière d'organisation de conférences, de séminaires et de logistique associée,
- La promotion d'un tel stage être faite par Aristote. Le CNED et le CNAM peuvent également être d'un bon support,
- Un comité de programme est mis en place afin de définir le projet en termes d'objectifs, de programme et de logistique (D. Courtaud, J. Masanes, J. Poivre, F. Banat-Berger, M-A. Chabin, C. Huc, D. Vidart-Durfort).
Préparation de la prochaine réunion
Les sujets suivants ont été envisagés pour la prochaine réunion :
- Présentation de la DTD EAD : description, mise en œuvre pratique (ce point sera préparé sous la responsabilité de F. Banat-Berger),
- Présentation de l'avancement du travail normatif relatif aux métadonnées du Records Management (G. Drouhet),
- L'émulation comme stratégie de préservation - Problématique et études en cours à la BnF
- La stratégie de stockage proposée par Active-Circle (correspondant Stéphane Kraxner).
Autres domaines pour le futur :
- l'archivage de l'état civil à Paris,
- démo office 2003, Open-office par rapport à la pérennisation ?
Date de la prochaine réunion : Mardi 4 mai 2004 au CNES Paris