Compte-rendu de la réunion du 13 janvier 2009
Réunion tenue au CNES
Prochaine réunion 12 mai 2009
INFORMATIONS GENERALES
Réunion tenue au CNES, 45 participants.
Tour de table, présentation de l'ordre du jour.
Evènement passés
- L. Duplouy : Démarrage des travaux sur le schéma national numérique. Un rapport, contenant l'avenir des bibliothèques numériques, sera à livrer au ministre de la culture pour juin 2009. Les travaux sont actuellement répartis en plusieurs sous groupes. L'un d'entre eux est consacré à la préservation numérique ; il est co-piloté par BnF et CINES (normes, bonnes pratiques, maîtrise des coûts).
- 28/29 septembre 2008 : à Londres Conférence IPRES (Fifth International Conference on the Preservation of Digital Objects - British Library conference center) : Présentation de la nouvelle version de JHOVE2 (identification, caractérisation de formats de fichiers). Dans cette nouvelle version, un fichier peut contenir plusieurs formats de données, ce qui n'était pas le cas de JHOVE1. Par contre, en raison de restrictions budgétaires, il y a moins de formats pris en compte dans la nouvelle version que dans JHOVE1.
- C. Huc: il y a absolument nécessité d'une collaboration internationale sur les formats.
- Début novembre 2008 à Budapest : conférence internationale organisée par l'Alliance for a permanent access to the record of science (http://www.alliancepermanentaccess.eu/). cette initiative a le soutien de la Commission européenne. La conférence était consacrée au modèle économique de l'archivage numérique : Comment maitriser les coûts avec une volumétrie croissante et une technologie instable ? Il en ressort une orientation vers une mutualisation systématique des logiciels, des infrastructures de stockage, etc.
- 28-30 octobre 2008, Nice : 3ème conférence des projets de recherche européens dédiés à la préservation de l'information (Planets, DPE et Caspar) http://www.wepreserve.eu/events/nice-2008/
- CASPAR : Bibliothèque d' information de représentation en ligne : référence les spécifications des formats de fichiers, bibliothèque en cours d'évaluation au CINES.
- Projet PLANETS : Fin des financements ⇒ quid de l'avenir d'outils comme PLATO (présenté à PIN en septembre 2008)
- Norme française NF Z 42 013 : le projet en cours a finalement été approuvé quelques semaines après la réunion PIN.
- Colloque d'octobre 2007 sur les archives numériques d'architectes : Publication en novembre 2008 d'un très bon ouvrage : « Architecture et archives numériques » (http://www.citechaillot.fr/ouvrage/actes_de_colloques__conferences.php?id=176)
- Décembre 2008, Toulouse - conférence du DLM forum (conférence qui se tient tous les 3 ans), 3 jours. Organisé par la DAF en partenariat avec les archivistes français.
- Environ 400 participants, public et privé (moitié/moitié), français étrangers (moitié/moitié).
- Ateliers de présentation de Moreq2 (prise en charge de la traduction française par MA Chabin), introduction d'un chapitre 0 permettant d'inclure les spécificités nationales. Ce chapitre zéro contient aussi des exemples d'application.
- Présentation du concept du RM en France, articulation des grandes familles de normes autour de la norme sur le Records management (ISO 15489) et le modèle OAIS.
- De nombreux autres thèmes ont été abordés : problématique de transfert d'archive (Estonie, Finlande, Pays bas, Danemark, RU, France), les normes (recouvrement des normes), la certification (Danois, Estonie), la planification de la préservation (SPAR et gestion des risques), présentation de plates formes et cas concrets, messages électroniques, formats (PDFA), supports, …
- les actes sont en cours de publication sur le site de la DAF.
- la version française de Moreq2 est également en ligne sur le site de la DAF : http://www.archivesdefrance.culture.gouv.fr/gerer/publications/manuels/#moreq2.
- Une seconde étude du Laboratoire national d'essais (LNE) sur CD-R et DVD-R a été publiée sur le site de la DAF. (http://www.archivesdefrance.culture.gouv.fr/gerer/archives-electroniques/stockage/). Jean-Marc Fontaine a indiqué l'existence d'études sur les disques durs, domaine dans le quel il y a beaucoup à faire et beaucoup d'incertitude. Peu d'information disponible et peu de connaissance sur la fiabilité de ces supports.
Evènement à venir
- 5 février : journée organisée par le LNE sur le support optique.
- Information de Françoise Banat-Berger : Mutualisation et modèle économique, deux initiatives et projets en cours :
- le GIP e-bourgogne (https://www.e-bourgogne.fr/) qui offre des services de dématérialisation, et une fonctionnalité archivage,
- Groupe de travail lancé par l'Adullact (http://www.adullact.org/) : l'Adullact est une association qui promeut l'utilisation d'outils libres dans le secteur public. ). Mise en place d'un groupe de travail sur l'archivage numérique. L'objectif est la définition des contours techniques et fonctionnels d'une application d'archivage à force probante publiée sous licence libre.
- Formation organisée par le groupe PIN : 4 jours du 29/9/2009 au 2/10/2009 avec l'INP (voir le site de PIN, rubrique actualités)
Fonctionnement et avenir du Groupe PIN
C. Huc qui anime le groupe depuis sa création va se retirer progressivement. La pérennité du groupe PIN semble encore importante pour nombre de participants, d'ou la nécessité d'organiser cette pérennité.
Dans ce but, il est proposé la constitution d'un comité d'animation qui se partagera les différentes tâches de fonctionnement du groupe.
Un message sera envoyé pour un recueil des besoins sur les thèmes à aborder.
Cursus de formation de longue durée
Présentation Charlotte Fabre et Didier Courtaud.
Il s'agirait d'une formation initiale de niveau master en 2 ans (environ 250 / 300 h) ou un mastère spécialisé – de 2 semestres à 2 ans- (environ 350 h).
Des contacts sont en cours avec l'école Centrale pour cette opération.
Le projet pilote de mutualisation de l'archivage des données orales
Présentation C. Huc, O. Rouchon, M. Jacobson
Partie C. Huc : Le projet
TGE = Très Grand Equipement (grandes infrastructures de la recherche)
ADONIS = Accès Unifié aux Données et documents numériques des sciences humaines et sociales. (SHS).
CRN =Centre de Ressource Numérique dont le CRDO = Centre de Ressources pour la description de l'oral.
Le projet pilote vise à apporter une solution à l'archivage long terme des données orales avec en perspective, l'archivage des autres données relevant des sciences humaines et sociales.
Pourquoi mutualiser ? Réduire les coûts, rassembler les moyens de stockage et d'accès, disposer de compétences de haut niveau aux bons endroits (concentration).
Partie M. Jacobson : Le CRDO
Présentation du pôle parisien du CRDO et des caractéristiques principales des données orales et des annotations associées à ces données.
Audio : format = WAV, codage = PCM, fréquence >=44.1 kH, taille échantillon >= 16 bits.
L'usage de la Vidéo tend à se développer.
Annotations :
Format XML, encodage = UTF-8
Format FPEG (scans de manuscrits)
Métadonnées : format XML, encodage UTF-8, schémas d'OLAC.
Le CRDO assure une fonction de pré-ingestion : interface avec les producteurs
- Collecte des enregistrements et des annotations scientifiques auprès des producteurs
- Validation des formats de données et de métadonnées avant versement au CINES
- Fourniture aux producteurs d'outils, de recommandations normatives pour la constitution des données et des métadonnées.
Partie O. Rouchon : le rôle du CINES
Interface de la plate forme d'archivage avec des outils de validation (Jhove, Imagemagik, Droid –à venir, …).
Les principes de fonctionnement : transfert, stockage, accès correspondent à eux déjà en place pour l'archivage des thèses
Les formats pris en charge :
- Texte : html, pdf, txt, XML
- Image : gif , jpeg, tiff, png, svg
- Son : wav, AIFF, OGG, AAC
- Vidéo : mJPEG2000, MPEG4, OGG
Nouveaux besoins pour le projet pilote :
- Possibilité de lier des archives entre elles : par ajout de métadonnées génériques pour lier les SIP entre eux (relations entres objets),
- Mise à jour de métadonnées sans retransférer l'objet complet : mise en place d'une transaction de mise à jour de SIP (verser les métadonnées descriptives au format Dublin Core/OLAC),
- Transmettre des infos destinées à la diffusion (transmission d'un paquet sans connaître son contenu).
Utilisations pratiques de la cryptographie
Exposé très pédagogiques des applications de la cryptographie : 1. confidentialité, 2. intégrité, 3. authentification.
On utilise la cryptographie pour créer des signatures électroniques.
Cryptographie à clé secrète : algorithme le plus utilisé : AES (avec des clés assez longues).
Cryptographie à clé publique. : Algorithme le plus utilisé : RSA.
Technique réellement utilisée en pratique : méthode hybride.
Fonctions de hachage = Condensat = haché = empreinte (ex md5 = haché). MD5 est le plus utilisé (SHA-1 très connu aussi).
Pour éviter les attaques « man in the middle », il faut parler de certificat et non de clé (notion qui lie une clé publique à son propriétaire).
Certificat = quelque chose signée par une autorité.
CRL = Certificate Revocation Lists.
La signature d'un document correspond à son empreinte chiffrée.
Un service d'archive qui reçoit un document signé dispose d'une garantie d'intégrité et de provenance sur le moment. La difficulté arrive sur le temps (si modification de format par exemple).
Archivage a valeur probante et pérennité des signatures
Présentation de Julien Montagne (DICTAO).
www.validao.com ⇒ validation de la signature fournie par la DGI pour les impôts.
- Une signature a une durée de vie (= durée de vie du certificat)
- Il faut utiliser donc un horodatage (= via un tiers qui envoie une signature d'heure, cet horodatage a une période de validité avec un jeton-certificat d'horodatage,
- Il est nécessaire de recommencer l'opération quand le certificat est révoqué.
L'autorité de certification rencontre la personne physiquement (il n'est pas possible de se faire passer pour quelqu'un d'autre dans ce cas).
Thème de la prochaine réunion
Les supports de stockage (supports optiques, magnétiques, disques durs…) et les stratégies de stockage :
- Etudes effectuées et accessibles sur Google pour disques, mais carence coté bandes magnétiques et disques durs.
- Informations statistiques sur ce qu'on observe en particulier sur les bandes magnétiques (via le CNES et autres sites ?). Bandes gardées environ 7 ans, ce qui correspond à la période de renouvellement de techno
- Stratégies et virtualisation du stockage : SPAR et autres cas
Thème des réunions futures
- Formats : PDF, PNG, …, comment s'intégrer dans un travail global
- Présentation et démonstration de l'utilisation des moteurs sémantiques dans le cadre de la mémoire d'entreprise (Mario Delail, CNES),
- Les formats, les profils d'utilisation et les outils de contrôle et validation (TIFF ?) - prévoir une journée complète et inviter des éditeurs de logiciels de validation,
- Les retours d'expérience, état d'avancement des réflexions, des projets dans les institutions publiques et privées,
- L'émergence de produit du marché,
- Les critères de certification.
Date de la prochaine réunion
Mardi 12 mai 2009 au CNES.