Compte-rendu de la réunion du 15 janvier 2008

INFORMATIONS GENERALES

Réunion tenue au CNES, 49 participants.

Tour de table, présentation de l'ordre du jour.

Prochaine réunion : lundi 19 mai au CNES

EVENEMENTS PASSES

Octobre 2007, CCSDS : réunion internationale début octobre en Allemagne : 4 sujets discutés

  • la mise à jour du Modèle OAIS - travail actuellement en cours, un wiki (espace collaboratif) a été mis en place,
  • la finalisation du standard d'empaquetage XFDU (devrait être approuvé en début d'année 2008),
  • les travaux sur le projet PAIS (Producer Archive Interface Specification),
  • le démarrage officiel du groupe de travail sur la standardisation de la certification des Archives.

Octobre 2007, Conférence internationale : Ensuring Long-term Preservation and Value Adding to Scientific and Technical Data – PV 2007

Deux interventions de membres du groupe PIN. Tous les articles et toutes les présentations sont en ligne.

8 au 10 novembre 2007 : colloque européen à Paris “Architecture et archives numériques” - http://archivesarchitecture.gaudi-programme.eu/index.php?r=40 : Françoise Banat-Berger est intervenue dans le cadre de la première inaugurale. Les actes ne sont pas encore en ligne sur le site.

20 au 23 novembre, journées réseau (JRES) à Strasbourg (http://www.jres.org/). Interventions sur l'archivage pérenne d'Emmanuelle Bermès (identifiants) et d'Olivier Rouchon (la PAC du CINES). Articles, présentations et enregistrements vidéo disponibles en ligne.

M.A. Chabin annonce la création du CR2PA (Club des Responsables de Politiques et Projets d'Archivage). Voir page d'accueil de l’Extranet sur www.itiforums.com/extranet/cr2pa/. La prochaine réunion est prévue le 6 février, 14h-16h30 à la SNCF (45, rue de Londres, 75008 Paris) - Thème traité : « Business case pour une politique d'archivage globale » par Henri Zuber.

Le Guide “Apprivoiser Moreq pour archiver et conserver l'information” proposé par le groupe de travail MoReq de l'association Ialta-France est accessible librement sur trois sites suivants :

http://www.fntc.org/articles/article.php3?id_article=346 http://ec.europa.eu/transparency/archival_policy/moreq/index_fr.htm http://www.archive17.fr/content/view/15/33/

Moreq2 (Olivier de Solan) : le projet de Moreq2 vise à prendre la suite de Moreq - la commission européenne et le DLM forum ont ressenti le besoin de mettre à jour le document. Quelques grandes nouveautés : la mise à disposition de procédures de test pour les logiciels. En ligne de mire, une procédure commune au niveau européen. Moreq2 devrait être publié en avril 2008.

UN/ CE FACT : Normalisation du protocole d'échange. Lancement d'un appel à commentaire. Le standard d'échange défini par la DAF et la DGME a été repris au niveau international par un groupe de travail sous l'égide de l'UN/ CE FACT. L'objectif est de disposer d'un document normalisé en juin. Le projet est également soutenu par le document également soutenu par le Conseil International de Archives (CIA) et devrait pouvoir être présenté au congrès du CIA en juillet 2008.

Projets :

  • Nouvelles de PILAE (DAF/DGME) (F. Banat-Berger) : la recette s'achèvera fin avril (beaucoup de fonctions à développer autour du noyau de base que constitue le coffre fort électronique, notamment pour la conversion de formats à l'entrée, dont la conversion vers PDF/A). Juin-Juillet pour une utilisation réelle et une Vérification en Service Régulier d'ici fin 2008).
  • Nouvelles de SPAR (BnF) (Laurent Duplouy) : le marché vient d'être notifié à ATOS.
  • Nouvelles de la PAC du CINES : la version 1 de PAC est opérationnelle depuis 3 mois. Notification à SUN pour le développement de la PAC 2.0 basé sur ARCSYS. Il est prévu qu'elle soit opérationnelle à la fin du printemps.

Normalisation de PDF 1.7: actuellement dans le circuit de l'ISO, l'AFNOR a semble t'il émis un avis défavorable .

EVENEMENTS A VENIR

15 janvier 2008 : ADIJ (Association pour le développement de l'information juridique) : conférence sur le thème de «l’archivage du courrier électronique : approche pratique et juridique». Pour plus d'information sur l'ADIJ, voir http://www.adij.fr/.

16 et 17 janvier 2008 : deux journées de séminaires organisées dans le cadre d'Aristote par Patrick Murzeau (DGI/MINEFI) et Jean-Luc Archimbaud (CNRS-UREC), autour de l'Open Source et des Logiciels libres. Lieu : ENSAM, 151, Bd de l'Hopital, 75013 paris, grand Amphi. Voir http://www.aristote.asso.fr/.

Formation PIN-Aristote : dates à fixer (pas de formation organisée par l'INP cette année).

Fin juillet, congrès international des archives - Bruno Delmas a suggéré une intervention au nom du groupe PIN.

Décembre 2008 : Paris - conférence du DLM forum (conférence qui se tient tous les 3 ans) 3 jours.

NOUVELLES D'ARISTOTE

Modifications du mode de fonctionnement des groupes de travail :

  • la gouvernance d'Aristote reste de la responsabilité des organismes membres d'Aristote (les membres de l'association sont des personnes morales),
  • la décision de créer un groupe de travail au sein de l'association sera soumise au Comité Directeur,
  • les groupes de travail devraient être ouverts à tous, l'inscription sera gratuite, elle devrait être soumise à l'approbation par les adhérents d'une charte impliquant notamment un respect très strict de la neutralité,
  • pour le groupe PIN, l'ouverture était en partie un état de fait pour tout le secteur public. La participation du privé va élargir le groupe. Les échanges peuvent être fructueux entre les organismes et entreprises qui ont à résoudre un problème d'archivage numérique et ceux qui proposent des solutions libres ou commerciales. L'exigence de neutralité reste fondamentale,
  • sachant qu'il n'est pas possible de fonctionner avec un format de réunion au delà de 40 personnes, le groupe va modifier son mode de fonctionnement :
    • un maintien de 3 réunions plénières par an mais avec un format de conférence et non plus de réunion, même s'il s'agit de conférence sans caractère formel,
    • des sous-groupes de travail de taille plus réduite, dédiés à tel ou tel aspect de la problématique : les formats, la formation, le cursus de formation de longue durée, etc.

SEMINAIRE ARISTOTE ORGANISE PAR LE GROUPE PIN EN AVRIL 2008

Ce séminaire aura lieu le 10 avril à l'école polytechnique.

Il aura pour titre : la pérennisation de l'information numérique : les changements spectaculaires du paysage national et du contexte européen.

Voir le résumé sur http://www.aristote.asso.fr/sem/cycleencours.html.

Un certain nombre de services d'archivage numérique développés dans les institutions publiques et dans les entreprises privées devraient pouvoir être présentés à ce séminaire.

Un état des lieux des projets européens sera également présenté.

C. Huc coordonne sa préparation avec l'aide d'un petit groupe rassemblant la DAF, la BnF, le CINES et Archive 17.

F. Banat-Berger à proposé la participation d'un tiers archiveur à ce séminaire. Une présentation du nouveau paysage normatif parait également indispensable.

CURSUS DE FORMATION LONGUE DUREE

Il y a un besoin évident de mettre en place des cursus de formation de longue durée sur la question de l'archivage numérique mais en incluant également le processus de création des documents puis les différentes étapes de la vie des documents. Ces cursus peuvent se mettre en place dans diverses écoles ou universités mais cet aspect n'est pas du ressort de PIN. Par contre, le groupe PIN rassemble un ensemble suffisamment complet et diversifié de compétence pour pouvoir contribuer à l'élaboration d'un contenu pour un tel cursus. Un sous-groupe sera donc constitué à cet effet. Un certain nombre de membres du groupe on manifesté leur intérêt pour cette réflexion.

PRESENTATIONS

LE DISQUE OPTIQUE ET L'ARCHIVAGE, VERS UN DISQUE HAUTE DENSITE SPECIFIQUE

Présentation de J.M. Fontaine (UPMC/MCC/CNRS).

Une synthèse de l'origine et des caractéristiques principales des disques optiques a été présentée.

Il est tout à fait spectaculaire de constater à quel point il est difficile de caractériser la qualité d'un disque. On peut constater qu'en partant du même type de disque (même marque, même série), le gravage sur 8 graveurs différents aboutit à des résultats spectaculairement hétérogènes pour ce qui concerne le nombre d'erreurs existant sur les disques. A l'inverse, on constate la même dispersion si on prend 7 disques différents (différentes marques) avec un graveur donné.

Il y a en outre une grande difficulté de prévision du vieillissement de l'état du disque. La définition de la qualité d'un disque optique ne peut pas être caractérisée uniquement avec un taux d'erreur. Par ailleurs, si le taux d'erreur est très faible, cela ne garantit en rien une évolution plus favorable qu'un disque optique ayant un taux d'erreur plus élevé.

Les perspectives, qualités et faiblesses des disques à venir (Laser Bleu de HD DVD) ont été décrites.

Enfin, les objectifs du Groupement d'Intérêt Scientifique GIS-DON ont été présentés : rassembler les moyens humains, techniques et financiers nécessaires pour :

  • Apporter les garanties et définir les mesures requises pour conserver les données enregistrées sur les disques optiques disponibles.
  • Développer un support optique HD d'enregistrement susceptible d'apporter des garanties suffisantes de conservation des contenus pendant quelques dizaines d'années.

PLATE FORME D'ARCHIVAGE NUMERIQUE AU CNES : LE SIPAD-NG, SYSTEME GENERIQUE POUR L'ARCHIVAGE ET L'ACCES AUX DONNEES SCIENTIFIQUES

Présentation du SIPAD - Système de Préservation, d'Information et d'Accès aux Donnée par D. Heulet (CNES) :

Positionnement par rapport au Modèle OAIS.

Présentation de notions générales sur la physique des plasmas.

Présentation du Centre de Données de la Physique des Plasmas (CDPP), entité issue d'un protocole d'accord entre le CNES et le CNRS et dont la mission première est d'assurer la pérennisation sous forme numérique de toutes les observations réalisées dans ce domaine par des expériences françaises et à participation française, de mettre ces observation à la disposition de la communauté scientifique.

Quelques indications générales sur la provenance, la volumétrie et les caractéristiques principales des données archivées par le CDPP.

Organisation du CDPP

Présentation de deux exemples de systèmes d'accès aux données numériques à partir du SIPAD-NG :

  • accès aux données du CDPP, démonstration et examen des différentes fonctionnalités
  • accès aux données du projet d'océanographie opérationnelle Mercator, démonstration

Analyse de la généricité du système SIPAD-NG et sa réutilisabilité dans des contextes très différents.

GESTION DES FORMATS DE FICHIERS, UNE QUESTION CLE POUR L'ARCHIVAGE- UN EXEMPEL DE STRATEGIE DANS CE DOMAINE : LE PILOTE PILAE

Présentation de Jean-Louis Pascon (Consultant).

La gestion des formats est une nécessité dès lors qu'on a choisi la migration comme stratégie de pérennisation (ni émulation, ni conservation de l'environnement).

L'une des difficultés est liée au très grand nombre de formats (plus de 200 pour les images fixes !). Une version presque tous les ans pour DWG !!! (En outre, DWG n'est pas publié et reste un format fermé).

Une autre difficulté réside dans les formats de type Zip qui peuvent contenir d'autres fichiers de type Zip et ainsi de suite.

Les problèmes de volumétrie ne sont pas à négliger. Le passage d'un PDF à PDF/A peut avoir pour conséquence un accroissement du volume du fichier d'un facteur allant de 1 à 10.

On distinguera :

  • les formats acceptés en entrée de l'Archive qui sont supposés être des formats largement utilisés dans les entités productrices des documents,
  • les formats cibles qui sont les formats dans lesquels l'Archive assurera la conservation des documents.

Dans chaque cas, le format doit être défini précisément (nom, version, spécifications).

Cela implique en outre :

  • des outils de tests pour vérifier que les formats acceptés en entrée sont conformes aux exigences de l'Archive,
  • des outils de conversion vers les formats cibles.

La disponibilité de ces outils, leur fiabilité, leur complétude constituent des éléments essentiels pour le maintien des capacités de l'Archive à restituer correctement l'information.

La situation dans ce domaine est très hétérogène. A noter que le logiciel Imagemagik, régulièrement maintenu et mis à niveau, parait donner de bons résultats. Il apparaît que dans un certain nombre de cas, il n'est pas possible d'imposer des outils aux producteurs. Les formats acceptés ne sont alors pas tous conformes et la question se pose en termes de niveau de non conformités acceptées.

PDF/A : PRESENTATION DES SOLUTIONS SEAL SYSTEMS : "DEMONSTRATION & ECHANGE"

Présentation de Saîd El Morabiti et Sébastien Legru (SEAL systems).

Le format PDF/A a été normalisé par l'ISO (ISO 19005-1) sur la base du format PDF 1.4 auquel on a ajouté diverses restrictions d'utilisation.

Il apparaît ici aussi que les questions de vérification et de conversion de format sont loin de relever des sciences exactes.

Le logiciel présenté permet si besoin de s'écarter de la norme PDF/A ou à l'inverse d'imposer des contraintes supplémentaires sur la bases de règles d'entrée. Il peut être utilisé en mode interactif ou en mode batch (c'est à dire au sein d'un processus automatique).

La récupération des propriétés de fichier de Microsoft Office (auteurs dans les champs propriétés du fichier) ne peut pas se faire automatiquement. Cela devrait être possible avec office 2007.

Adobe offre un outil de génération de fichiers au format PDF/A mais cela nécessite de disposer de la suite complète des logiciels Acrobat.

Seal Systems annonce une politique commerciale souple qui pourra être discutée au cas par cas.

  • L'outil PDF checker vérifie la conformité par rapport à PDF/A.
  • L'outil PDF Adjust permet de vérifier un fichier PDF et d'effectuer les adaptations et corrections nécessaires pour le transformer en PDF/A.
  • L'outil ConvertWiz permet de convertir en fichier PDF/A des fichiers MS Office, des images (JPEG, TIFF…).

SEAL system peut être contacté pour toute question relative aux logiciels proposés.

Des versions d'évaluation sont disponibles :

SUJETS POUR LA PROCHAINE REUNION

  • Les paquets de versement : l'empaquetage des données et des métadonnées pour leur transfert à l'Archive mais aussi pour leur conservation.
  • L'archivage des bulletins de paye.
  • A compléter.

THEMES DES PROCHAINES REUNIONS

  • l'étude de la DCSSI sur l'archivage sécurisé,
  • présentation et démonstration de l'utilisation des moteurs sémantiques dans le cadre de la mémoire d'entreprise (Mario Delail, CNES),
  • la signature électronique en pratique,
  • les formats, les profils d'utilisation et les outils de contrôle et validation (TIFF ?) - prévoir une journée complète et inviter des éditeurs de logiciels de validation,
  • les retour d'expérience, état d'avancement des réflexions, des projets dans les institutions publiques et privées,
  • l'émergence de produit du marché,
  • les critères de certification,

Date de la prochaine réunion : Lundi 19 mai 2008 au CNES.

 
public/reunion_pleniere/cr/cr_20080115.txt · Dernière modification: 2011/03/15 15:39 par rouchon     Haut de page
Recent changes RSS feed Creative Commons License Donate Powered by PHP Valid XHTML 1.0 Valid CSS Driven by DokuWiki Design by Chirripó