Compte-rendu de la réunion du 2 décembre 2011
INFORMATIONS GENERALES
Réunion tenue au CNES, 58 participants.
Tour de table, présentation de l'ordre du jour.
Prochaine réunion : mars 2012
EVENEMENTS PASSES
Congrès IFLA “e-Legal Deposit: from legislation to implementation; from ingest to access” du 13 au 18 Août, San José (Porto Rico) – http://conference.ifla.org/ifla77
Matinée CR2PA “L'archivage de dossiers R&D et d’ingénierie : entre sécurité et pérennité” le 4 Octobre, Boulogne-Billancourt - http://www.cr2pa.fr/
Goportis Digital Preservation Summit, “Getting Ready for Digital Preservation” du 19 au 20 Octobre, Hambourg (Allemagne) – http://www.digitalpreservationsummit.de/
iPRES 2011, du 1 au 4 Novembre, Singapour – http://ipres2011.posterous.com
IDCC, 7ème conférence internationale sur la curation des données, du 5 au 8 Novembre, Bristol (UK) - http://www.dcc.ac.uk/events/idcc11/programme
Berlin 9 Open Access Conference du 09 au 10 Novembre, Washington, DC (USA) – http://www.berlin9.org/
PV 2011 “Ensuring long-term preservation and adding value to scientific and technical data” du 15 au 17 Novembre, Toulouse (France) – http://www.pv2011.com/
Journées Réseaux 2011 du 22 au 25 Novembre, Toulouse (France) – http://www.jres.org/
EVENEMENTS A VENIR
Journée Juriconnexion, “Patrimoine juridique numérique”, le 13 Décembre, Paris (France)
PASIG 2012, du 11 au 13 Janvier, Austin, Texas (USA) – http://sun-pasig.ning.com/?xg_source=msg_mes_network
PUBLICATIONS
Publication des normes ISO 30300 (systèmes de gestion des documents d'activité – principes essentiels et vocabulaire) et ISO 30301 (information et documentation – systèmes de gestion des documents d'activité – exigences), disponibles auprès de l'ISO et de l'AFNOR en versions anglaises et françaises.
L'ISO 30300 fixe les termes et définitions qui s'appliquent aux normes relatives aux systèmes de gestion des documents d'activité (SGDA) préparées par l'ISO/TC 46/SC 11. Elle établit également les objectifs associés à l'utilisation d'un SGDA, fournit les principes, décrit une approche par processus et spécifie les rôles de la direction.
L'ISO 30301 spécifie les exigences relatives à un système de gestion des documents d'activité (SGDA) visant à soutenir un organisme dans la réalisation de son mandat, de sa mission, de sa stratégie et de ses objectifs par le développement et la mise en œuvre d'une politique et d'objectifs relatifs aux documents des activités et donne des informations sur la mesure et la surveillance des performances.
PRESENTATIONS
WORLDLINE ARCHIVING : SOLUTION D'ARCHIVAGE ELECTRONIQUE SECURISE
Présentation par Pascal Salomé, Christophe Bouvard (ATOS), et Gabriel Ramanantsoavina (ANTAI).
Il s'agit de l'outil d'archivage électronique sécurisé utilisé, pour le secteur public, d'une part dans le cadre du GIP e-Bourgogne et de son offre d'archivage et d'autre part, pour l'archivage des contraventions routières puis des minutes judiciaires contraventionnelles dans le cadre de l'établissement public ANTAI (agence nationale de traitement automatisé des infractions).
L'outil se trouve sur deux sites : Seclin et Vendôme pour lesquels un agrément SIAF a été attribué.
Infra de stockage : stockage en grille avec couche d'abstraction logicielle sur serveurs plus bandes sur LTO 4
- 2 sites sur disques avec mises à jour synchrones
- plus bandes
- soit 4 images de l'archive hors sauvegarde
Utilisation de PaDaF pour la validation de PDF/A intégré au projet Apache (mis en open source)
L'ANTAI a réalisé une première opération de migration depuis des DVD vers des serveurs en grille déjà réalisée.
Le matériel se trouve à l'ANTAI mais l'exploitation est faite par la société ATOS. En théorie il est possible de changer de prestataires (droits d'usage et d'exploitation cédés par ATOS à l'ANTAI, matériels appartiennent à l'ANTAI, les codes sources appartiennent à l'ANTAI).
L'outil implémente le standard d'échanges de données pour l'archivage (SEDA) utilisé dès lors qu'on veut transmettre des archives à un partenaire externe.
SAFETY DEPOSIT BOX
Présentation par Maïté Braud (Tessella).
La société a été fondée en 1980 et compte aujourd'hui 200 personnes, tous les employés sont des scientifiques. Le logiciel scientifique est le cœur de l'activité de Tessella, qui a une expérience en archivage électronique depuis 2000.
Le besoin a d'abord été exprimé par une entreprise pharmaceutique puis la société a été contactée par les archives nationales anglaises. Elle travaille aussi avec les archives nationales américaines (NARA) et ne possède pas de succursale en France (mais elle compte 3 français dans la société). Elle a également installé son offre aux Archives Fédérales Suisses, aux archives nationales des Pays Bas, d'Autriche, pour les archives de la ville Rotterdam, projet en cours pour les archives nationales de Malaisie. Enfin c'est son produit qui est utilisé pour assurer l'archivage des archives des mormons (Family Search).
L'outil a d'abord été développé spécifiquement pour les archives nationales anglaises, puis pour les suisses. Il s'agit maintenant d'un produit avec une nouvelle version tous les 6 mois et partage par tous les utilisateurs du même système. L'outil est en utilisation depuis 8 ans aux archives nationales anglaises, avec déjà des migrations d'ampleur qui ont été effectuées.
La société participe à plusieurs projets de recherche : avec les Archives nationales anglaises, projet PRONOM puis participation aux projets PLANETS et DROID.
Participation depuis 2011 au projet européen Ensure : domaine de la santé, données financières, essais cliniques (archivage numérique et pérennisation). Enfin participation aux travaux sur la technologie cloud dont le leader est Israël. Par ailleurs la société est partie prenante de Datanet (données scientifiques), piloté par les américains ou encore du projet APARSEN: projet où le CINES collabore pour la mise en place d'un réseau d'excellence au niveau européen, et teste la norme ISO 16363 sur la certification des SAE.
Son produit s'appelle SDB safety deposit box. Il est basé dès le départ sur OAIS. Sa technologie est en évolution depuis 2003 et la société commercialise actuellement la version 4.
Un module spécifique est consacrée à la préservation active (particulier à cette solution), pour notamment les fichiers complexes (nombreux liens entre les fichiers), afin d'anticiper les phénomènes d'obsolescence technologique et d'anticiper les plans de migration . Ainsi, il est décidé soit de migrer les fichiers un par un, soit de prendre des décisions par lots suivant les risques détectés supérieurs à tel seuil (à partir des éléments du registres des formats enrichi et consolidé au fur et à mesure des versements).
L'outil inclut plusieurs types de workflow qu'on peut, si on le souhaite, paramétrer simplement. Il est prévu (demande des Pays Bas) au-delà des antivirus déclenchés à l'arrivée des versements, de pouvoir déclencher un autre antivirus 30 jours d'intervalle après le premier versement.
Il s'agit d'un outil multi instances par exemple utilisé par une archive centrale et localement par des archives locales.
Toutes les API sont publiées, le système est basé sur Java, il supporte aussi bien Linux que Windows , Oracle, MSQL et SQL Server ; différents formats de métadonnées sont supportés (Mets, Premis) mais, pour des raisons d'efficacité et de contrôles accrus, est utilisé un format de métadonnées propriétaires, avec des possibilités d'export vers des formats ouverts. Une synchronisation avec OAI PMH est possible.
Un club utilisateurs a été institué avec les 12 clients qui se retrouvent régulièrement, sans la société dans un premier temps, qui aident Tessella à établir sa feuille de route.
La partie les plus complexe est la gestion des données :
- administrer la base de données
- exécuter les requêtes (toute action se retrouve dans la base de données)
- produire des rapports (Jasper Reports) au format csv, pdf ou xml
- recevoir mises à jour de la base de données (dès que qu'une action se déclenche, un audit est créé)
- workflow de gestion de données (évaluation des données, suppressions, optimisation des index de recherche, export en masse).
L'archiviste peut créer des SIP (SIP builder).
A l'entrée, des outils des caractérisation ont été intégrés/développés, et rien n'empêche d'en intégrer de nouveaux ultérieurement pour re-caractériser les versements.
La signature du SIP possible (signature XADES) avec vérification de la signature.
A l'entrée, se font : une copie du SIP/le passage des anti virus/le contrôle d'intégrité / d'intégrité des métadonnées/ d'intégrité des contenus / la caractérisation des fichiers/ le déclenchement du stockage des fichiers/du stockage des fichiers de métadonnées/ la mise à jour des index de recherche (on indexe par exemple contenu de fichiers pdf)/ la création de miniatures.
Des tests d'intégrité (administration,permet de gérer l'intégrité) peuvent être déclenchés, suivant les paramétrages, à différents intervalles.
Avec l'Explorer, il est possible de faire une navigation et d'afficher l'archive, ses fichiers, les caractéristiques techniques, descriptives.
Un workflow de migration est montré en démonstration : la notion de composant avec liens entre les fichiers et la migration qui prend en compte ces différents liens, est explicitée. On reverse ensuite dans l' archive et on refait tout le workflow de versement.
L'ensemble des schémas sont préservés dans le système, qu'on peut ensuite valider si nécessaire.
ARCSYS
Présentation par Dominique Lhopital (Arcsys software).
Arcsys software est une filiale du groupe Infotel (1500 collaborateurs). L'activité du groupe est répartie en 8% éditeur et 92% SSII. L'activité de Arcsys software est elle à 100% éditeur, spécialisé sur l'archivage électronique uniquement et fonctionne exclusivement par vente de licences. La société possède des références dans les domaines : banques et assurances, scientifique [MBDA filiale d'EADS sur des dossiers technique de conception], public [CINES], Telemcom, énergie, Tiers-archiveur (Luxembourg e-Archiving sur banques et assurances, Almerys sur santé).
Arcsys software a répondu à des appels d'offre en collaboration avec Naoned Systèmes.
Ses domaines d'activité sont principalement le « marché de la valeur probante » et le « marché de la préservation » mais aussi la « gestion de contenus » (interfaces avec quelques gros outils de GED) mais la solution n'a pas vocation à devenir une GED.
Le système Arcsys est composé de connecteurs puis de 6 couches d'administration.
Fonctions d'arcsys : Gestion de contenu, durée de conservation, gestion du cycle de vie, plan de classement. Web services et API. Interfaces utilisateurs (gestion des droits, administration des référentiels, confidentialité, recherche via métadonnées et plein texte). Couches basse : coffre-fort électronique
Gestion du stockage
Le nombre de copies est paramétrable sur des supports au choix dans des lieux différents. Le système fournit une couche d'abstraction ; la reconstruction est automatique en cas d'incident d'un des composants.
- Les processus qui se surveillent mutuellement et se relancent automatiquement.
- Accès multiple au stockage avec gestion des débordements.
- Système d'alertes, sauvegarde intégrée.
- Sur le support, l'archive est accompagnée d'un manifeste et d'éléments cryptographiques (empreintes, signatures). Le format est lisible en dehors du logiciel.
- Changement de supports de stockage.
- Vérification de l'intégrité, copie, revérification et journalisation.
- Auto-archivage des journaux.
- Migration des formats
- Conversion d'empreintes
MNESYS
Présentation par Alexis Moisdon (Naoned systèmes).
Naoned systèmes est l'éditeur de la solution Mnesys - 12 personnes. CA 4 M Euros. 40 références [dans le secteur public : Les affaires étrangères, CG Doubs, CG Rhône, DGAC, Musée du quai Branly ; Banque : BnP Parisbas].
L'offre est une plate-forme d'archivage ainsi qu'un outil de publication. Elle s'adresse à des archivistes et Records Manager. L'offre est mixte et couvre l'archivage papier et numérique.
La réversibilité est envisagée par le respect des standards (XML, METS, PREMIS, EAD, etc.)
- Intégration dans le système de la définition de la politique d'archivage.
- Pérennisation à long terme
Périmètre fonctionnel
Gouvernance (cycle de vie, définition des acteurs, définition technique des échanges).
Entrée (contrôle des versements, horodatage et journalisation, entrées dans le système de conservation)
Gestion de données – Classement
Conservation (planification des migrations, gestion des espaces (papier), gestion des éliminations) ↔ coffre-for électronique
Communication (moteur de recherche, visualiseur, suivi des communications, suivi des transferts)
- Entité « Entrée » : réception de bordereau format SEDA et suivi du workflow du SEDA, convention d'archivage (cycle de vie, formats, authenticité, intégrité…), inspection des fichiers et extraction de métadonnées (outil FITS). Possibilité de migration à l'entrée. Agrégation de SIP dans un AIP. Enregistrement d'un paquet METS reliant les données et métadonnées EAD et PREMIS
- Entité « Stockage » : vue sur les fichiers, sur les articles. Gérer la hiérarchie de stockage (Arcsys). Pour fournir les données chaque requête est passée à Arcsys
- Entité « Gestion des données » : métadonnées intellectuelles ISAD/G et description des producteurs en ISAAR/CPF. Mise à jour du paquet METS. Métadonnées techniques PREMIS issue des entrées, remontées du coffre (dates, erreurs, calculs d'empreintes…). Accès requêtes directes sur les fichiers XML
Date de la prochaine réunion : mars 2012 (date et lieu à confirmer).