Compte-rendu de la réunion du 22 mars 2012

INFORMATIONS GENERALES

Réunion tenue à l'Université Paris Diderot, 41 participants.

Compte-rendu rédigé par Fabrice Lecocq (CNRS-INIST).

Tour de table, présentation de l'ordre du jour.

Prochaine réunion : juin 2012

EVENEMENTS PASSES

Journée Juriconnexion, 13 Décembre, Paris (France) – “Patrimoine juridique numérique“

PASIG 2012, 11 au 13 Janvier, Austin, Texas (USA) – http://sun-pasig.ning.com/

Une session était consacrée à l’Archivage Pérenne dans le « Cloud ». Au-delà de l’effet de mode, des acteurs de renoms commencent à faire des expérimentations dans ce domaine

Documation 2012, 21 au 22 Mars, Paris (France) – http://www.documation.fr/

On constate la convergence entre les métiers de bibliothécaires, documentalistes et archivistes.

EVENEMENTS A VENIR

Open Repositories 2012, 9 au 13 Juillet, Edimbourg (Ecosse) – http://or2012.ed.ac.uk/dates/

iPRES 2012, 2 au 5 Octobre, Toronto (Canada)

APA conference 2012, 5 au 7 Novembre, Rome (Italie) – http://www.alliancepermanentaccess.org/

PUBLICATIONS

Publication de “Advanced Digital Preservation” par David Giaretta – Springer-Verlag Berlin Heidelberg 2011 – ISBN 978-3-642-16808-6

Pré-publication de la norme ISO 13008 sur les processus de migration et de conversion des données numériques. http://www.iso.org/iso/fr/catalogue_detail.htm?csnumber=52326

Sortie d’un numéro spécial de D-Lib magazine consacré à l’archivage du Web. http://www.dlib.org/dlib/march12/03contents.html (doi:10.1045/march2012-contents)

L’enquête publique « Coffre-fort électronique » est devenue “Composants pour un coffre-fort numérique”. Norme à l’horizon.

Collaboration entre l’ESA et le Vatican concernant la numérisation des ouvrages du Vatican. Le format FITS, issu du monde des astronomes, sera utilisé.

PRESENTATIONS

GLAZT : Archivage à très long terme de données numériques sur disques optiques en verre

Présentation par Gaëlle Pinson (Glazt).

Historique

A l’origine, rapport de la l‘Académie des Sciences 2010 et les études du GIS DON de Franck Lalöe. En parallèle, recherche du Grand Paris de solutions porteuses à horizon 2030 Création d’Essilex, avec le soutien du Secrétariat d’Etat à l’Economie Numérique (NKM)

Changement récent de nom : Glazt.

Caractéristique

Solution non propriétaire, compatible avec tout lecteur de DVD.

Qualité : c’est du verre (mais en sandwich) ; Ca devrait tenir en cas de choc, mais tout de même déconseillé. DVD de 5 Go, bientôt 10 Go mais il faudra retourner le disque. Pas de précaution de stockage particulière.

A la production des DVD, contrôle de qualité (fiche de test)

Production

Capacité actuelle de production : 2000 disques / mois Prix : 150 € HT / disque ; objectif : baisser à 100 € / disque Délai actuel : 3 semaines

R&D : Projet de 2 M€ dans le cadre de la 1ère vague ANR : « Archive and Forget » But : augmenter la volumétrie / faire baisser les coûts de production .

ARNANO : Conservation à très long terme de documents numériques sur disques saphir

Présentation par Alain Rey et Guy Urbas (Arnano).

Slogan : « le hiéroglyphe du 3ème millénaire »

Historique

Société née en 2009, issue du CEA. Début de la production en 2010. 2 domaines d’activité : la décoration dans l’industrie du luxe telle l’horlogerie (traçabilité, microgravage) et les média d’archivage sécurisé : les nanoformes.

Caractéristiques

Technologie issue du monde de la micro-électronique (40 ans d’expérience au CEA). Nanoforme = disque en saphir ou en verre, de 100 ou 200 mm. Gravure sous forme analogique, contenant environ 20 000 pages A4 soit l’équivalent d’un CD de 700 Mo. La capacité dépend de la résolution. Et du type du document : en cas de couleur, il faut 3 images, une par composante RVB.

Il existe une société américaine et une société australienne qui ont le même type d’approche. Pérennité : de l’ordre du millénaire. Résiste à tous les types d’agression (feu < 1200°, électromagnétisme, produits corrosifs…). Juste sensible aux chocs (un packaging spécial permet une protection supplémentaire)

Le prix dépend du support (verre/saphir), de la résolution… Les prix actuels vont entre 2500€ et 10 000 € par nanoforme gravée. Compte tenu du prix, ce type de produit s’adresse plutôt aux industries à risque (nucléaire, aéronautique) ou patrimoniale (Unesco, Archives) pour des documents très précieux.

La lecture peut se faire par un microscope USB (de l’ordre de 1000 €), par un microscope USB avec caméra ou par un scanner Arnano haut de gamme (de l’ordre de 20 k€).

CNES : Outils utilisés pour l’archivage des données issues des missions spatiales

Présentations par Dominique Heulet et Danièle Boucon (CNES).

OASIS et BEST : outils de description (modélisation formelle des données) (Dominique Heulet).

Permet de décrire un format, très utile dans le cas où le format est spécifique et n’est pas un format partagé par une communauté, tel FITS pour les astronomes.

OASIS et BEST sont basés sur 2 standards CCSDS : EAST (pour la syntaxe) et DEDSL (pour la sémantique). OASIS date des années 90. Il est remplacé par BEST depuis 2005, résultat d’une collaboration CNES-ESA.

BEST est composé de 3 outils :

  • OASIS : éditeur graphique de description. Permet de définir un ICD, Interface Control Document
  • SCRIBE : transforme un ICD en un document lisible (html, word, pdf…)
  • Data Checker : pour vérifier la conformité de données par rapport à un format attendu.

BEST permet aussi de générer des jeux de données pour test (module DPE). Enfin ALADIN permet de comparer deux descriptions successives d’un même format (une sorte de diff).

Outils d’inventaire des données (Danièle Boucon)

Capitalisation et centralisation des informations sur des jeux de données de la plupart des missions spatiales auxquelles le CNES a participé. Actuellement 50 missions dont 80 % sont des missions terminées.

Le modèle d’inventaire définit les grandes catégories d’informations (données principales, complémentaires, documentation , …), les liens entre elles, et les informations principales de pérennisation. Il identifie également une classification scientifique des données, associée à un ensemble de mots clés.

Création du Service de Référencement des Données du CNES (SERAD), basé sur la norme ISO 19115 + Thesaurus en SKOS.

REFLECS : outil de référencement (Danièle Boucon)

Outil de découverte des données destiné pour le CNES, les scientifiques ou le Grand Public.

Couvre toutes les thématiques scientifiques spatiales.

  • Extraction des métadonnées à partir de l’inventaire des données.
  • Mot-clés organisés avec un thesaurus
  • Multi-thématiques avec quelques spécificités
  • Basé sur l‘outil open source MD WEb

SIPAG-NG : système d’accès aux données (Dominique Heulet)

Implémentation dérivée d’OAIS

Fonction gestion des données

Indépendant de la thématique

Basé sur la norme DEDSL

Dictionnaire décrivant les actions que l’on peut faire sur un catalogue de fichiers (ajout/delete/update). C’est un schéma XML.

Gère :

  • Les objets de données
  • Les imagettes (browse)
  • Les collections documentaires (documents)

Stocké en base Oracle.

Lancer une action sur le SIPAD revient à processer une liste de tâches décrite dans un fichier XML.

Fonction accès aux données

Ces services sont utilisables en ligne ou par Web Services. Ils sont écrits en Java

  • Ss services User Management
  • Ss services recherche des données dans l’espace de stockage
  • Ss service de mise à disposition dans un User Workspace

Fonction d’entrée des données

  • ss-fonction Acquisition : les données sont déposées dans un espace de dépôt. Il y a alors contrôle des données puis production des métadonnées
  • ss-fonction d’archivage : stocke les données dans le STAF
  • ss-fonction de mise à jour du catalogue

Ces trois sous-fonctions sont asynchrones et peuvent s’exécuter indépendamment. Une base Oracle assure la coordination du processus

Date de la prochaine réunion : juin 2012 (date et lieu à confirmer).

 
public/reunion_pleniere/cr/cr_20120322.txt · Dernière modification: 2012/04/11 11:07 par rouchon     Haut de page
Recent changes RSS feed Creative Commons License Donate Powered by PHP Valid XHTML 1.0 Valid CSS Driven by DokuWiki Design by Chirripó