grand logo BASS2000
CONCLUSIONS de la réunion du GROUPE de REVUE "GESTION DES DONNEES THEMIS"
22-23 novembre 1999, Bagnères de Bigorre.


    Une revue, organisée par le PNST à la demande de l'INSU pour examiner la gestion des données THEMIS et les interfaces THEMIS-BASS2000, s'est réunie les 22 et 23 novembre 1999 à Bagnères de Bigorre.

Le Groupe de revue a entendu des exposés présentés par les équipes de THEMIS (G.Ceppatelli, C.Miguel, C.Briand),
BASS2000 (Th.Roudier, M.Lafon, J.M Malherbe) et ARTHEMIS (K.Reardon - ce dernier exposé, présenté pour permettre au groupe de revue de disposer d'une information complète sur le contexte, n'est pas soumis à la revue).

Le groupe de revue remercie les équipes projet pour la clarté des présentations et pour le soin pris à répondre aux nombreuses questions dans un temps trés limité.

1. Organisation générale du projet.

    1.1 Le groupe de revue note avec satisfaction l'esprit de coopération qui existe entre les équipes de THEMIS, BASS2000 et ARTHEMIS, bien illustré par la complémentarité des présentations, les réponses aux questions, et de nombreux  exemples du travail effectivement réalisé en commun. Cette coopération est et sera un élément essentiel de la réussite du projet.

    1.2 Le groupe de revue constate qu'assurer la mise en place  de procédures de réduction de données pour les trois instruments actuels constitue un problème complexe.
Recommandation1
    S'il est décidé d'installer de nouveaux modes d'observations ou de nouveaux instruments, il sera nécessaire de gérer les équilibres entre besoin scientifique, apport des collaborations éventuelles et augmentation de la complexité d'ensemble. Il est nécessaire que les projets de nouveaux instruments et de nouveaux modes d'observation soient accompagnés d'un plan réaliste explicitant les moyens de réalisation de logiciels permettant de produire des données utilisables scientifiquement par la communauté. Ces logiciels doivent être opérationnels et à la disposition des utilisateurs dès le debut de l'exploitation du mode ou de l'instrument.

    1.3 Relations THEMIS-BASS2000
Recommandation 2
    Le groupe de revue considère comme essentielle une formalisation officielle, le plus rapidement possible, des relations entre THEMIS et BASS2000 (responsabilités, interfaces, partage des tâches). Il paraît logique que THEMIS ait la responsabilité de la production, de la validation et de la diffusion des données, et délègue certaines de ces responsabilités à BASS2000. La responsabilité de l'archivage à long terme des données doit être clarifiée.

2. THEMIS

    2.1 Le groupe de revue note son accord avec les priorités présentées par THEMIS, qui consistent, d'ici la prochaine campagne :

3. BASS2000

    3.1 Participation de BASS2000 au développement, à la diffusion et à la maintenance de logiciels d'intérêts général.
Recommandation 3
    Compte tenu de l'urgence calendaire, le groupe de revue note son accord avec le souhait de l'équipe BASS2000, de rendre disponible et d'assurer le maintien à long terme de la compétence sur le logiciel de traitement des données DPSM.
Recommandation 4
    En ce qui concerne la participation de BASS2000 au développement, à la diffusion et à la maintenance de logiciels de traitement de données, il est nécessaire de distinguer et de hierarchiser au cas par cas les logiciels qui sont du ressort d'un programme générique, à prendre en compte par BASS2000 selon un ordre de priorité à déterminer, par rapport aux développements destinés à des applications spécifiques, qui doivent être réalisés dans des laboratoires utilisateurs de données. Par exemple, en plus du logiciel de traitement des données DPSM, un logiciel de base permettant d'obtenir les paramètres de Stokes dans les raies spectrales à partir de mesures faites par le MTR devrait également être mis à la dispositin de la communauté.
Recommandation 5 (en direction des Programmes Nationnaux concernés)
    Veiller à la bonne collaboration de la communauté scientifique concernée avec les personnes qui prennent en charge la réalisation de logiciels d'intérêt général dans le cadre de THEMIS et des bases de données.

    3.2 L'utilisation scientifique des données THEMIS nécessite la mise en place de différents types de requêtes : recherches en fonction du temps, pour l'étude d'événements particuliers, recherche par type d'objets ou de phénomènes, recherches systématiques.
Oracle est une réponse technique adaptée à la gestion de requêtes de sélections par critères parmi les données d'un catalogue (données tabulaires). De plus c'est un système largement utilisé dans la communauté concernée pour la mise en place de services en ligne et de recherche dans des catalogues, ce qui devrait faciliter les échanges techniques et la mise en place d'outils communs.
Recommandation 6
    Poursuivre le développement du système d'accès au catalogue sous Oracle, avec une adaptation du logiciel à l'évolution du système (modification éventuelle du schéma, prise en compte de l'évolution des mots-clé, etc ...). La proposition présentée "nouvelle stratégie" n'est pas adaptée aux besoins actuels et futurs d'accès des scientifiques à la base et ne peut être éventuellement envisagée que comme un accès aux données brutes.
Recommandation 7
    Une compétence adaptée doit être mise en place par l'OMP pour poursuivre dès que possible l'adaptation du système logiciel basé sur Oracle à l'évolution du système.
Un arrêt de longue durée de ces développements met en danger le développement d'un système adapté aux besoins scientifiques. Il est important de réduire au minimum le temps d'arrêt, pour permettre la prise en compte dans de bonnes conditions des données de la prochaine campagne dès avril 2000.
Recommandation 8
    Il est extrêmement important que BASS2000 fournisse un accès de type "imagettes" aux données contenues dans la base.

    3.3 Point clé
Recommandation 9
    Un point clé sera organisé dans un délai d'un an, pour faire le bilan des activités de BASS2000 à cette date. Une expertise technique pourra également être organisée, au plus tard préalablement au point clé.

    3.4 Environnement scientifique de BASS2000
Le groupe de revue note l'importance, pour le bon fonctionnement d'un Centre de Données tel que BASS2000, de disposer d'un bon environnement scientifique.
L'ouverture d'un poste de professeur à Tarbes est un élément clé de l'enrichissement de cet environement.
Recommandation 10
    Une forte mobilisation de l'OMP, avec en particulier l'aide des Programmes Nationaux concernés, est nécessaire pour assurer la publicité et susciter des candidatures, afin de pourvoir au mieux le poste de Professeur ouvert à Tarbes.

4. Sélection des données.

Recommandation 11
    Le groupe de revue donne son accord à la politique de sélection des données préconisée par le projet : une attitude pragmatique, tenant compte des leçons de la campagne 1999, et prudente, pour éviter d'éliminer des données pouvent présenter un intérêt pour d'autres utilisations scientifiques que celles proposées par les observateurs, et pour permettre de tirer le meilleur parti de nouvelles possibilités éventuellement offertes par l'évolution des technologies de stockage de données.

5. Mots- clé (métadonnées)

5.1 Procédures de validation
Recommandation 12
    La mise en place d'une procédure de validation des mots-clé doit être poursuivie par THEMIS et BASS2000 (procédure d'échange des métadonnées, prise en compte des erreurs identifiées). THEMIS est responsable de la validation des métadonnées.
L'objectif est que THEMIS fournisse pour la prochaine campagne de données validées à BASS2000 et ARTHEMIS. Il est nécessaire que BASS2000  et ARTHEMIS continuent à vérifier de leur côté avant inclusion dans la base que les métadonnées sont valides.
Recommandation 13
    Une procédure doit être mise en place pour la correction des mots clé erronés. La correction des données devra être menée au cas par cas. En particulier, il est nécessaire de corriger au mieux les données de la campagne 1999, au besoin en utilisant des outils développés pour la fiabilisation du processus d'entrée des données (voir2.1).

5.2 Participation des observateurs
Recommandation 14
    Pour faciliter la sélection ultérieure des données par les utilisateurs des bases de données, il est très souhaitable de mettre en place des métadonnées donnant des indications sur la qualité des données, par exemple sur le seeing et l'état de réglage des instruments, et la présence de phénomènes potentiellement intéressants. Ces informations sont créées par THEMIS et par l'observateur.
Recommandation 15
    Le groupe de revue recommande la mise en place d'une charte des observateurs de THEMIS, précisant le retour attendu d'eux pendant les observations et après leur dépouillement, en particulier en ce qui concerne l'évaluation de la qualité et du contenu des données. THEMIS doit assurer la mise à disposition d'un outil informatique permettant la mise en forme et la transmission des informations, et transmettre l'information recueillie aux bases de données.

5.3 Evolution de la liste des métadonnées
Recommandation 16
    Le groupe de revue apprécie de façon trés positive la fait que les différents intervenants français dans le domaine de la mise à disposition des données solaires et de physique des plasmas spatiaux travaillent ensemble à la définition des métadonnées communes. Il recommande la poursuite des efforts dans ce sens.
Recommandation 17
    Tous les systèmes doivent prendre en compte le fait que la liste des métadonnées est évolutive.

6. Sécurité des données

Recommandation 18
    Le groupe de revue recommande que les données soient conservées dans deux endroits différents, pour des raisons de sécurité.
 
 

Membres du Groupe de Revue :