Une revue, organisée par le PNST à la demande de l'INSU pour examiner la gestion des données THEMIS et les interfaces THEMIS-BASS2000, s'est réunie les 22 et 23 novembre 1999 à Bagnères de Bigorre.
Le Groupe de revue a entendu des exposés présentés
par les équipes de THEMIS (G.Ceppatelli, C.Miguel, C.Briand),
BASS2000 (Th.Roudier, M.Lafon, J.M Malherbe) et ARTHEMIS
(K.Reardon - ce dernier exposé, présenté
pour permettre au groupe de revue de disposer d'une information complète
sur le contexte, n'est pas soumis à la revue).
Le groupe de revue remercie les équipes projet pour la clarté des présentations et pour le soin pris à répondre aux nombreuses questions dans un temps trés limité.
1. Organisation générale du projet.
1.1 Le groupe de revue note avec satisfaction l'esprit de coopération qui existe entre les équipes de THEMIS, BASS2000 et ARTHEMIS, bien illustré par la complémentarité des présentations, les réponses aux questions, et de nombreux exemples du travail effectivement réalisé en commun. Cette coopération est et sera un élément essentiel de la réussite du projet.
1.2 Le groupe de revue constate
qu'assurer la mise en place de procédures de réduction
de données pour les trois instruments actuels constitue un problème
complexe.
S'il est décidé
d'installer de nouveaux modes d'observations ou de nouveaux instruments,
il sera nécessaire de gérer les équilibres entre besoin
scientifique, apport des collaborations éventuelles et augmentation
de la complexité d'ensemble. Il est nécessaire que les projets
de nouveaux instruments et de nouveaux modes d'observation soient accompagnés
d'un plan réaliste explicitant les moyens de réalisation
de logiciels permettant de produire des données utilisables scientifiquement
par la communauté. Ces logiciels doivent être opérationnels
et à la disposition des utilisateurs dès le debut de l'exploitation
du mode ou de l'instrument.
1.3 Relations THEMIS-BASS2000
Le groupe de revue considère
comme essentielle une formalisation officielle, le plus rapidement possible,
des relations entre THEMIS et BASS2000 (responsabilités,
interfaces, partage des tâches). Il paraît logique que THEMIS
ait la responsabilité de la production, de la validation et de
la diffusion des données, et délègue certaines de
ces responsabilités à BASS2000. La responsabilité
de l'archivage à long terme des données doit être clarifiée.
2. THEMIS
2.1 Le groupe de revue note son accord avec les priorités présentées par THEMIS, qui consistent, d'ici la prochaine campagne :
3.1 Participation de BASS2000
au développement, à la diffusion et à la maintenance
de logiciels d'intérêts général.
Compte tenu de l'urgence
calendaire, le groupe de revue note son accord avec le souhait de l'équipe
BASS2000, de rendre disponible et d'assurer
le maintien à long terme de la compétence sur le logiciel
de traitement des données DPSM.
En ce qui concerne la participation
de BASS2000 au développement, à la diffusion et à
la maintenance de logiciels de traitement de données, il est nécessaire
de distinguer et de hierarchiser au cas par cas les logiciels qui sont
du ressort d'un programme générique, à prendre en
compte par BASS2000 selon un ordre de priorité à déterminer,
par rapport aux développements destinés à des applications
spécifiques, qui doivent être réalisés dans
des laboratoires utilisateurs de données. Par exemple, en plus du
logiciel de traitement des données DPSM, un logiciel de base
permettant d'obtenir les paramètres de Stokes dans les raies spectrales
à partir de mesures faites par le MTR devrait également
être mis à la dispositin de la communauté.
(en direction des Programmes Nationnaux concernés)
Veiller à la bonne
collaboration de la communauté scientifique concernée avec
les personnes qui prennent en charge la réalisation de logiciels
d'intérêt général dans le cadre de THEMIS
et des bases de données.
3.2 L'utilisation scientifique
des données THEMIS nécessite
la mise en place de différents types de requêtes : recherches
en fonction du temps, pour l'étude d'événements particuliers,
recherche par type d'objets ou de phénomènes, recherches
systématiques.
Oracle est une réponse technique adaptée
à la gestion de requêtes de sélections par critères
parmi les données d'un catalogue (données tabulaires). De
plus c'est un système largement utilisé dans la communauté
concernée pour la mise en place de services en ligne et de recherche
dans des catalogues, ce qui devrait faciliter les échanges techniques
et la mise en place d'outils communs.
Poursuivre le développement
du système d'accès au catalogue sous Oracle, avec
une adaptation du logiciel à l'évolution du système
(modification éventuelle du schéma, prise en compte de l'évolution
des mots-clé, etc ...). La proposition présentée "nouvelle
stratégie" n'est pas adaptée aux besoins actuels et futurs
d'accès des scientifiques à la base et ne peut être
éventuellement envisagée que comme un accès aux données
brutes.
Une compétence adaptée
doit être mise en place par l'OMP
pour poursuivre dès que possible l'adaptation du système
logiciel basé sur Oracle à l'évolution du système.
Un arrêt de longue durée de ces
développements met en danger le développement d'un système
adapté aux besoins scientifiques. Il est important de réduire
au minimum le temps d'arrêt, pour permettre la prise en compte dans
de bonnes conditions des données de la prochaine campagne dès
avril 2000.
Il est extrêmement
important que BASS2000 fournisse un accès de type "imagettes"
aux données contenues dans la base.
3.3 Point clé
Un point clé sera
organisé dans un délai d'un an, pour faire le bilan des activités
de BASS2000 à cette date. Une expertise technique pourra
également être organisée, au plus tard préalablement
au point clé.
3.4 Environnement scientifique
de BASS2000
Le groupe de revue note l'importance, pour
le bon fonctionnement d'un Centre de Données tel que BASS2000,
de disposer d'un bon environnement scientifique.
L'ouverture d'un poste de professeur à
Tarbes est un élément clé de l'enrichissement de cet
environement.
Une forte mobilisation
de l'OMP, avec en particulier l'aide des Programmes Nationaux concernés,
est nécessaire pour assurer la publicité et susciter des
candidatures, afin de pourvoir au mieux le poste de Professeur ouvert à
Tarbes.
4. Sélection des données.
Le groupe de revue donne
son accord à la politique de sélection des données
préconisée par le projet : une attitude pragmatique, tenant
compte des leçons de la campagne 1999, et prudente, pour éviter
d'éliminer des données pouvent présenter un intérêt
pour d'autres utilisations scientifiques que celles proposées par
les observateurs, et pour permettre de tirer le meilleur parti de nouvelles
possibilités éventuellement offertes par l'évolution
des technologies de stockage de données.
5. Mots- clé (métadonnées)
5.1 Procédures de validation
La mise en place d'une
procédure de validation des mots-clé doit être poursuivie
par THEMIS et BASS2000 (procédure d'échange
des métadonnées, prise en compte des erreurs identifiées).
THEMIS est responsable de la validation des métadonnées.
L'objectif est que THEMIS fournisse
pour la prochaine campagne de données validées à BASS2000
et ARTHEMIS. Il est nécessaire que BASS2000 et ARTHEMIS
continuent à vérifier de leur côté avant inclusion
dans la base que les métadonnées sont valides.
Une procédure doit
être mise en place pour la correction des mots clé erronés.
La correction des données devra être menée au cas par
cas. En particulier, il est nécessaire de corriger au mieux les
données de la campagne 1999, au besoin en utilisant des outils développés
pour la fiabilisation du processus d'entrée des données (voir2.1).
5.2 Participation des observateurs
Pour faciliter la sélection
ultérieure des données par les utilisateurs des bases de
données, il est très souhaitable de mettre en place des métadonnées
donnant des indications sur la qualité des données, par exemple
sur le seeing et l'état de réglage des instruments, et la
présence de phénomènes potentiellement intéressants.
Ces informations sont créées par THEMIS et par l'observateur.
Le groupe de revue recommande
la mise en place d'une charte des observateurs de THEMIS, précisant
le retour attendu d'eux pendant les observations et après leur dépouillement,
en particulier en ce qui concerne l'évaluation de la qualité
et du contenu des données. THEMIS doit assurer la mise à
disposition d'un outil informatique permettant la mise en forme et la transmission
des informations, et transmettre l'information recueillie aux bases de
données.
5.3 Evolution de la liste des métadonnées
Le groupe de revue apprécie
de façon trés positive la fait que les différents
intervenants français dans le domaine de la mise à disposition
des données solaires et de physique des plasmas spatiaux travaillent
ensemble à la définition des métadonnées communes.
Il recommande la poursuite des efforts dans ce sens.
Tous les systèmes
doivent prendre en compte le fait que la liste des métadonnées
est évolutive.
6. Sécurité des données
Le groupe de revue recommande
que les données soient conservées dans deux endroits différents,
pour des raisons de sécurité.
Membres du Groupe de Revue :