Etat du projet Base Botanique mondiale (WWBKB)
J.M. Vanel - 2003-02-17 (
jmvanel@free.fr)
L'
application , un
moteur de recherche sur la Flore de Chine, tourne sur ma machine perso,
qui est seulement une 500MHz -:( . Le serveur tourne la plupart du
temps, mais c'est la machine de développement ...
La vision initiale (1999) du projet est ici:
http://wwbota.free.fr/Appel.htm
Sur le site
http://wwbota.free.fr/ vous trouverez
des informations complètes sur le projet, en Anglais.
L'état du projet
Le moteur de recherche offre des
requêtes à La Google sur des grandes bases XML, qui sont
traduites en XPath, puis transférées à la base de
données XML, puis formattées joliment grace au moteur
Cocoon de apache.org. C'est 100% open source, et géré par
une communauté de dévelopeurs sur sourceforge.net .
En amont de cela il y a un analyseur syntaxique, FloraParse,
écrit en C++ avec Lex/Yacc, qui utilise le dictionaire
sémantique WordNet de l'Université de Princeton.
FloraParse transforme les descriptions en language naturel en un format
XML où les informations sont marquées comme organe,
sous-organe, lieu géographique, etc.
Tout cela est pleinement opérationnel.
WWBKB est en avance sur plusieurs points par rapport aux efforts des
taxonomistes académiques, dû au bon niveau informatique de
son fondateur. Je suis en permanence leurs avancées; les
collaborations incluent:
- le Taxonomic Databases Working Group ( http://www.tdwg.org
)
- Laboratoire Informatique et Systématique au sein de
l'Université Pierre et Marie Curie
- Université de Havard, qui a fourni les données
brutes de la Flore de Chine
L'intérêt pour un mécène
- mention "sponsorized by ..." sur nos sites et lors de
présentations à des manifestations et réunions
(FING par exemple) informatiques, écologiques ou scientifiques,
ou lors d'interventions dans les media audiovisuels
- un positionnement par rapport aux thèmes écologie
et nature d'une part, Web et nouvelles technologies d'autres part
- droit d'utiliser le nom WWBKB
- préconisation d'un matériel on d'un
hébergeur lors du déploiement de nos outils pour les
clients de WWBKB
Arguments
J'insiste sur ce mélange original de souci écologique, de
techniques de pointe, d'aspect éducatif et sémantique, de
réseau collaboratif pour la connaissance, et de logiciel libre.
La prochaine étape dans le projet concerne l'identification et la
génération d'images 2D et 3D. Il est intéressant de
mentionner également que, bien qu'il y ait les collaborations
académiques et scientifiques nécessaires, ce n'est pas un
projet de recherche en soi. Nous assemblons les meilleures techniques
pour construire un système d'information qui, pour l'utilisateur,
couvrira les 350 000 espèces existantes, et pour les auteurs,
offrira tous les facilités sur Internet pour contrôler,
versionner, valider, approuver, agréger, publier l'information.
Il s'agit donc d'un système d'information assez
générique au développement duquel des acteurs assez
variés peuvent avoir intérêt à participer.
Jean-Marc Vanel
http://jmvanel.free.fr/
Worldwide Botanical Knowledge Base
http://wwbota.free.fr/