Etat du projet Base Botanique mondiale (WWBKB)

J.M. Vanel - 2003-02-17 (jmvanel@free.fr)

L'application , un moteur de recherche sur la Flore de Chine, tourne sur ma machine perso, qui est seulement une 500MHz -:( . Le serveur tourne la plupart du temps, mais c'est la machine de développement ...

La vision initiale (1999) du projet est ici:
http://wwbota.free.fr/Appel.htm

Sur le site http://wwbota.free.fr/ vous trouverez des informations complètes sur le projet, en Anglais.

L'état du projet 

Le moteur de recherche offre des requêtes à La Google sur des grandes bases XML, qui sont traduites en XPath, puis transférées à la base de données XML, puis formattées joliment grace au moteur Cocoon de apache.org. C'est 100% open source, et géré par une communauté de dévelopeurs sur sourceforge.net .
En amont de cela il y a un analyseur syntaxique, FloraParse, écrit en C++ avec Lex/Yacc, qui utilise le dictionaire sémantique WordNet de l'Université de Princeton. FloraParse transforme les descriptions en language naturel en un format XML où les informations sont marquées comme organe, sous-organe, lieu géographique, etc.
Tout cela est pleinement opérationnel.
WWBKB est en avance sur plusieurs points par rapport aux efforts des taxonomistes académiques, dû au bon niveau informatique de son fondateur. Je suis en permanence leurs avancées; les collaborations incluent:

L'intérêt pour  un mécène

Arguments 

J'insiste sur ce mélange original de souci écologique, de techniques de pointe, d'aspect éducatif et sémantique, de réseau collaboratif pour la connaissance, et de logiciel libre. La prochaine étape dans le projet concerne l'identification et la génération d'images 2D et 3D. Il est intéressant de mentionner également que, bien qu'il y ait les collaborations académiques et scientifiques nécessaires, ce n'est pas un projet de recherche en soi. Nous assemblons les meilleures techniques pour construire un système d'information qui, pour l'utilisateur, couvrira les 350 000 espèces existantes, et pour les auteurs, offrira tous les facilités sur Internet pour contrôler, versionner, valider, approuver, agréger, publier l'information. Il s'agit donc d'un système d'information assez générique au développement duquel des acteurs assez variés peuvent avoir intérêt à participer.

Jean-Marc Vanel
http://jmvanel.free.fr/

Worldwide Botanical Knowledge Base
http://wwbota.free.fr/