XML Publication - Enhancement, requirements, future
by J.M. Vanel , Copyright
© J.M. Vanel - 2001-2002 Back to
main page
Last update:
jeu 09 mai 2002 15:55:36 CEST
For Seed2Seed:
- integration of XPath query engine: eXist
- make indexation in the init() of the servlet or by hand ?
- first stage: simplest integration: just type a word and eXist
looks in all rubrics
- 2nd stage: type a word and choose a rubric; eXist looks in that
rubric
- 3rd stage: have a combo box to choose a word and choose a rubric;
eXist looks in that rubric
- XML Publication can be used to get a list of words present
by rubric
- the HTML page will also need to have access to declared
keywords for each rubric
- need some javascript or Java to make a combo box
- test or develop the multi-document aspect
- reconcile several metadata (rubric naming different but equivalent
in each source document); can be done later
- merge several source documents; problem is that some have table
structure, and other have text-with-paragraph structure
- take in account the new page layout for Seed2Seed multi-document :
http://www.seed2seed.net/base/Allium_Cepa-base.html
- il faut absolument traiter correctement les minuscules/majuscules
dans les tables; c'est à dire que les entrées "Aphids"
et "aphids", qui contiennent toutes deux : CHILIPEPPERS –, DERRIS
–, GARLIC –, TOBACCO –, ne doivent pas apparaitre toutes deux dans la
page index-Target_Organisms.html
- prise en compte des expressions pour les index: exemple 'proof of
concept' ; not only single words
Un formulaire Swing ou HTML avec :
- URL de la source (X)HTML en précisant "extract tables" ou "extract
paragraphs with titles" ou
- URL de la source .doc en précisant ... idem ou
- URL d'un répertoire où XMLPublication prendra tout ce
qu'il peut : .htm , .html , .xsl , .doc , toujours en précisant
... idem
- URL de thesaurus.xml : facultatif
- URL d'une feuille XSLT qui sera incluse par <xsl:include>
: facultatif
- URL de presentation.html : avec une valeur par défaut :
un URL avec une bannière de site "XMLPublication"
- URL de book-title.html : avec une valeur par défaut :
un document contenant le nom du document source
- URL du noyau XMLPublication : avec une valeur par défaut
: le répertoire http://wwbota.free.fr/xslt/
- un bouton "generate skeleton thesaurus.xml" : créer
un fichier thesaurus.xml comme point de départ pour être
édité; il va spécifier qu'on indexe tous les mots
de touts les champs
- un bouton "generate statistics" qui parcourt le document source
pour repérer les éléments, leur imbrication et leur
nombre ==) utilise example2Schema.xslt
- un bouton "generate words list by rubric", qui pourra être
utilisé comme aide à l'édition de thesaurus.xml
==) utilise make-words-list.xslt
Enfin le + important:
- un bouton "make Web site"
- un bouton "Save" enregistre tout le formulaire avec un format
XML simple
- un bouton "Open" ouvre une session avec tout le formulaire
dans un format XML simple
Ensuite l'exercice suivant sera de refaire la même chose sur un serveur
Web, avec un rôle d'auteur qui publie sur un URL temporaire, sous-site
qui sera ensuite validé et publié pour de bon par le webmestre.
Back to main page