XML Publication - Enhancement, requirements, future
by J.M. Vanel , Copyright ©
J.M. Vanel - 2001-2002 Back to main
page
Last update:
For Seed2Seed:
- integration of XPath query engine: eXist
- make indexation in the init() of the servlet or by hand ?
- first stage: simplest integration: just type a word and eXist looks
in all rubrics
- 2nd stage: type a word and choose a rubric; eXist looks in that
rubric
- 3rd stage: have a combo box to choose a word and choose a rubric;
eXist looks in that rubric
- XML Publication can be used to get a list of words present by
rubric
- the HTML page will also need to have access to declared
keywords for each rubric
- need some javascript or Java to make a combo box
- test or develop the multi-document aspect
- reconcile several metadata (rubric naming different but equivalent
in each source document); can be done later
- merge several source documents; problem is that some have table
structure, and other have text-with-paragraph structure
- take in account the new page layout for Seed2Seed multi-document : http://www.seed2seed.net/base/Allium_Cepa-base.html
- il faut absolument traiter correctement les minuscules/majuscules dans
les tables; c'est à dire que les entrées "Aphids" et "aphids", qui
contiennent toutes deux : CHILIPEPPERS –, DERRIS –, GARLIC –, TOBACCO
–, ne doivent pas apparaitre toutes deux dans la page
index-Target_Organisms.html
- prise en compte des expressions pour les index: exemple 'proof of
concept' ; not only single words
Un formulaire Swing ou HTML avec :
- URL de la source (X)HTML en précisant "extract tables" ou "extract
paragraphs with titles" ou
- URL de la source .doc en précisant ... idem ou
- URL d'un répertoire où XMLPublication prendra tout ce qu'il peut : .htm
, .html , .xsl , .doc , toujours en précisant ... idem
- URL de thesaurus.xml : facultatif
- URL d'une feuille XSLT qui sera incluse par <xsl:include> :
facultatif
- URL de presentation.html : avec une valeur par défaut : un URL avec
une bannière de site "XMLPublication"
- URL de book-title.html : avec une valeur par défaut : un document
contenant le nom du document source
- URL du noyau XMLPublication : avec une valeur par défaut : le
répertoire http://wwbota.free.fr/xslt/
- un bouton "generate skeleton thesaurus.xml" : créer un fichier
thesaurus.xml comme point de départ pour être édité; il va spécifier
qu'on indexe tous les mots de touts les champs
- un bouton "generate statistics" qui parcourt le document source
pour repérer les éléments, leur imbrication et leur nombre ==) utilise
example2Schema.xslt
- un bouton "generate words list by rubric", qui pourra être utilisé
comme aide à l'édition de thesaurus.xml ==) utilise
make-words-list.xslt
Enfin le + important:
- un bouton "make Web site"
- un bouton "Save" enregistre tout le formulaire avec un format
XML simple
- un bouton "Open" ouvre une session avec tout le formulaire dans
un format XML simple
Ensuite l'exercice suivant sera de refaire la même chose sur un serveur Web,
avec un rôle d'auteur qui publie sur un URL temporaire, sous-site qui sera
ensuite validé et publié pour de bon par le webmestre.
Back to main page