Splendeurs et Périls des Metadonnées

Je pensais que les metadata c'était "bien" et que ne pas en mettre c'était "mal".
Et puis j'ai lu ce papier instructif (risques entrainés par les metadata) sur les brèches de sécurité ouvertes par la présence abusive de metadata et d'informations cachées dans un document.
En conclusion de cette étude qui a été menée sur des sites internet publics du Fortune 100,  il s'avère qu'il vaut mieux nettoyer de leur métadonnées les documents destinés à être diffusé largement sur un site internet. Cela concerne principalement les documents produits avec MS Office.
Le produit Clean Content , inclus dans la technologie Oracle Outside In, vise cet objectif. Au préalable, cet outil permet d'évaluer les risques potentiels associés à n'importe quel type de document et d'effectuer un metadata cleanup, si on le souhaite
Testez-le sur un document MSOffice de votre compagnie ou organisation, et vous verrez combien un fichier .ppt ou .doc devient très bavard ! (nom de l'auteur, historique des modifications, commentaires, ajouts enregistrés en mode Fast Save, chemins de repertoires, etc.)
Il peut être utilisé également pour d'autres actions, telles que le split d'une présentation PowerPoint en autant de fichier .ppt qu'il y a de slides. Cette approche peut permettre la constitution d'une bibliothèque de slides avec, à la clef, une possible génération dynamique de présentations selon des critères d'assemblage.

En résumé, la technologie Outside In trouve parfaitement sa place dans une architecture SOA: le document constitue un objet vivant qui sera conçu par un humain, ou bien généré par un processus, pour être ensuite passé de mains en mains et être retravaillés par des services spécialisés (Web Services de Outside In) qui l'enrichiront ou bien le toiletteront selon les circonstances d'utilisation.

