Accéder au contenu principal

Indexation de fichiers .ZIP avec Oracle Secure Enterprise Search (SES)

Version utilisée : Oracle SES 10.1.8.4

Oracle Secure Enterprise Search (SES) permet d’indexer le contenu de fichiers qui ont été compressés au format .zip.

On peut distinguer deux cas de figure :

  • Un fichier, quel que soit son format natif, fait l’objet d’une compression dans un fichier .zip
  • Un container au format .zip contient plusieurs fichiers dont les formats font parti de ceux supportés nativement par Oracle SES.

Les deux cas de figure sont supportés. Dans le deuxième, il existe une limitation de 1000 documents maximum par fichier .zip.

Illustration

Scénario 1

Considérons la source de type FileSystem nommée CVs.

clip_image002

On doit préciser au préalable précise, pour cette source, les formats de fichiers qui feront l’objet d’une indexation (ZIP Archive, en particulier)

clip_image002[4]

On ajoute un fichier dans un format .zip (actualite.txt) à la source nommée CVs :

clip_image004

Oracle SES retrouve bien le document et affiche un extrait du début de texte (dont la longueur est paramétrable)

clip_image002[6]

Scénario 2 :

On ajoute un fichier .zip qui contient trois fichiers distincts

clip_image002[8]

On effectue une recherche sur un autre mot clef, et SES retrouve bien deux documents parmi les trois qui contenaient le mot recherché

clip_image004[4]

Remarque: si le même fichier actualité.txt figure dans plusieurs sources indexées par Oracle SES, et qu’il y a identité parfaite de contenu (en fonction d’une checksum calculée par SES), le moteur de recherche de retournera qu’une seule version du document. Cela est une fonctionnalité intéressante qui permet d’alléger la listes de recherche qui est renvoyée à l’utilisateur.

Références

Informations supplémentaires sur le moteur de recherche Oracle SES.

Commentaires

Posts les plus consultés de ce blog

Oracle Documents Cloud Service - Using Upload File REST API

If the Upload File sample given in ODCS documentation is used "as is", we get a http 400 error. The syntax is strict and every blank line must be empty (no space character for instance). If we cust and paste the sample, there are residual space characters which must be removed. So, use this pattern instead: -----1234567890 Content-Disposition: form-data; name="jsonInputParameters" { "parentID": " " } -----1234567890 Content-Disposition: form-data; name="primaryFile"; filename="example.txt" Content-Type: text/plain Hello World! -----1234567890-- instead the original one: -----1234567890 Content-Disposition: form-data; name="jsonInputParameters" { "parentID":"FB4CD874EF94CD2CC1B60B72T0000000000100000001" } -----1234567890 Content-Disposition: form-data; name="primaryFile"; filename="example.txt" Content-Type: text/plain -----1234567890-- Tests can be...

Oracle Sites Cloud Service - Apps

It's possible to add kinds of widgets (named APPS) inside any page of a site built with Oracle Sites Cloud Service (SCS). Any app is materialized by two URL: a Renderer Url which will render any HTML fragment inside an iframe tag at runtime a settings url which will be rendrered at design time in the settings menu. all URLs must be called through https (meaning that the called server has to be ssl enabled) In the following samples, we integrate: a dummy app (a simple html page produced with node.js) which demonstrates the parameteres caried by the Sites Cloud engine when calling the backend server,  a regular Apex report or form,  a custom report which calls a rest api generated by Apex /ORDS Sample node.js server.js below is a sample of parameter values get from a dummy node.js server Main call id=26e45e21-dbb6-4877-9886-482b37213d2f instance=eyJpbnN0YW5jZWlkIjoiQTI0NUNFNUNFNjA5MjE1REZBRTA2RTQyRjExOThBNThFNzc4RDc5NzFDMkIiLCJzaWduZGF0ZSI6IjE0NTAxMDg1M...

Configuring Oracle Cloud as the Service Provider with SimpleSAMLphp as IDP

In order to establish SSO between enteprise backend and Oracle Public Cloud, it's possible to use SimpleSAMLphp (Federation tool) as an in-house Identity Provider , and setup Oracle Cloud as the Service Povider . Cf official documentation Managing Single Sign-On about the concept. SSO relies on SAML 2.0 standard. Tasks At the Identity Server (IDP) level Install Apache and PHP 5.3 + Install SimpleSAMLphp Just Follow documentation and  yum install php53-mcrypt   instead php-mcrypt if linux complains about it. Test with a simple SP provided with SimplePHPphp. Don't forget to un-comment the  example-userpass ! Export the metadata in a XML file At the Cloud Service level Import the previous metadata file Accept default values and don't change anything. At the IDP server level:  Follow documentation Servive Provider Quickstart Update the config/authsources.php with infos provided in the parameter pages (entity Id) EntityID value must be the sam...