Accéder au contenu principal

Indexation de fichiers .ZIP avec Oracle Secure Enterprise Search (SES)

Version utilisée : Oracle SES 10.1.8.4

Oracle Secure Enterprise Search (SES) permet d’indexer le contenu de fichiers qui ont été compressés au format .zip.

On peut distinguer deux cas de figure :

  • Un fichier, quel que soit son format natif, fait l’objet d’une compression dans un fichier .zip
  • Un container au format .zip contient plusieurs fichiers dont les formats font parti de ceux supportés nativement par Oracle SES.

Les deux cas de figure sont supportés. Dans le deuxième, il existe une limitation de 1000 documents maximum par fichier .zip.

Illustration

Scénario 1

Considérons la source de type FileSystem nommée CVs.

clip_image002

On doit préciser au préalable précise, pour cette source, les formats de fichiers qui feront l’objet d’une indexation (ZIP Archive, en particulier)

clip_image002[4]

On ajoute un fichier dans un format .zip (actualite.txt) à la source nommée CVs :

clip_image004

Oracle SES retrouve bien le document et affiche un extrait du début de texte (dont la longueur est paramétrable)

clip_image002[6]

Scénario 2 :

On ajoute un fichier .zip qui contient trois fichiers distincts

clip_image002[8]

On effectue une recherche sur un autre mot clef, et SES retrouve bien deux documents parmi les trois qui contenaient le mot recherché

clip_image004[4]

Remarque: si le même fichier actualité.txt figure dans plusieurs sources indexées par Oracle SES, et qu’il y a identité parfaite de contenu (en fonction d’une checksum calculée par SES), le moteur de recherche de retournera qu’une seule version du document. Cela est une fonctionnalité intéressante qui permet d’alléger la listes de recherche qui est renvoyée à l’utilisateur.

Références

Informations supplémentaires sur le moteur de recherche Oracle SES.

Commentaires

Posts les plus consultés de ce blog

Oracle Documents Cloud Service - Using Upload File REST API

If the Upload File sample given in ODCS documentation is used "as is", we get a http 400 error. The syntax is strict and every blank line must be empty (no space character for instance). If we cust and paste the sample, there are residual space characters which must be removed. So, use this pattern instead: -----1234567890 Content-Disposition: form-data; name="jsonInputParameters" { "parentID": " " } -----1234567890 Content-Disposition: form-data; name="primaryFile"; filename="example.txt" Content-Type: text/plain Hello World! -----1234567890-- instead the original one: -----1234567890 Content-Disposition: form-data; name="jsonInputParameters" { "parentID":"FB4CD874EF94CD2CC1B60B72T0000000000100000001" } -----1234567890 Content-Disposition: form-data; name="primaryFile"; filename="example.txt" Content-Type: text/plain -----1234567890-- Tests can be...

Streaming mp3 fromVLC / Icecast to Android

Here are some tips for streaming music to android mobile devices from a PC. Platform which has been used fo test: Ubuntu 11.10 oneiric + a NAS for storing music (windows can fit as well) Videolan VLC 1.1.12 (providing mp3 flow) icecast 2.3.2 (shoutcast radio) Winamp 1.2.12 for Android mobile(music player) Android-vlc-remote for Android (remote control for VLC) Start icecast server icecast2 -c icecast.xml The icecast xml config file is the original one. don't modify anything at this stage.  Setup VLC in order to stream mp3 instead ogg format Close VLC Prepare a playlist (ie: scarlatti.m3u) with Banshee or whatever. Launch VLC in command line vlc scarlatti.m3u --sout '#standard{access=shout,mux=ogg,dst=source:hackme@192.168.0.3:8000/scarlatti}' --sout-keep --extraintf=luahttp --fullscreen --http-album-art     Check that icecast is displaying a mount point for the new radio Check the HTTP...

Oracle Sites Cloud Service - Adding authentication to a site

With Oracle Sites Cloud Services, access to any site is Public, by default. If you have to add authentication, there is a very simple way to achieve it: First, we assume that authentication will be against the existing Identity Domain provided with the tenant. In a dedicated page of a site, called Login for instance, we add an App component which embeds an URL to any folder of Documents Cloud Service. ie: App URL =  https://documents.XX.oraclecloud.com/documents/ embed /home/nameasc Note that the URL will be called with the EMBED keyword . Then we add the App component is a region, and  we setup a height=1 and a width=1 (almost invisible). That's all. Each time a user will navigate to this custom   Login Page, and if the user is not yet authenticated, a new page will splash on the screen, asking for credentials. Once login and pasword are provided by the user, the page disapears and return to custom Login page. Optionnaly it's possible to add a dedicate...