2.3 Configuration du serveur TE

2.3.1 Initialisation

Les paramètres du serveur TE sont définis dans le fichier $TE_HOME/etc/te.conf.

Lors de la première utilisation, le fichier d'exemple te.conf.sample être copié dans le fichier te.conf :

# cp $TE_HOME/etc/te.conf.sample $TE_HOME/etc/te.conf

2.3.2 Paramètres

Le fichier de configuration est composé des paramètres suivants :

2.3.2.1  Base de données

# Transformation Engine Configuration
# - - - - - - - - - - - - - - - - - -
TE_PG_SERVICE="te"                # Postgresql database service name

2.3.2.2 Serveur de communication

PORT=51968                        # port number where listen client
LISTEN_ADDRESS=0.0.0.0            # address mask to listen : listen everybody by default
REQUEST_MAX_CLIENT=15             # max request in parallel 
TE_WORK_DIR=/var/tmp              # Directory where task's files and engine's temporary files are stored 
  • PORT : port d'écoute sur serveur
  • LISTEN_ADDRESS : plage d'adresse (mask) d'écoute du serveur
  • REQUEST_MAX_CLIENT : nombre maximum de connexions client simultanées
  • TE_WORK_DIR : répertoire de stockage des fichiers reçus

2.3.2.3 Mécanisme de purge

PURGE_DAYS=7                      # remove tasks older than 7 days
PURGE_INTERVAL=100                # trigger tasks purge every 100 requests (set to 0 to disable purge)

Ces paramètres permettent de définir le fonctionnement de la purge (suppression des transformations dont la date de création est inférieure à une limite donnée).

Si la tâche est en cours d'exécution, le processus de la tâche est tué.

Ensuite, quelque soit le status de la transformation, la transformation est supprimée avec son répertoire de travail.

  • PURGE_DAYS : les travaux antérieurs à ce nombre de jours sont purgés.
  • PURGE_INTERVAL : précise la fréquence de la purge, la purge est lancée toute les n transformations exécutés.

2.3.2.4 Serveur de transformation

RENDERING_MAX_CLIENT=10           # max conversion in parallel 
  • RENDERING_MAX_CLIENT Nombre de moteurs de transformation activé en parallèle

2.3.2.5 Identité pour les serveurs

TE_SERVER_USER=root
TE_SERVER_DEBUG=no
  • TE_SERVER_USER : permet de spécifier l'identité (unix user) sous laquelle les serveurs sont exécutés.
  • TE_SERVER_DEBUG : permet de rediriger (yes ou no) la sortie standard (STDOUT) et d'erreur (STDERR) des services te-request-server, te-rendering-server, te-ooo-server et te-tika-server dans syslog (pour analyser les éventuels problèmes de démarrage de ces services).

2.3.2.6 Serveur OpenOffice.org / LibreOffice.org

Sites officiels des logiciels : OpenOffice.org / LibreOffice.org.

TE_OOO_SERVER_ENABLED=yes
TE_OOO_BASE_DIR=/replace/me/with/path/to/openoffice.org/directory
TE_OOO_SERVER_SOFFICE=${TE_OOO_BASE_DIR}/program/soffice
TE_OOO_JVM_OPTS=""
TE_OOO_SERVER_HOST=127.0.0.1
TE_OOO_SERVER_PORT=8123

Les chemin d'accès aux fichiers OpenOffice.org sont relatifs.

Le paramètre principal TE_OOO_BASE_DIR est utilisé pour définir les paramètres secondaires :

  • TE_OOO_SERVER_ENABLED : permet d'activer (yes) ou désactiver (no) le lancement du serveur OpenOffice. Attention : cela ne désactive pas l'exécution des moteurs de conversion qui utilisent OpenOffice. Ces derniers seront alors mis en erreur.

  • TE_OOO_BASE_DIR : chemin d'accès au répertoire racine d'installation de OpenOffice ou LibreOffice (e.g. /opt/libreoffice5.3). 1.4.1Ce paramètre est facultatif. Il sert, dans le configuration par défaut, à repérer le programme soffice qui est défini par variable TE_OOO_SERVER_SOFFICE .

  • TE_OOO_SERVER_SOFFICE : chemin d'accès au programme soffice de OpenOffice/LibreOffice.

  • TE_OOO_JVM_OPTS : variable pour positionner des paramètres spécifiques pour la JVM si besoin.

  • TE_OOO_SERVER_HOST : adresse IP d'écoute du serveur OpenOffice/LibreOffice.

  • TE_OOO_SERVER_PORT : port TCP d'écoute du serveur OpenOffice/LibreOffice.

  • TE_OOO_PRODUCTKEY : 1.4.1 Paramètre optionnel. Valeur possible "LibreOffice" ou "OpenOffice". Il permet de d'indiquer explicitement le logiciel utilisé. Il est renseigné automatiquement s'il n'est pas indiqué.

2.3.2.6.1 Ancienne version 1.4.0

  • 1.4.0 TE_OOO_CLASSPATH : classpath Java pour accéder aux librairies Java d'OpenOffice. Les classes nécessaires sont contenus dans les fichiers java suivants : unoil.jar, juh.jar, jurt.jar et ridl.jar.

    La valeur de TE_OOO_CLASSPATH est différente suivant l'utilisation d' OpenOffice ou de LibreOffice :

    • Exemple de valeur pour OpenOffice :
    TE_OOO_CLASSPATH="${TE_OOO_BASE_DIR}/program/classes/unoil.jar:${TE_OOO_BASE_DIR}/program/classes/juh.jar:${TE_OOO_BASE_DIR}/program/classes/jurt.jar:${TE_OOO_BASE_DIR}/program/classes/ridl.jar"
    • Exemple de valeur pour LibreOffice :
    TE_OOO_CLASSPATH="${TE_OOO_BASE_DIR}/program/classes/unoil.jar:${TE_OOO_BASE_DIR}/ure/share/java/juh.jar:${TE_OOO_BASE_DIR}/ure/share/java/jurt.jar:${TE_OOO_BASE_DIR}/ure/share/java/ridl.jar"

    Sous debian (ou ubuntu), pour LibreOffice, les classes java sont fournies par le paquet "ure" (LibreOffice UNO runtime environment).

    1.4.1 Ce paramètre est détecté automatiquement et ne nécessite plus d'être renseigné.

  • TE_OOO_JVM_OPTS : variable pour positionner des paramètres spécifiques pour la JVM si besoin.

Serveur Tika

Ces variables dépendent de l'installation de Tika server.

TE_TIKA_SERVER_ENABLED=yes
TE_TIKA_SERVER_JAR="/replace/me/with/path/to/tika-server-#version#.jar"
TE_TIKA_SERVER_HOST=127.0.0.1
TE_TIKA_SERVER_PORT=9998
TE_TIKA_SERVER_LOGLEVEL="" # 'debug' or 'info'
  • TE_TIKA_SERVER_ENABLED : permet d'activer (yes) ou désactiver (no) le lancement du serveur Tika. Attention : cela ne désactive pas l'exécution des moteurs de conversion qui utilisent Tika. Ces derniers seront alors mis en erreur.
  • TE_TIKA_SERVER_JAR : chemin d'accès au fichier JAR de Tika Server.
  • TE_TIKA_SERVER_HOST : adresse IP d'écoute du serveur Tika.
  • TE_TIKA_SERVER_PORT : port TCP d'écoute du serveur Tika.
  • TE_TIKA_SERVER_LOGLEVEL : loglevel spécifique du serveur Tika (à utiliser conjointement avec TE_SERVER_DEBUG=yes décrit ci-dessus).

2.3.3 Type mimes

La détection du type MIME textuel et du type MIME système des fichiers par TE est paramétrable via des règles appliquées sur l'extension du nom du fichier.

Ces règles sont décrites au format XML dans le fichier $TE_HOME/etc/user-mime.conf.

Un fichier d'exemple est fourni par défaut dans $TE_HOME/etc/user-mime.conf.sample.

Exemple de définition des types MIME textuel et système pour les fichiers d'extension .foo et .bar :

<?xml version="1.0" encoding="utf-8"?>
<mimes>
    <mime ext="foo" sys="application/foo" text="Foo file" />
    <mime ext="bar" sys="application/bar" text="Bar file" />
</mimes>

Chaque règle est décrite à l'aide d'un élément <mime/> comportant l'extension (sans le point de l'extension) sur laquelle elle s'applique (attribut ext) et le type MIME textuel et système correspond qui est retourné (attribut text et sys).

Les règles sont évalués dans l'ordre et s'arrête à la première règle qui correspond à l'extension du fichier.

Ces règles $TE_HOME/etc/user-mime.conf viennent en complément et sont évalués en priorité par rapport au jeu de règles fournit par défaut par TE (consultable dans le fichier $TE_HOME/etc/mime.conf).

×