Dématérialisation, tAlfrescoOutput et Gestion de Contenu - 6.3

Composants Talend Open Studio Guide de référence

EnrichVersion
6.3
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

La dématérialisation est le processus qui sert à convertir les documents concrets au format numérique, permettant ainsi de passer d'une utilisation de documentation physique à des systèmes de Gestion de Contenu électroniques. Un système de Gestion de Contenu permet de gérer un large éventail de documents, allant des plus basiques aux certificats d'actions par exemple.

Les entreprises procèdent à la dématérialisation de leur contenu par traitement des documents, qui peut être réalisé soit à la main, soit de manière automatique grâce à une machine

Compte tenu de la diversité des contenus à dématérialiser, les entreprises sont obligées d'utiliser des technologies diverses. Scanner les documents papier, créer des interfaces pour capter les documents électroniques d'autres applications, convertir les documents images en documents textes lisibles et modifiables par une machine... Ceci n'est qu'un exemple des technologies employées.

De plus, les documents scannés ainsi que les fax numériques ne peuvent être lus par des machines. Différentes technologies de reconnaissance des caractères sont utilisées pour les convertir en données utilisables. La Reconnaissance de Caractères Manuscrits (RCM) et la Reconnaissance Optique de Marques (ROM) en sont deux exemples.

Les métadonnées de support, qui permettent d'identifier le contenu de manière efficace grâce à des requêtes spécifiques, sont au moins aussi importantes que le contenu capté lors de la dématérialisation, en différents formats et à partir de nombreuses sources.

Dès lors, comment agréger et indexer dans un système de Gestion de Contenu le contenu d'un document en même temps que ses métadonnées associées, pour qu'il puisse être extrait et traité de manière significative ? Talend vous apporte la réponse par le biais de son composant tAlfrescoOutput.

Le composant tAlfrescoOutput vous permet de stocker et de gérer vos documents électroniques, ainsi que les métadonnées qui y sont associées, sur le serveur Alfresco, système leader sur le marché de la Gestion de Contenu.

La figure ci-dessous illustre le rôle de Talend à la fois dans le processus de dématérialisation et dans le système Gestion de Contenu (Alfresco).