Informatique décisionnelle
L'informatique décisionnelle sert à désigner les moyens, les outils et les méthodes qui permettent de collecter, consolider, modéliser...

Catégories :
Décision - Statistiques - Ingénierie décisionnelle - Management du système d'information
Page(s) en rapport avec ce sujet :
- Mais plus l'entreprise accumule des données, plus les analystes et les patrons veulent faire.... L'informatique décisionnelle est la totalité des méthodes, .... de données, les informations sont organisées par fonction dans l'entreprise... (source : grim.developpez)
- L'administrateur de bases de données a en charge la définition, ... cette fonction implique une idéale connaissance de l'entreprise et de son... Le Data Warehouse, une des applications de l'informatique décisionnelle, est conçu pour... (source : lerucher)
- Les données obtenues et traitées par l'informatique décisionnelle sont stockées... L'informatique décisionnelle est importante pour une entreprise car les ... (source : emploi-altran)
L'informatique décisionnelle (en anglais : DSS pour Decision Support System ou encore BI pour Business Intelligence[1]) sert à désigner les moyens, les outils et les méthodes qui permettent de collecter, consolider, modéliser et restituer les données, matérielles ou immatérielles, d'une entreprise en vue d'offrir une aide à la décision et de permettre aux responsables de la stratégie d'entreprise d'avoir une vue d'ensemble de l'activité traitée.
Ce type d'application utilise en règle générale un entrepôt de données (ou datawarehouse en anglais) pour stocker des données transverses provenant de plusieurs sources hétérogènes et fait appel à des traitements par lots pour la collecte de ces informations.
L'informatique décisionnelle s'insère dans l'architecture plus large d'un système d'information. Néanmoins l'informatique décisionnelle n'est pas un concept concurrent du management du dispositif d'information. Tout comme le management relève de la sociologie et de l'économie, la gestion par l'informatique est constitutive de deux domaines radicalement différents que sont le management et l'informatique. Afin d'enrichir le concept avec ces deux modes de pensées, il est envisageable d'envisager un versant orienté ingénierie de l'informatique portant le nom d'informatique décisionnelle, et un autre versant servant surtout les approches de gestion nommé management du dispositif d'information.
Enjeux de l'informatique décisionnelle
Actuellement, les données applicatives métier sont stockées dans une (ou plusieurs) base (s) de données relationnelle (s) ou non relationnelles.
Ces données sont extraites, transformées et chargées dans un entrepôt de données le plus souvent par un outil de type ETL (Extract-Transform-Load) ou en français ETC (Extraction-Transformation-Chargement).
Un entrepôt de données peut prendre la forme d'un datawarehouse ou d'un datamart. En règle générale, le datawarehouse globalise l'ensemble des données applicatives de l'entreprise, alors que les datamarts (généralement alimentés depuis les données du datawarehouse) sont des sous-ensembles d'informations concernant un métier spécifique de l'entreprise (marketing, risque, contrôle de gestion, ... ). Le terme comptoir de données ou magasin de données est aussi utilisé pour désigner un datamart.
Les entrepôts de données permettent de produire des rapports qui répondent à la question «Que s'est-il passé ?», mais ils peuvent être aussi conçus pour répondre à la question analytique «Pourquoi est-ce que cela s'est passé ?» ainsi qu'à la question pronostique «Que va-t-il se passer ?». Dans un contexte opérationnel, ils répondent aussi à la question «Que se passe-t-il en ce moment ?», ou alors dans le cas d'une solution d'entrepôt de données actif «Que devrait-il se passer ?».
Le reporting est certainement l'application la plus utilisée toujours actuellement de l'informatique décisionnelle, il permet aux gestionnaires :
- de sélectionner des données relatives à telle période, telle production, tel secteur de clientèle, etc.,
- de trier, regrouper ou répartir ces données selon les critères de leur choix,
- de réaliser divers calculs (totaux, moyennes, écarts, comparatif d'une période à l'autre, ... ),
- de présenter les résultats d'une manière synthétique ou détaillée, le plus fréquemment graphique selon leurs besoins ou les attentes des dirigeants de l'entreprise.
Les programmes utilisés pour le reporting permettent évidemment de reproduire de période en période les mêmes sélections et les mêmes traitements et de faire fluctuer certains critères pour affiner l'analyse. Mais le reporting n'est pas à proprement parler une application d'aide à la décision. L'avenir appartient plutôt aux instruments de type tableau de bord équipés de fonctions d'analyses multidimensionnelles de type Olap. Fonction OLAP qui peut être obtenue de différentes façons par exemple via une base de données relationnelle R-OLAP, ou multidimensionnelle M-OLAP, ou alors aussi en H-OLAP.
Les datamart et/ou les datawarehouses peuvent ainsi permettre via l'OLAP l'analyse particulièrement approfondie de l'activité de l'entreprise, grâce à des statistiques recoupant des informations relatives à des activités apparemment particulièrement différentes ou particulièrement éloignées les unes des autres, mais dont l'étude fait fréquemment apparaître des dysfonctionnements, des corrélations ou des possibilités d'améliorations particulièrement sensibles.
L'interopérabilité entre les dispositifs d'entrepôt de données, les applications informatiques ou de gestion de contenu, et les dispositifs de reporting est réalisée grâce à une gestion des métadonnées.
Du tableau à l'hypercube
L'informatique décisionnelle à pour but de mesurer :
- un certain nombre d'indicateurs ou de mesures (que on nomme aussi les faits ou les métriques),
- restitués selon les axes d'analyse (que on nomme aussi les dimensions).
Le tableau
A titre d'exemple, on peut vouloir mesurer :
- 3 indicateurs : le chiffre d'affaires, le nombre de ventes, le montant de taxes pour les ventes de produits,
- selon un premier axe, l'axe temps : par année, par trimestre, par mois,
- et selon un second axe, l'axe produits : famille de produits, gamme de produits, référence produit.
On obtient ainsi un tableau à deux entrées :
- par exemple en lignes : la nomenclature produits à 3 niveaux (famille, gamme, référence),
- et en colonnes : les années, décomposées en trimestres, décomposés en mois,
- avec au croisement des lignes et colonnes, pour chaque cellule : le chiffre d'affaires, le montant de taxes et le nombre de ventes.
A titre d'illustration, les tableaux croisés des principaux tableurs permettent de construire ce type de tableau de bord depuis une base de données.
Le cube
Si on s'intéresse à un troisième axe d'analyse :
- par exemple, la répartition géographique : par pays, par régions, par magasins,
on obtient une dimension de plus et on passe ainsi au cube.
Les tableaux croisés dynamiques d'Excel permettent de représenter ce type de cube avec le champ "page".
L'hypercube
Si on s'intéresse à un axe d'analyse supplémentaire :
- par exemple, la segmentation des clients : par catégorie, par profession,
on obtient alors un cube à plus de 3 dimensions, nommé hypercube.
Le terme cube est fréquemment utilisé en lieu et place d'hypercube.
Les outils du monde décisionnel offrent des possibilités de «navigation» dans les différentes dimensions du cube ou de l'hypercube :
- le drill down ou le forage avant : c'est la possibilité de «zoomer» sur une dimension (par exemple d'éclater les années en 4 trimestres pour avoir une vision plus fine, ou de passer du pays aux différentes régions),
- le drill up ou le forage arrière (aussi nommé "roll-up") : c'est l'opération inverse qui permet d'«agréger» les composantes de l'un des axes (par exemple de regrouper les mois en trimestre, ou de totaliser les différentes régions pour avoir le total par pays),
- le slice and dice, aussi nommé "dice down" (que on peut traduire par «hacher menu», c'est-à-dire couper en lamelles puis en dés) : c'est une opération plus complexe qui entraîne une permutation des axes d'analyse (par exemple, on peut vouloir remplacer une vue par pays/régions par une nouvelle vue par familles et gammes de produits)
- le drill through : quand on ne dispose que de données agrégées (indicateurs totalisés), le drill through permet d'accéder au détail élémentaire des informations (chaque vente de chaque produit à chaque client dans chaque magasin).
Précautions à prendre
Chacune de ces vues partielles du cube se traduit finalement, soit par un tableau à double entrée (tri croisé), soit par un graphique le plus fréquemment bidimensionnel.
Ainsi, quoique la navigation dans le cube soit multidimensionnelle, le décideur n'a pas, en réalité, accès à une synthèse, mais à une grande variété de tris croisés ou de vues bidimensionnelles dont l'exploration, longue et fastidieuse, est quelquefois court-circuitée faute de temps. Cela peut conduire à de coûteuses erreurs de décision.
Aussi peut-il être utile d'associer à cette démarche une iconographie des corrélations, qui permet une vue d'ensemble réellement multidimensionnelle, débarrassée des redondances.
Fonctions principales de l'informatique décisionnelle
Un dispositif d'information décisionnel (SID) assure quatre fonctions principales, à savoir la collecte, l'intégration, la diffusion et la présentation des données. À ces quatre fonctions s'ajoute une fonction de contrôle du SID lui-même, l'administration.
Collecte
La collecte (quelquefois nommée datapumping) est la totalité des tâches consistant à détecter, à sélectionner, à extraire ainsi qu'à filtrer les données brutes issues des environnements pertinents compte tenu du périmètre du SID. Les sources de données internes et/ou externes étant fréquemment hétérogènes tant sur le plan technique que sur le plan sémantique, cette fonction est la plus délicate à mettre en place dans un dispositif décisionnel complexe. Elle s'appuie surtout sur des outils d'ETL (extract-transform-load pour extraction-transformation-chargement).
Cette alimentation utilise les données sources issues des dispositifs transactionnels de production, le plus fréquemment sous forme de :
- compte-rendu d'événement ou compte-rendu d'opération : c'est le constat au fil du temps des opérations (achats, ventes, écritures comptables, ... ), le film de l'activité de l'entreprise
- compte-rendu d'inventaire ou compte-rendu de stock : c'est l'image photo prise à un instant donné (à une fin de période : mois, trimestre, ... ) de la totalité du stock (les clients, les contrats, les commandes, les encours, ... ).
La fonction de collecte joue aussi, au besoin, un rôle de recodage. Une donnée représentée différemment d'une source à une autre impose le choix d'une représentation unique pour les futures analyses.
Intégration
L'intégration consiste à concentrer les données collectées dans un espace unifié, dont le socle informatique essentiel est l'entrepôt de données. Élément central du système, il permet aux applications décisionnelles de bénéficier d'une source d'information commune, homogène, normalisée et fiable, susceptible de masquer la diversité de l'origine des données.
Au passage les données sont épurées ou transformées par :
- un filtrage et une validation des données en vue du maintien de la cohérence d'ensemble (les valeurs acceptées par les filtres de la fonction de collecte mais susceptibles d'introduire des incohérences de référentiel comparé aux autres données doivent être soit rejetées, soit intégrées avec un statut spécial)
- une synchronisation (s'il y a obligation d'intégrer en même temps ou à la même «date de valeur» des événements reçus ou constatés de manière décalée ou déphasée)
- une certification (pour rapprocher les données de l'entrepôt des autres dispositifs «légaux» de l'entreprise comme la comptabilité ou les déclarations réglementaires).
C'est aussi dans cette fonction que sont effectués peut-être les calculs et les agrégations (cumuls) communs à la totalité du projet.
La fonction d'intégration est le plus souvent assurée par la gestion de métadonnées, qui assurent l'interopérabilité entre l'ensemble des ressources informatiques, que ce soit des données structurées (bases de données accédées par des progiciels ou applications), ou des données non structurées (documents et autres ressources non structurées, manipulés par les systèmes de gestion de contenu).
Diffusion (ou distribution)
La diffusion met les données à la disposition des utilisateurs, selon des schémas correspondant au profil ou au métier de chacun, sachant que l'accès direct à l'entrepôt de données ne correspondrait le plus souvent pas aux besoins d'un décideur ou d'un analyste. L'objectif prioritaire est de segmenter les données en contextes informationnels fortement cohérents, simples à utiliser et correspondant à une activité décisionnelle spécifique. Tandis qu'un entrepôt de données peut héberger des centaines ou des milliers de variables ou indicateurs, un contexte de diffusion raisonnable n'en présente que quelques dizaines au maximum. Chaque contexte peut correspondre à un datamart, quoiqu'il n'y ait pas de règles générales concernant le stockage physique. Fréquemment, un contexte de diffusion est multidimensionnel, c'est-à-dire modélisable sous la forme d'un hypercube; il peut alors être mis à disposition avec un outil OLAP.
Les différents contextes d'un même dispositif décisionnel n'ont pas tous besoin du même niveau de détail. De nombreux agrégats ou cumuls, n'intéressant que certaines applications et n'ayant par conséquent pas lieu d'être gérés comme agrégats communs par la fonction d'intégration, relèvent par conséquent de la diffusion. Ces agrégats peuvent être, au choix, stockés de manière persistante ou calculés dynamiquement à la demande.
On peut distinguer trois questions à élucider pour concevoir un dispositif de reporting :
- À qui s'adresse le rapport spécialisé ? (choix des indicateurs à présenter, choix de la mise en page)
- Par quel trajet ? (circuit de diffusion type «workflow» pour les personnes, circuits de transmission «télécoms» pour les moyens)
- Selon quel agenda ? (diffusion routinière ou sur événement prédéfini)
Présentation
Cette quatrième fonction, la plus visible pour l'utilisateur, régit les conditions d'accès de l'utilisateur aux informations. Elle assure le fonctionnement du poste de travail, le contrôle d'accès, la prise en charge des requêtes, la visualisation des résultats sous une forme ou une autre. Elle utilise l'ensemble des techniques de communication envisageables (outils bureautiques, requêteurs et générateurs d'états spécialisés, infrastructure web, télécommunications mobiles, etc).
Administration
C'est la fonction transversale qui supervise la bonne exécution de l'ensemble des autres. Elle pilote le processus de mise à jour des données, la documentation sur les données (les méta-données), la sécurité, les sauvegardes, la gestion des incidents.
Le projet décisionnel
Dans une entreprise, le volume de données traitées croît rapidement avec le temps. Ces données peuvent provenir, des fournisseurs, des clients, de l'environnement etc. Cette quantité de données augmente selon le secteur et de l'activité de l'entreprise. A titre d'exemple, dans la grande distribution, les quantités de données collectées chaque jour sont énormes (surtout quand les magasins collectent les tickets des caisses).
L'entreprise dispose de plusieurs options pour traiter ce flux de données :
- les données anciennes sont effacées et l'entreprise ne conserve que les données actives ou un historique récent,
- les données sont stockées dans une base et l'entreprise n'envisage pas d'usage immédiat
- les données sont stockées au fur et à mesure qu'elles arrivent de manière cohérente pour qu'elles soient exploitables directement.
Le projet décisionnel correspond à cette dernière option. Il s'agit de traiter les données et de les stocker de manière cohérente au fur et à mesure qu'elles se présentent. C'est pour cela que le projet décisionnel est un projet sans limite dans le temps. C'est-à-dire que dès que l'entreprise débute ce projet, elle ne s'arrête pas (sauf cas exceptionnel). Wal-Mart (une chaîne de la grande distribution) est l'une des entreprises qui stockent le plus de données (elle a multiplié par 100 ses données en quelques années) et va atteindre dans les années à venir le pétaoctet (1 000 téraoctets).
Pour mener à bien ces projets décisionnels, il existe une grande variété d'outils, chacun étant plus ou moins adapté à la taille de l'entreprise, à la structure des données existantes et au type d'analyse désiré.
Rappel de la chaîne de la valeur décisionnelle
- Des SGBD relationnels et d'autres dispositifs qui contiennent les données d'exploitation.
- Un ETL extrait les données pertinentes et les charge dans l'ODS du datawarehouse
- Les données sont structurées dans le datawarehouse.
- Des datamarts qui exploitent une technologie X-OLAP sont mis à jour à partir du datawarehouse.
- Des rapports sont générés sur ces données.
Phase de recueil des exigences
cf. gestion des exigences Trois domaines doivent être spécifiquement documentés :
- le type d'information dont l'utilisateur des rapports a besoin.
- le type de restitution (ergonomie, fréquence, vitesse de restitution)
- le dispositif technique existant : technologies utilisées
Phase de conception et de choix technique
En fonction des exigences recueillies, quels sont les éléments de la chaîne de la valeur décisionnelle qui doivent être implémentés ? Doit-on uniquement créer un rapport sur un cube OLAP existant ? Construire toute la chaîne ? Quelles sont exactement les données qu'on doit manipuler ? Cela conduit au choix de technologies précises ainsi qu'à un modèle spécifique.
Note
- ↑ Business intelligence ne veut pas dire intelligence économique, au contraire de ce que laisserait croire une traduction littérale, voir la section intelligence économique et business intelligence de l'article intelligence économique
Voir aussi
Bibliographie
- Jean-Marie Gouarné, Le Projet Décisionnel - Enjeux, Modèles, Architectures du Data Warehouse, Eyrolles, 1997, ISBN 978-2212050127
- Alain GARNIER, L'information non structurée dans l'entreprise - usages et outils, Hermes - Lavoisier, 2007, ISBN 978-2-7462-1605-1
- R. Kimball, L. Reeves, M. Ross, W. Thornthwaite, Le data warehouse : Guide de conduite de projet, Eyrolles, 2005, ISBN 978-2212116007
Recherche sur Amazon (livres) : |
Voir la liste des contributeurs.
La version présentée ici à été extraite depuis cette source le 07/04/2010.
Ce texte est disponible sous les termes de la licence de documentation libre GNU (GFDL).
La liste des définitions proposées en tête de page est une sélection parmi les résultats obtenus à l'aide de la commande "define:" de Google.
Cette page fait partie du projet Wikibis.