Data Products : Réunir la BI et l’IA

Data Products : Réunir la BI et l’IA

Sur base de nos observations du marché et de nos projets en cours, une vision assez évidente de l’avenir se dessine : nous ne ferons plus de distinction stricte entre les départements/services de BI et d’IA, mais nous unirons et fusionnerons les initiatives et parlerons de « Data Products », un produit qui associe les deux. Nous avons déjà entamé cette transitionavec quelques entreprises axées sur les données (ou data-driven). Mais prenons donc un peu de recul et commençons par la question la plus importante : mais c’est quoi des « Data Products » ?

Les « Data Products », c’est quoi ?

De manière générale, les Data Products englobent tout ce qui génère une valeur ajoutée à partir de données brutes. Cette définition est très large et il existe de nombreux types de produits différents. Les méthodes détaillées pour le développement d’un Data Product peuvent varier considérablement. Les techniques d’analyse utilisées pour traiter et affiner les données brutes peuvent aller de simples visualisations jusqu’à des algorithmes d’IA très avancés. Même au sein des algorithmes d’IA, nous pouvons utiliser des techniques de compréhension du langage ou de vision par ordinateur, par exemple.

De manière générale, les Data Products comprennent tout ce qui génère une valeur ajoutée à partir de données brutes.

Et pour l’utilisateur final, cela n’a pas d’importance. Il n’est pas nécessaire de les différencier du point de vue de l’utilisateur. Le produit  doit répondre ses questions auxquelles les données peuvent apporter une réponse, et c’est tout. Et le processus de génération d’un Data Product est globalement le même pour toutes les méthodes d’analyse. Mais les techniques de déploiement peuvent également varier. La présentation d’un Data Product peut prendre la forme d’une simple alerte par courrier électronique, d’un tableau de bord ou d’une application web élaborée avec de nombreux processus UI/UX préalables. Les méthodes de mise à disposition du Data Product à l’utilisateur final ne doivent également servir qu’un seul objectif : répondre aux problèmes métier qui peuvent être résolus par un Data Product.

Cela nous amène à une partie importante et moins évidente de la définition des Data Products : nous les avons définis comme tout ce qui génère une valeur ajoutée à partir de données brutes. Cela exige, pour tous les Data Products, une bonne compréhension du métier, une analyse des processus et une compréhension des données. Et cela n’est possible qu’en instaurant la collaboration entre des équipes interdisciplinaires des départements métier et informatique (IT). Cette fondation est nécessaire. Les données et les compétences utilisées à ces fins pourront servir tous les cas d’utilisation, soit pour de la BI, soit pour de l’IA. Le plus grand défi de tout projet data est de se concentrer en permanence sur la valeur ajoutée, la valeur métier.

Et cela soulève la question suivante : De quoi avons-nous besoin pour livrer des Data Products de bonne qualité ?

Les clés du succès

Pour réussir à fournir des Data Products, il est nécessaire d’organiser et d’orchestrer les piliers suivants :

  1. Organisation et rôles
  2. Formation et Data Literacy
  3. Gouvernance et sécurité des données
  4. Infrastructure et données

Organisation et rôles

Une organisation adéquate, notamment pour le déploiement centralisé des Data Products, est essentielle. Cette communauté est située au carrefour entre le business et l’IT, elle est donc pluridisciplinaire par nature. Les postes suivants sont couverts de manière optimale par l’équipe qui se retrouve autour de la table :

Comme vous pouvez le voir, cette illustration date d’avant le covid.
Personnes autour de la table : Product Owner, Utilisateur final, Data Analyst, Data Scientist, Designer UX/UI, Business Analyst (ou Analyste Métier), Data Architect, Développeur Web, Machine Learning Engineer (ou ML Engineer) et Data Engineer.

Contrairement au déploiement, le développement de produits peut être organisé de manière centralisée ou décentralisée. S’il est organisé de manière décentralisé, il est plus proche de du métier. Dans ce cas, les analystes et les Data Scientists font partie d’une unité opérationnelle et utilisent l’unité centrale Data Products comme centre de compétence et de soutien pour un développement efficace. Il n’existe pas de solution ou de recommandation unique pour l’organisation, une évaluation individuelle est toujours nécessaire.

Formation et Data Literacy

Dans le cas d’un développement décentralisé et sur la voie d’une entreprise axée sur les données, nous avons besoin de formations et de connaissances en matière Dans le cas d’un développement décentralisé et en chemin pour devenir une « data-driven company », nous avons besoin de formations et de connaissances en matière de données dans tous les départements métier. La Data Literacy comprend les compétences nécessaires tant pour traiter des données, que pour des Data Products. Chaque employé doit les connaître et savoir ce qu’ils peuvent lui apporter. Grâce à la culture des données et à la formation de tous les rôles au sein d’une entreprise, nous créons davantage d’idées et de cas d’utilisation pour les Data Products et par conséquent, nous utilisons davantage les données là où elles sont nécessaires, dans une approche ascendante.

Gouvernance et sécurité des données

Outre la culture des données et le savoir-faire généralisé en matière de Data Products, nous avons besoin d’une gouvernance des données et de concepts de sécurité appropriés. Si nous améliorons l’utilisation des données ainsi que le développement et le déploiement de Data Products, il est impératif de garantir la sécurité et l’éthique des données. En outre, nous devons assurer une gestion du cycle de vie des produits avec un suivi sans faille.

Infrastructure et données

Jusqu’à présent, nous avons beaucoup parlé de tout le reste, mais l’ingrédient le plus important reste les données. En vérité, nous voulons mettre l’accent sur tout le reste, à part les données, qui sont souvent oubliées ou traitées avec trop peu d’attention. Bien entendu, tous ces rôles, compétences et aspects de la gouvernance sont sans valeur sans les données. Les données doivent être de haute qualité et ne pas être stockées en silos. Pour cela, des plateformes et des outils centraux doivent être mis en place et peuvent être utilisés soit pour des tableaux de bord BI, soit pour des algorithmes d’IA. De plus en plus d’éditeurs de logiciels relient également ces aspects et proposent des plateformes étendues pour le développement et le déploiement de tout type de Data Products.

Exploitez la puissance de la BI et de l’IA combinées

En résumé, c’est quoi un Data Product ? On peut conclure que la présence d’un algorithme d’IA ou d’une visualisation de données sous le capot d’un Data Product n’aura plus d’importance. Tous deux créent une valeur ajoutée pour l’entreprise. Les méthodologies, compétences et infrastructures nécessaires sont très comparables et apparentées. Tant l’unité que la plateforme centralisé présentent des avantages, surtout lorsqu’il s’agit de rendre opérationnel tout type de Data Product. L’ensemble de l’infrastructure nécessaire peut être utilisé à la fois par la BI et par l’IA. C’est pourquoi nous recommandons de plus en plus d’unir les forces des deux initiatives et de réfléchir davantage comme une équipe globale.