Contexte et enjeux

Depuis octobre 2016, la loi pour une République numérique a bousculé le monde de l’information en favorisant notamment l’ouverture et la circulation des données. L’Open Data était né. Open Data et Big Data (données variées et volumineuses) ont ainsi bouleversé la manière de traiter la donnée et d’exercer l’intelligence économique.

Ce nouveau challenge s’accompagne de nouvelles opportunités lorsqu’on prend la mesure de ce changement : des données auparavant privées sont désormais utilisables par le biais de licences ouvertes. Lorsqu’elles sont libres de droits, ces données peuvent être agrégées à d’autres données issues de plusieurs sources et finalement transformées en une information vérifiée et exploitable.

C’est depuis toujours un défi intrinsèque à l’information d’entreprise : rendre l’information collectée fiable et pertinente pour le client.

Article production

Ellisphere, une organisation adaptée aux enjeux de la donnée

Pour faire face à ces nouveaux jeux de données, Ellisphere a mis en place des structures particulières — tant physiques que logicielles — ainsi que de nouveaux processus d’analyse et d’intégration.

En effet, les problématiques se posent en termes de volumes, mais aussi de qualité des données, tout comme des modalités et formats de mise à disposition. Les données ouvertes sont telles que collectées à la source, non agrégée, avec le plus haut niveau de granularité.

Avant d’être intégrées, les informations brutes récupérées nécessitent ainsi un retraitement avant de pouvoir être utilisées.

Dans le cadre des IMR Open Data par exemple, les formats tout comme la gestion de l’information diffèrent en fonction des greffes. Avec l’Open Data, on prend ce qui est disponible : en l’absence d’échanges pour aboutir au flux souhaité, les temps d’analyse sont nécessairement allongés.

Nous devons prendre en compte ces contraintes liées aux fournisseurs, auxquelles s’ajoutent les inévitables contraintes réglementaires pour lesquelles une veille est nécessaire.

Aujourd’hui, l’Open Data élargit les accès : bilans BALO, IMR open data (INPI), Registre National des Métiers… Et d’autres possibilités selon les opportunités : marchés publics, associations subventionnées, comptes des communes…

Le process de veille et de collecte est permanent : en fonction des attentes et demandes des clients, nous sommes en recherche de nouvelles données à collecter, lesquelles seront valorisées dans nos offres (gestion des risques, Data Marketing, Compliance), et au sein de solution client spécifiques (scores sur-mesure, etc.)

Le challenge data est de croiser les données et leurs usages. Toutefois, la massification de la donnée en open data et multisourcée implique nécessairement une augmentation des actions humaines de correction et de validation des données.

Data quality

La qualité de la donnée au centre de nos prérogatives

La Direction de la Production Ellisphere est chargée de développer des processus d’alimentation, de contrôle et d’amélioration permanents tout au long du cycle de production d’information d’entreprise, où l’action humaine est prépondérante.

Ses missions essentielles sont : capter, collecter de l’information multisourcée — qu’elle soit portable ou quérable — puis contrôler, analyser, corriger et valoriser cette information d’entreprise de bout en bout dans une qualité éditoriale destinée à l’ensemble des solutions d’Ellisphere.

 

Des sources d’informations diverses

L’information qualifiée intègre un référentiel composé de l’exhaustivité des entreprises françaises, soit près de 11 millions d’entreprises actives. Près de 6 millions d’entreprises inactives sont également diffusées sur une antériorité de 10 ans après leur cessation.

À un premier niveau, l’ensemble des données et informations en provenance de nos différentes sources (INSEE, INPI, DILA, Greffes de Tribunaux de Commerce, etc.) est soumis à des contrôles au chargement au travers de centaines de contrôles de cohérence.

Ces contrôles s’appliquent de manière croisée sur les données d’une même source, ou encore sur la même donnée issue de sources différentes pour un même SIREN.

À titre d’exemple, 1 500 contrôles algébriques et de cohérence sont effectués sur l’ensemble des zones constituant les bilans. Ces contrôles sont régulièrement adaptés, ou d’autres ajoutés, dès lors qu’une même anomalie survient à plusieurs reprises, que les formats ou contenus évoluent, tout comme la législation. Il s’agit d’un processus d’amélioration permanent.

 

Un contrôle permanent

Les équipes Ellisphere constatent que chaque année, 10 à 15 % des données officielles sont sujettes à des anomalies ou erreurs. Les contrôles d’entrée adossés à des règles de cohérence, de structure et de matching (recoupement) de données déjà présentes en base, génèrent des logs en vue d’un traitement manuel.

Ellisphere s’appuie sur l’expertise humaine pour analyser, qualifier et corriger les erreurs détectées, et notamment sur ses équipes dédiées de gestionnaires de données, pour traiter les Bilans, Journaux d’Annonces Légales, Bodacc, Procédures Collectives.

Le traitement de l’information est complet, de l’analyse de la donnée reçue à la collecte quotidienne dans le cadre de campagnes ad hoc sur des thèmes ou cibles déterminés.

Une fois fiabilisée par nos gestionnaires de données, chaque donnée sur une entreprise est formatée, datée, archivée et rattachée à ses sources d’origine, pour être diffusée. Chaque année, des centaines de milliers de corrections et interventions sont opérés de manière manuelle par les équipes d’Ellisphere.

 

Une organisation structurée pour garantir la fiabilité de la donnée

La base de données Ellisphere, alimentée par l’agrégation des données des sources publiques susmentionnées, et enrichies par des sources privées (expériences de paiement, nominativités, veille média…), bénéficie aussi des apports des équipes Liens Financiers et Enquêtes-Analyses opérant au sein de la Direction de la Production.

 

Liens Financiers

Un tiers des entités présentes dans la base de données (10 millions d’entreprises) ont un capital social et peuvent potentiellement avoir des liens capitalistiques.

Par définition, ce que nous nommons « lien financier » est un lien capitalistique entre une personne morale, pourvue d’un capital social et un actionnaire, qu’il s’agisse d’une personne morale, personne physique ou entité virtuelle.

Ellisphere déploie d’importantes ressources afin d’enrichir une base de liens financiers avec d’une part, des sources documentaires telles que :

  • La Presse, le Balo pour les sociétés cotées en bourse et leurs filiales, l’AMF, les sites spécialisés comme Euronext ou info financière.fr, les sites institutionnels, les rapports annuels, les comptes annuels (annexe 17 avec la composition du capital social et l’annexe 18 sur les filiales et participations)
  • Les actes et statuts (procès-verbaux de constitution, statuts mis à jour, cessions de parts), et par ailleurs, toutes les informations issues des contacts directs avec les sociétés.

Le cycle de vie d’une entreprise à capital est ainsi finement suivi, octroyant une date de fraicheur des liens, au plus près de la réalité des évènements légaux de l’entreprise, élément primordial pour nos clients.

La richesse du référentiel Liens Financiers, résulte à la fois de process de révision tenant compte de la survenance d’évènements légaux, des opérations de remédiation Bénéficiaires Effectif déclenchées pour nos clients (cf. notre offre Compliance).

L’expertise humaine, avec une équipe de gestionnaires Liens Financiers est clé, ce d’autant plus que les sources documentaires ne sont pas homogènes. Les opérations manuelles de monitoring sur cibles (référentiel de 900 grands groupes, cibles client) contribuent également à affecter une date d’actualisation aux liens financiers.

En 2021, ce sont plus de 800 000 interventions manuelles sur les liens (corrections, créations, historique, mises à jour, suppressions, transferts), dont près de 400 000 liens créés manuellement, qui ont été réalisées.

 

Enquête et Analyse

L’équipe Enquêtes et Analyses d’Ellisphere est en charge de réaliser des enquêtes pour le compte de nos clients.

Comparativement à un rapport, plus factuel et statique en fonction des données disponibles, une enquête est une prestation à forte valeur ajoutée, répondant principalement à un enjeu en termes de risque crédit (prospect – client et/ou fournisseur).

L’enquête permet d’obtenir des analyses et commentaires sur les données confidentielles, et propose une vision dynamique et actualisée de l’entreprise au travers d’appels sortants (DAF, banque, etc.). C’est une prestation personnalisée, avec une analyse humaine, une collecte ad hoc de nouveaux éléments ainsi qu’une adaptation de la restitution au contexte de l’entreprise, à son marché.

Les recherches menées lors d’une enquête permettent d’obtenir des informations avant leur publication. Aussi, les informations quantitatives recueillies sont immédiatement prises en compte dans le score de probabilité de défaillance. En outre, des éléments qualitatifs restitués dans les commentaires peuvent également compléter ou apporter un éclairage différent.

 

L’expertise au centre de la qualité de la donnée

L’expertise métier des collaborateurs de la Direction de la Production Ellisphere reste plus que jamais incontournable pour l’exploitation de données de plus en plus variées et volumineuses.

En effet, cette expertise joue un rôle central dans la fiabilisation des informations à l’heure du multi-sourcing et du développement de l’open data.

La maîtrise de la Data Quality fait partie intégrante de la culture d’entreprise d’Ellisphere. Cette forte valeur ajoutée constitue un véritable élément de différenciation, une fierté et un enjeu portés par nos experts : en garantissant la qualité des données délivrées, Ellisphere favorise une prise de décision intelligente et orientée.

En savoir plus

Notre accompagnement en gestion des risques

Découvrez dès maintenant l’expertise d’Ellisphere sur vos problématiques de gestion des risques client/fournisseur grâce à notre approche dédiée.

Notre approche Gestion des risques