FAQ

La FAQ

D’autres questions ?

Notre équipe se fera un
plaisir de vous répondre !

Général

DataChain® a été conçu pour s’intégrer à des systèmes existants (csv, json, xml, parquet, excel,…). Les connecteurs disponibles sont de plusieurs métiers, utilisant des protocoles et des lecteurs multiples. DataChain® possède une suite de connecteurs permettant de lire ou capter l’information à sa source sans la dupliquer physiquement. Selon les besoins, la solution DataChain® possède des fonctions d’extraction de données pour écrire et horodater les données dans son propre environnement.
Le module DC Maestro permet d’automatiser les tâches opérées dans DataChain®. Il est possible de créer un workflow qui enchaine les différentes actions de préparation de données (de la connexion à l’exposition).
La solution DataChain® permet plusieurs niveaux d’analyses. De la plus simple formule à des algorithmes complexes, DataChain® met à disposition de ses utilisateurs le nécessaire pour envisager des analyses, descriptives, prédictives, … Les modules composant la plateforme DataChain® permettent de répondre à de multiples situations et constructions d’usage. DataChain® permet de capter ou lire les sources, réaliser des pipelines d’opérations simples ou complexes en mode No-Code/Low-Code. Le module PyDc est un environnement sécurisé pour coder, permettant le développement sur plusieurs langages (Python, Java, Scala, R,..) d’algorithme de Data Science et d’IA. PyDc intègre l’environnement MlFlow. Le module DC Maestro est un orchestrateur de tâches permettant la mise en industrialisation des processus.

DataChain® propose, nativement, un module HandleData qui permet de réaliser des tableaux de bord contenant différents types de représentations comme des graphiques (Barre, line, aire, Bubble, nuage de point, gauge, sendkey, indicateur, pie, …), Time Line interactive, Cartographies multi-fonds de carte, Média, documents, …)
L’utilisation du module de visualisation HandleData permet de garantir une complète traçabilité et explicabilité de la chaîne de valeurs (Linéage)

Oui, la solution permet de se connecter à tous les outils BI. DataChain® propose de mettre à disposition une communication via des API (REST ou Odata) permettant aux organisations d’utiliser pour la représentation des données leurs propres outils de représentation graphique. Dans ce cadre DataChain® ne peut pas garantir la traçabilité et l’explicabilité de la chaîne de valeur global (Linéage) .

La gestion de la sécurité et de la confidentialité est une des forces structurantes de la solution DataChain®. La gestion des permissions et droits peut se définir et s’appliquer à tous les étages de la chaîne de valeurs et peut se propager lors de consommation de services via les API et/ou Publications graphiques. Cette gestion des droits et permissions s’applique aussi bien sur les fonctions que sur les données consommées. DataChain® possède une finesse importante pour la gestion des permissions sur les fonctions et droits sur les données (colonne/lignes).
La solution DataChain® a pour vocation de s’intégrer dans tous systèmes d’informations existants, directement aux annuaires ou provider d’identification des différentes organisations. Plusieurs protocoles et/ou méthodes permettent de respecter cette contrainte.
DataChain® est disponible dans les 2 modes, Cloud et On-premise, voir Hybride selon l’organisation de votre infrastructure.
DataChain® est agnostique de tous hébergement, la solution se déploie chez l’hébergeur de votre choix. Nous proposons des hébergements managés par nos équipes ou laissons la main à nos clients s’ils souhaitent s’en charger ou confier l’hébergement à une autre structure. Il est important de noter que la solution DataChain n’a aucune adhérence à aucun hyperscaler laissant ainsi la liberté de choix complète sur l’hébergement et le mode déploiement

Non, aucune dépendance. Le client reste maitre du lieu de déploiement de la solution et de son type de déploiement. C’est là que la notion de Souveraineté prend tout son sens.

Oui, DataChain® reste accessible et pensé pour des utilisateurs non techniques.
Grace au concept Low-Code, No-code, chaque collaborateur peut utiliser DataChain® selon son niveau. Les formations durent entre 2 et 5 jours pour commencer à avoir une réelle autonomie sur la solution.

Nous proposons des formations à l’utilisation de la solution. Selon l’appétence des apprenants à la notion Data, l’apprentissage va plus ou moins vite. Dans la continuité des formations, nous proposons un accompagnement à la réalisation des premiers cas d’usages et/ou des revues de projets construits par les utilisateurs, application des bonnes pratiques. Nous travaillons au maximum sur les Data et les besoins des clients afin qu’ils se projettent dès que possible dans le concept DataChain®.
La documentation est accessible depuis l’application DataChain® et mise à jour régulièrement.
Nous utilisons une solution de « ticketing » (JIRA) qui permet à nos clients de nous faire part de leurs demandes. Cet outil permet d’avoir une traçabilité horodatée de la prise en charge, de la réponse et de la clôture de la demande.

DataChain

La solution DataChain® peut se déployer selon différents modes.
Sa conception permet un déploiement Sas, Cloud Public, Cloud Privé et On Premise.

Le concept et la technologie de la solution DataChain® répond aux normes de la Data Virtualisation. Les données ne sont pas dupliquées dans l’environnement DataChain® lorsqu’elles sont consommées dans les diverses opérations.
A noter que lors de l’optimisation des pipelines de traitement, il est possible de générer une mise en cache des données. Ce cache nommé persistance est temporaire et sécurisé.

La plateforme DataChain® offre des fonctions permettant d’extraire des données. Chaque extraction réalisée des données sources est horodatée et devient une source disponible constituant ainsi un historique des données sources.

La solution DataChain® ne possède aucune dépendance sur des services proposés par des hyperscalers ou autres plateformes. Cette capacité permet à chacun de choisir son hébergeur et apporte une sérénité dans l’évolutivité dans le temps

La solution DataChain® possède plusieurs types de mise à disposition des données traitées.
– Génération d’API dynamique sécurisée sous différents protocoles
(API REST, Odata,..)
– Génération d’exports sous différents formats (csv, txt, Json, xml, Parquet, Excel,..) et protocoles comme S3, Hdfs, Sftp, Base de données (Sql, Nosql, Graphe,…). A noter que tous les connecteurs entrants déclarés peuvent être utilisés en connecteurs sortants.
– Génération de publication de tableaux de bord
– Génération de Data Products

Le module complémentaire Dc Code offre une environnement pur code. Il permet de consommer des dataset gérés par le socle de la solution en respectant la politique de droit appliquée.
DC Code permet de développer des algorithmes en Python (et dans d’autres langages) via des notebooks dans un environnement JupyterHub. A noter que DC Code intègre MlFlow.

DC Code

DC code offre une intégration native et complète à la plateforme DataChain® permettant ainsi de conserver les politiques de droits dans l’environnement de développement.

Il est courant que des projets Python ou R n’utilisent pas les mêmes librairies voire des interpréteurs déférents. DC code apporte une réponse simple dans la personnalisation des environnements et des interpréteurs permettant une gestion efficace des dépendances de ses projets. Il permet également l’usage de dépôts privés de packages python ou R.

L’exécution des notebooks peut être automatisée via le module DC Maestro comme une
tâche de workflow permettant ainsi d’avoir une gestion complète de l’automatisation de
ses chaînes de traitement.

D’autres questions ?

Notre équipe se fera un
plaisir de vous répondre !

DC Maestro

DC Maestro permet d’automatiser l’exécution de tâches de vos projets Data.
Cela permet de simplifier la gestion des données en production et d’éviter les tâches répétitives pour que les équipes restent concentrées sur les tâches à forte valeur ajoutée.
Un système de notification vous avertit en cas de problèmes afin de limiter les ruptures de mises à jour.

DC Maestro s’appuie sur les droits et permissions définis dans les autres produits avec lesquels il communique.
Chaque utilisateur a accès exactement aux mêmes éléments d’un Projet et aux mêmes fonctions que ceux auquel il a accès dans le produit.

DC Maestro s’appuie sur des technologies Open Source innovantes et adaptées à la gestion des données en production mais l’interface et les fonctionnalités ont été pensées pour répondre à la fois aux besoins des équipes qui démarrent la mise en place d’une démarche DataOps, et aux équipes qui possèdent déjà une base solide sur le sujet.

DC Maestro est contrôlable via des services mis à disposition (API). Vous pouvez donc déclencher un pipeline via un appel de service. La consommation de ces services est sécurisée et nécessite une authentification et une identification.

DC MarketPlace

Les résultats produits à la suite des différents traitements et opérations sur les données
peuvent-être exposés dans DC MarketPlace.
En fonction du besoin, le producteur pourra avoir le choix entre différents formats comme les expositions API sous des protocoles variés, des publications de tableaux de bords, des blocs de données sous différents formats fichiers,…

Oui, l’ensemble de ce qui est mis à disposition est sécurisé. Pour accéder à DC MarketPlace, le consommateur doit s’authentifier. Il accède alors à l’ensemble des éléments disponibles pour lui.

Oui, à condition que le provider d’authentification (annuaire) soit partagé par les modules DataChain Core.

Oui, les producteurs peuvent choisir des formats différents pour exposer leurs résultats dans DC MarketPlace. Ainsi, le consommateur peut consommer les résultats sous forme d’API, de fichier, d’enveloppe projet DataApp,…