DataChain® Core
Vos données en libre service, enfin, simplement
Une plateforme collaborative de dernière génération pour mettre vos données en libre service en très peu de temps.
Datachain®, la solution Data Européenne, souveraine qui gère la donnée de bout-en-bout.
Gartner® Magic Quadrant™
Ils nous font confiance
Un outil puissant pour couvrir les usages et les industrialiser
Une solution No code/ Low code (NCLC) et Code
Une gestion de la sécurité fine avec une traçabilité totale
DataChain®
DataChain® est une plateforme de virtualisation de données “end-to-end” (de bout en bout). Une plateforme unique pour toutes les équipes de l’organisation, une seule solution pour accompagner le Management des données.
Comment ça marche ?
Datachain® se compose d’une plateforme DC Core sur laquelle vous pourrez (si nécessaire) ajouter des modules spécifiques. La plateforme DC Core couvre l’essentiel de la gestion de la donnée de sa source à son exposition (visualisation, API, export,..) en passant par la gouvernance. Les modules apportant des briques spécifiques pour certains cas d’usage (Orchestration, Data science, IA, Développement d’algorithme,…).
L’environnement DataChain®
La plateforme DataChain® et ses modules
DC Code
DC Code est le module complémentaire de génération de code multi-langages intégré à la solution Datachain®. Il permet d’ouvrir, si besoin, aux developpeurs et datascientistes, un contexte de pur developpement, scalable et multi-environnements. DC Code est le module de génération de code intégré à la plateforme DataChain®. DC Code apporte une garantie d’ouverture et une sérénité dans la capacité à évoluer et s’adapter à tous les types de besoins. DC Code est totalement intégré à la plateforme Datachain®, respectant la politique de droit et de sécurité décrite dans le module central DC Code.
DC Maestro
DC Maestro offre la capacité d’orchestrer les processus métiers. Il garantit une fiabilité de production et de délivrance des usages en temps et en heure. DC Maestro est la garantie pour les métiers de construire et maîtriser la planification de leur production. Sa forte ‘utilisabilité’ et son expérience utilisateur performante apporte aux métiers une autonomie complète dans la mise en œuvre et la supervision de l’industrialisation de leurs processus.
DC MarketPlace
DC MarketPlace facilite le partage de Data Products, des données sous différents formats et insights utiles . DC MarketPlace permet une collaboration efficiente et sécurisée entre les producteurs et les consommateurs de données ou d’usages métiers. Dc Marketplace permet de – démocratiser l’accès aux données – réduire les coûts et les efforts liés à la collecte des données, – centraliser les ressources data évitant le duplication et la création de nouveaux silos, le partage sécurisé des produits Data et la création d’écosystèmes de données dynamiques et innovants.
DC Tag IA
DC Tag IA est un module stratégique augmentant la valeurs des données par un positionnement automatisé de tags (étiquettes) sur vos données. Cette étiquetage augmentée facilite la fouille et le classement de vos data, de réaliser des propositions d’usage en fonction du contenu de vos datasets, de proposer le choix de la mise en relation de dataset entre eux, de détecter les niveaux de sensibilité et de confidentialité des données, d’enrichir les modèles d’IA avec des données adaptées,…
Une plateforme qui s’adapte à vous
Datachain, une réponse pour l’ensemble des acteurs de la chaîne de traitement de la données
Code / Low code / No Code
Disponible en
No Code/Low code
et Code
Les utilisateurs métiers ont la possibilité d’accéder aux fonctionnalité du produit sans connaissance technique préalable. Cela permet une véritable autonomie des utilisateurs métier.
Disponible en Code
Des fonctions pur code multi-langages scalables qui permettent aux développeurs et data scientistes d’exprimer leur expertise sur les besoins spécifiques, dans un environnement cohérent et explicable.
Indépendance et évolutivité
Héberger en Local
Parce que certaines d’entreprises ne peuvent/veulent pas mettre leurs data sur le cloud.
Héberger en Cloud
Datachain est déployable en Cloud privé ou public, sans adhérence permettant une totale liberté dans son mode de consommation et dans le choix de son hébergeur.
Héberger en Hybride
Pour gérer un mixte de données entre local et cloud.
Une Plateforme technologique de dernière génération basée sur la Data Virtualisation
Datachain®, conçue autour de la virtualisation de donnée, propose une approche innovante qui résout de nombreux problèmes par rapport aux technologies classiques. La plateforme a été développée avec des technologies de dernière génération.
Apport d’une couche logique aux données sans réplication.
Temps raccourci entre la formulation par le métier et la mise à disposition des données.
Apport d’une couche d’uniformisation sémantique des données.
Gestion précise et centralisée de l’accès aux données quelques soit la technologie source.
Gestion native et partagée des métadonnées.
Accès unifié et en temps réel aux données
Approche moderne de l’intégration et de la mise à disposition des données au métier.
Permettre à certains métiers de s’affranchir des expertises fines sur les technologies.
Permettre à certains métiers de s’affranchir des expertises fines sur les technologies.
Réduction des coûts et de la complexité
Autonomie accrue grâce au self-service
Simplification technique et mise en avant de l’expertise des métiers
Le tout dans un environnement contrôlé et sécurisé
Confiance en vos données : le moteur de votre transformation.
Droits fins sur les données
Permissions sur les fonctions
Propagation des droits sur la chaîne de valeurs
DataMarket Place sécurisé
Normalisation – Anonymisation
Isolation forte Multi-Instance
Sécurité
La solution Datachain® apporte confiance et sérénité. Les niveaux de sécurité sont aussi bien sur les couches basses de la solution que dans la capacité de DataChain® à positionner les droits et permissions à tous les niveaux de chaîne de traitements et à les propager de manière native et efficiente.
Explicabilité
L’ensemble des actions sur le pipeline de traitement est tracé et horodaté de manière native. A tout moment, en temps réel, il est possible de visualiser l’origine d’une colonne. L’ensemble des transformations d’une valeur est décrite pour une compréhension claire et complète. Les fonctions de traçabilité sont portées aux plus bas niveau des services. La trace est assurée aussi bien via l’interface DataChain® que par la consommation des API DataChain®.
Traçabilité
L’ensemble des actions sur le pipeline de traitement est tracé et horodaté de manière native. A tout moment, en temps réel, il est possible de visualiser l’origine d’une colonne. L’ensemble des transformations d’une valeur est décrite pour une compréhension claire et complète. Les fonctions de traçabilité sont portées aux plus bas niveau des services. La trace est assurée aussi bien via l’interface DataChain® que par la consommation des API DataChain®.
Opposabilité
Pour gérer un mixte de données entre local et cloud
Transparence
La transparence dans les pipelines de données est une élément fondamental permettant d’assurer la compréhension des opérations et transformations exécutées sur les données, mais aussi la fiabilité, la qualité et la conformité des processus de traitement sur les data. La transparence permet de comprendre comment les données sont utilisées et consomées sur tous les étages de la chaîne de traitement.
Débloquez la puissance de la Data
DataChain® : Connectez vos données à vos métiers, simplement et efficacement.
Cassez les silos de données
DataChain® résout le problème de la fragmentation des données en créant un environnement de données unifié et virtualisé. Cela permet de réduire les frictions dans l’accès aux données et de favoriser la collaboration entre les services.
Réduisez les goulets d’étranglement IT
La solution libère les équipes IT du rôle de gardien des données, permettant aux utilisateurs professionnels d’accéder aux données, de les analyser et de les gérer directement. Cette décentralisation accélère les opérations et réduit la charge de travail de l’IT.
Garantissez la qualité et la gouvernance des données
Grâce à ses fonctions natives de gestion des métadonnées et de lignage des données, DataChain® garantit l’intégrité, la traçabilité et la conformité des données. Elle renforce la gouvernance et l’auditabilité, ce qui est essentiel pour les secteurs soumis à des exigences réglementaires strictes.
Gérez la complexité et du volume des données
DataChain® est conçu pour gérer le volume croissant et la complexité des données, en utilisant un traitement virtualisé pour s’assurer que les données peuvent être mises à l’échelle sans surcharger les systèmes existants.
Préparez l’IA
Alors que les organisations s’orientent vers l’IA, DataChain® fournit une base solide en préparant les données de manière à ce qu’elles soient prêtes pour l’analyse avancée et le développement de modèles d’IA, favorisant ainsi l’innovation.
Datachain® delivre la puissance des données
Prenez l’avantage avec la Data Virtualisation
Avec la virtualisation des données, manipuler les données multi sources, qu’elles soient structurées ou non, tout en en garantissant leur intégrité, devient possible.
Cette approche apporte de nombreux bénéfices : aucun stockage supplémentaire, traitements des données en temps réel, centralisation des données… Plus besoin de dupliquer et d’agréger les données dans des entrepôts intermédiaires.
DataChain® permet de diminuer le temps passé à chercher et à préparer les données : se concentrer uniquement sur l’analyse !
Un gain de temps précieux et une économie de coûts de stockage.
La Data Virtualisation, pourquoi, pour qui ?
Pour les métiers
Accès rapide et unifié aux sources de données
Pas de duplication physique des données
Le métier au centre de la production d’usages
Efficacité Opérationnelle Productivité Améliorée
Flexibilité et collaboration améliorée
Amélioration de la Gouvernance et de la Sécurité
Réduction du temps de mise en valeur
Agilité Accrue Décision plus rapide et adaptée
Plus besoin de dupliquer et d’agréger les données dans des entrepots intermédiaires.
Pour l’IT
Accès instantané aux sources de données
Intégration dynamique et réduction des coût à l’obtention des données
Réduction du coût et de la complexité de maintenance
Accélération du ROI des projets basés sur les données
Scalabilité améliorée Adaptabilité augmentée
Amélioration de la Gouvernance et de la Sécurité
Réduction du temps de mise en valeur
Agilité Accrue Décision plus rapide et adaptée
Concrètement
Avec DataChain®
Gain de temps et d’efficacité pour la génération d’usage
Autonomie des utilisateurs Métiers
Réduction de la charge de travail pour l’IT
Meilleure prise de décision basée sur les données et l’expertise des Métiers
Souplesse et réactivité
Apport de confiance
Développement de la culture Data de l'entreprise
La solution DataChain® est-elle une solution uniquement Sas ?
La solution DataChain® peut se déployer selon différents modes.
Sa conception permet un déploiement Sas, Cloud Public, Cloud Privé et On Premise.
Les données traitées sont-elles dupliquées dans l’environnement DataChain® ?
Le concept et la technologie de la solution DataChain® répond aux normes de la Data Virtualisation. Les données ne sont pas dupliquées dans l’environnement DataChain® lorsqu’elles sont consommées dans les diverses opérations.
A noter que lors de l’optimisation des pipelines de traitement, il est possible de générer une mise en cache des données. Ce cache nommé persistance est temporaire et sécurisé.
Est-il possible de réaliser des extractions des données vues et lues par la plateforme DataChain® ?
La plateforme DataChain® offre des fonctions permettant d’extraire des données. Chaque extraction réalisée des données sources est horodatée et devient une source disponible constituant ainsi un historique des données sources.
La solution DataChain® est-elle dépendante d’un hyperscaler comme AWS, Microsoft, Google, ou autres ?
La solution DataChain® ne possède aucune dépendance sur des services proposés par des hyperscalers ou autres plateformes. Cette capacité permet à chacun de choisir son hébergeur et apporte une sérénité dans l’évolutivité dans le temps
Quels sont les capacités de DataChain® à mettre à disposition les données traitées ?
La solution DataChain® possède plusieurs types de mise à disposition des données traitées.
– Génération d’API dynamique sécurisée sous différents protocoles
(API REST, Odata,..)
– Génération d’exports sous différents formats (csv, txt, Json, xml, Parquet, Excel,..) et protocoles comme S3, Hdfs, Sftp, Base de données (Sql, Nosql, Graphe,…). A noter que tous les connecteurs entrants déclarés peuvent être utilisés en connecteurs sortants.
– Génération de publication de tableaux de bord
– Génération de Data Products
La plateforme DataChain® propose-t-elle un environnement de développement en mode Code ?
Le module complémentaire Dc Code offre une environnement pur code. Il permet de consommer des dataset gérés par le socle de la solution en respectant la politique de droit appliquée.
DC Code permet de développer des algorithmes en Python (et dans d’autres langages) via des notebooks dans un environnement JupyterHub. A noter que DC Code intègre MlFlow.