En qualité de base de données multi-modèle, MarkLogic combine les avantages d'une unité de stockage de documents et d'une unité de stockage de triplets RDF. Cette approche est idéale pour intégrer et accéder à toutes vos données. Les documents JSON et XML offrent une grande flexibilité pour modéliser les entités tandis que les triplets RDF, format pour les données graphiques sémantiques, sont idéaux pour stocker les relations. La sémantique MarkLogic est parfaite pour stocker les métadonnées, améliorer l'intégration de données et concevoir des applications en utilisant des données intégrées et hautement connectées. Les cas d'utilisation fréquents utilisent la sémantique MarkLogic, y compris les applications de recherche avancées, les recommandations de moteurs, la détection des fraudes, les graphes de savoir, la détection de drogue et la sécurité des réseaux.

En savoir plus

Ce système est simplement efficace. Rien à ajouter.

MarkLogic avait annoncé le rassemblement des formats RDF, XML, et bien d'autres encore, y compris les différents index associés. Que dire ? Je ne suis pas déçu. Le défi était difficile, mais ils ont tenu leur promesse. Cette solution fonctionne parfaitement. »

Données sémantiques et requêtes : RDF et SPARQL

Les bases de données de graphes sont devenues très populaires ces dernières années et les unités de stockage de triplets RDF, où sont stockées les données sémantiques, sont considérées comme un type de base de données de graphes. Lorsque les données commencent à prendre la forme d'une structure graphique dans laquelle les entités (personnes, lieux et choses) et les relations entre elles constituent le centre de l'attention, il est conseillé d'utiliser la sémantique qui offre plus de contexte à vos données.

La norme de représentation des données sémantiques est le triplet RDF (Resource Description Framework) et le langage standard de requête est le SPARQL. Les triplets sont dérivés d'une construction sujet-prédicat-objet basée sur les entités (personnes, lieux ou choses) et leurs relations. Par exemple : « John vit à Londres. » Autre exemple : « Londres est en Angleterre. » En combinant ces deux faits, des déductions sont possibles, telles que « John vit en Angleterre. »

De cette manière, des faits simples peuvent être liés entre eux pour former un graphe de centaines de milliards de faits et de relations. De telles applications de connaissance basées sur des graphes sont utilisées tous les jours notamment dans les recherches Google et dans la fonctionnalité « Personnes que vous pourriez connaître » de LinkedIn.

Le RDF (et SPARQL par extension) prend de l'importance à mesure que les modèles de données eux-mêmes se complexifient, deviennent plus associatifs et hétérogènes simplement parce que la diversité des informations prend le pas sur d'autres facteurs tels que le volume ou la rapidité. »

Que sont les triplets RDF ?

C'est très simple. Ils ajoutent du contexte à vos données, ce qui améliore leur intégration.

Les triplets sont plus adaptés que les bases de données relationnelles dans de nombreux cas d'utilisation impliquant les relations : vous n'avez plus à vous soucier des clés étrangères, requêtes imbriquées et associations complexes.

LE SAVIEZ-VOUS ?

Les triplets sont compris de manière universelle et peuvent être cherchés et partagés très facilement.

Les triplets peuvent être reliés pour former des « graphes » lisibles par la machine et pouvant même être utilisés pour déduire de nouveaux faits.

Les normes standards sont définies par W3C pour les triplets RDF et SPARQL pour le langage de requêtes.

Les unités de stockage de triplets peuvent évoluer pour stocker jusqu'à plusieurs centaines de milliards de faits et de relations.

Les unités de stockage de triplets peuvent utiliser des ontologies pour organiser et catégoriser les données (les ontologies sont similaires aux taxonomies, mais elles sont plus riches et plus pratiques).

Vous débutez avec la sémantique ? Commencez ici.

Visionnez notre webinaire d'initiation à la sémantique MarkLogic qui vous propose une présentation technique de la technologie sémantique ou téléchargez un exemplaire gratuit de « La sémantique pour les nuls », qui offre non seulement une vue d'ensemble de la sémantique, mais propose également des études de cas d'utilisation réels de la sémantique.

Télécharger l'e-bookRegarder le webinaire

« Utiliser les triplets RDF permet de créer en temps réel des connexions entre les données, telles que les structures d'organisations et les relations entre les documents et les données… Notre plate-forme a évolué pour prendre en charge plus de 40 000 documents par heure avec un inventaire de plus de 50 millions de points de données dans 8 millions de documents. Nous sommes loin d'avoir atteint les limites de MarkLogic. »

Michael Henry | KPMG

Les points forts de MarkLogic : une base de données multi-modèle pour documents, données et triplets

Documents + données + triplets.  MarkLogic stocke ensemble en natif, les documents, les données et les triplets.

  • Entièrement modulable : MarkLogic est réellement multi-modèle, vous pouvez rédiger des requêtes complètement modulables pour tous les types de données.
  • Enterprise Ready : nombreuses fonctionnalités conçues pour l'entreprise, notamment les transactions ACID, la sécurité, la reprise après sinistre, etc.
  • Indexation performante : index spécialisé dans les triplets pour améliorer la puissance et la performance des requêtes.
  • Très grande échelle : MarkLogic stocke plusieurs centaines de milliards de triplets.

Pourquoi l'approche multi-modèle est-elle la meilleure ? Elle unifie vos modèles de données en vous offrant plus de flexibilité et un meilleur système de requêtes.

Télécharger l'e-book de la collection O'Reilly sur le multi-modèle

Utilisations de la sémantique

Tous les cas d'utilisation ne nécessitent pas la fonctionnalité sémantique MarkLogic. Parfois le modèle basé sur les documents suffit. Mais lorsque vos données impliquent des relations que vous avez besoin de stocker et d'interroger à grande échelle, alors la sémantique est une fonctionnalité bien utile. Voici les cas d'utilisation les plus courants de la sémantique MarkLogic.

La fonctionnalité sémantique de MarkLogic agit comme une colle pour les données de référence en fournissant un modèle idéal pour les données de références et les métadonnées (provenance, lignage, etc.). MarkLogic stocke les données d'entités telles que les clients et commandes en tant que documents et peut stocker les relations entre les entités en tant que triplets RDF. Vous pouvez également décrire des métadonnées telles qu'elles au moment de la création du document ou quels sont les liens avec les autres documents à l'aide d'une ontologie. Grâce aux fonctionnalités multi-modèles MarkLogic, ces relations sémantiques peuvent être stockées dans les documents eux-mêmes ou en tant que triplets RDF indépendants.

MarkLogic peut aider à fournir des recommandations personnalisées en temps réel et élargir intelligemment les requêtes de recherche. Les graphes sont une affaire de données hautement connectées, et grâce à la sémantique MarkLogic vous pouvez utiliser ces relations pour recommander des personnes, des produits, des questions ou toute autre information contenue dans le graphe pour améliorer l'expérience de l'utilisateur. Vous pouvez également élargir intelligemment les requêtes à l'aide de l'ontologie sémantique. Même si le document ne mentionne pas le mot clé que vous cherchez, vous obtenez quand même un ensemble élargi de résultats pertinents. C'est une façon plus intelligente de concevoir des applications de recherche.

La fonction sémantique de MarkLogic permet aux sociétés de services financiers d'étudier les relations entre les parties et contreparties pour découvrir les risques liés à la responsabilité ou les fraudes potentielles. Elle permet également aux compagnies d'assurance d'identifier une organisation criminelle ou des réclamations frauduleuses dans la mesure où il est généralement possible de faire des connexions entre les adresses de facturation, les complices connus et les archives. Souvent, ces connexions sont perdues dans les données non intégrées ou non indexées. La sémantique permet de les identifier rapidement.

Les données relatives aux renseignements peuvent être importantes en volume, complexes en structure et provenir d'une multitude de sources dans différents types et formats. Pour pouvoir les utiliser, il est nécessaire de les intégrer. Et pour pouvoir les analyser, il est nécessaire de comprendre les relations. La sémantique MarkLogic permet de connecter les données et de visualiser les relations pour en tirer des conclusions. Qu'il s'agisse d'une personne recherchée par l'armée ou de la police recherchant l'origine d'actes de délinquance dans un quartier, la sémantique de MarkLogic permet d'utiliser les données plus facilement et intelligemment qu'auparavant.

La fonction sémantique de MarkLogic permet d'utiliser les trillions de triplets disponibles dans le monde pour décrire toutes les choses possibles. Ces faits sont libres d'accès : vous pouvez utiliser DBPedia, le CIA Factbook ou Geonames. Ou vous pouvez utiliser les vôtres. Dans tous les cas, ces triplets forment la trame des graphes de connaissances et aident à améliorer les recherches et découvertes. Par exemple, il peut être judicieux de fournir des faits sur Londres lorsqu'un utilisateur effectue une recherche sur Londres, ou des faits sur le propriétaire d'une compagnie et ses filiales lorsqu'un utilisateur fait des recherches sur cette compagnie. Avec les données connectées, les possibilités sont infinies.

La fonctionnalité sémantique MarkLogic aide à gérer les ressources informatiques, ou toutes autres ressources, des grandes entreprises. La plupart des grandes entreprises ont des centaines, voire des milliers, de ressources informatiques. Elles sont indispensables, mais nécessitent une maintenance constante. Prenons par exemple, les baies et serveurs d'un centre de données. Grâce à MarkLogic, vous pouvez stocker les données relatives à ces objets sur les triplets et exécuter une requête simple pour demander à « voir tous les serveurs Dell qui ont plus de deux ans » et obtenir un résultat instantané.

Fonctionnalités de sémantiques prises en charge

  • Stockage et gestion de centaines de milliards de triplets RDF
  • Recherche dans les documents, les données et les triplets
  • Index de triplets, procurant des résultats de recherche ultrarapides
  • Mise en cache des triplets, pour des performances exceptionnelles sur des clusters volumineux
  • Chargement groupé de triplets avec MarkLogic Content Pump (mlcp)
  • Provenance et réification par ajout de métadonnées
  • Modules d'aide XQuery dédié aux sérialisations et aux fermetures transitives
  • Mises à jour, agrégats via les API MarkLogic
  • Parcours de graphe avec chemins de propriété et fermetures transitives
  • Inférence sémantique utilisant des jeux de règles au moment de la requête
  • Jeux de règles fournis pour RDFS, RDFS+, et OWL Horst
  • Prise en charge des jeux de règles définis par l'utilisateur
  • Prise en charge complète de SPARQL 1.1
  • Prise en charge du protocole de stockage graphique et des terminaux SPARQL
  • SPARQL depuis les plates-formes JavaScript, Node.js côté serveur
  • Prise en charge des API Jena et Sesame
  • Intégration complète avec des partenaires de technologie sémantique (Smartlogic, Pool Party, Cambridge Semantics)
  • Marklogic comprend les atouts suivants : transactions ACID, sécurité certifiée (au niveau des documents/triplets), haute disponibilité et reprise après sinistre, évolutivité et élasticité
Ils utilisent la sémantique MarkLogic

La Digital Labor Automation Platform (DLAP, plate-forme de l'automatisation du travail numérique) de KMPG conçue avec MarkLogic est à la pointe de l'automatisation intelligente, ce qui permet à KPMG d'apporter une expertise approfondie sur le reporting fiscal et réglementaire de leurs données clients de manière hautement automatisée. La société utilise la sémantique pour enrichir les documents lors de leur assimilation et pour améliorer la recherche.


MarkLogic permet de réunir différents systèmes et capacités pour permettre le partage d'informations et la création de connaissances. Ainsi, l'OCDE peut construire et promouvoir des politiques qui améliorent l'économie mondiale et le bien-être social. L'OCDE a choisi MarkLogic comme plate-forme de base de données principale pour créer un hub de données pour son nouvel environnement réseau appelé plate-forme « ONE ».


Pearson fournit des programmes éducatifs globaux de différents niveaux. L'établissement utilise MarkLogic pour stocker, gérer et livrer tout son contenu numérique à travers une expérience riche et interactive. Il utilise la puissance de la fonctionnalité multi-modèle MarkLogic avec la sémantique pour connecter les données des évaluations et les relations des étudiants avec le contenu pédagogique dans son ensemble.


Le BSI (British Standards Institution, institut des normes britanniques) publie des normes et offre des services liés à ces normes pour les entreprises du monde entier. L'institut a mis au point une application en ligne : Bristish Standards Online (BSOL) pour consulter ces normes. La nouvelle application a été conçue en intégrant la sémantique pour améliorer les recherches.

Partenaires sémantiques

Ressources supplémentaires

Les données relatives à la santé sont diverses. Il y a les tests en laboratoire, les notes des médecins, l'historique du patient, les scanners, les publications académiques, les réseaux sociaux et les registres publics, les demandes et l'historique des achats, les informations relatives aux médicaments, etc.
Lors de ce webinaire, vous apprendrez comment la recherche sémantique aide les compagnies d'assurance à agréger des données disparates et à mettre au jour les relations cachées afin de détecter et contrer les comportements frauduleux.
Dans cette session, nous allons étudier un cas concret, au cours duquel nous verrons comment MarkLogic permet à la police d'être proactive grâce à une approche centrée sur les données.

Très complet et conçu pour les entreprises

Ce site utilise des cookies.

En continuant votre navigation sur ce site, vous acceptez l'utilisation de cookies en accord avec la Déclaration de confidentialité MarkLogic.