MarkLogic Deployment Accelerator for Hadoop

MarkLogic Deployment Accelerator for Hadoop booste les projets qui intègrent la base de données Enterprise NoSQL de MarkLogic et Hadoop. Nous vous conseillons sur l'orientation technique, vous fournissons des documents d'architecture et de conception, ainsi qu'un support de mise en œuvre afin de créer un premier prototype viable.

Si vous avez déjà Hadoop et que vous souhaitez profiter de MarkLogic pour des analyses et un accès en temps réel aux données, ou si vous avez déjà MarkLogic et que vous souhaitez améliorer votre implémentation avec un stockage économique avec Hadoop, MarkLogic peut vous aider.

Télécharger le PDF


Aperçu

Les Services Consulting de MarkLogic développent depuis plus de dix ans des systèmes en temps réel de grande taille pour des ensembles de données non structurés et hétérogènes. Nous vous proposons une expérience du terrain favorisant la réussite des utilisateurs finaux, disposons de bonnes pratiques pour ces systèmes et connaissons tous les pièges. Accelerator for Hadoop se sert de l'expérience étendue de MarkLogic pour le déploiement combiné de Hadoop et de MarkLogic.

MarkLogic s'intègre désormais dans l'écosystème de Hadoop, tout comme Pig, Hive, HBase ou d'autres technologies. Avec MarkLogic, MapReduce travaille désormais directement sur les données MarkLogic et les forests MarkLogic peuvent être stockées directement dans HDFS. MarkLogic Content Pump déplace les données entre les couches de stockage dans MarkLogic ou Hadoop à l'aide de processus parallèles massifs qui offrent la rapidité et l'évolutivité horizontale requises par les déploiements de grande envergure.

Dans le cadre de MarkLogic Deployment Accelerator, les consultants MarkLogic analyseront les différents formats et types de données que vous avez, la manière dont ceux-ci doivent être utilisés et quels composants sont le plus à même de les traiter. Nous fournissons les documents de conception, configurons les outils et technologies MarkLogic et créons des prototypes opérationnels pour vous aider à démarrer.


Détails du service

Les activités effectuées dans le cadre de MarkLogic Deployment Accelerator for Hadoop varient en fonction de vos besoins et de la façon dont vous voulez associer MarkLogic à Hadoop.

Intégration de MarkLogic à un écosystème Hadoop existant

Si vous avez déjà Hadoop, il est probable que vous ayez maintenant besoin de mettre à disposition des utilisateurs, toutes les informations de manière précise et pertinente. Hadoop et MarkLogic traitent tous les deux n'importe quelles données dans n'importe quel format, ce qui est certes puissant, mais peut poser des problèmes en raison de la diversité des données et de leur structure. Le fait de pouvoir centraliser toutes les données ne résout pas immédiatement les problèmes découlant de données hétérogènes ou non structurées ; par ailleurs, cela ne garantit pas qu'elles soient disponibles en temps réel, ni de manière dynamique.

Depuis plus de dix ans, les Services Consulting de MarkLogic ont permis de rendre immédiatement utilisables des données non structurées et diversifiées, avec la même agilité que celle que vous avez pu observée lors de l'ajout de nouvelles données dans Hadoop/HDFS. MarkLogic Server est capable d'extraire des données depuis HDFS, stocker des données directement dans HDFS et utiliser Hadoop MapReduce sur des partitions MarkLogic au sein ou hors de HDFS. Hadoop Accelerator est conçu pour naviguer parmi ces options et d'autres encore, non pas comme un exercice purement technique, mais pour résoudre de réels problèmes et apporter notre expérience Big Data pour relever les défis propres à votre entreprise.

Intégration de Hadoop à un déploiement MarkLogic existant

Si vous disposez déjà d'un cluster MarkLogic opérationnel, nous vous expliquerons comment utiliser Hadoop pour que votre installation MarkLogic existante fonctionne mieux ou à un moindre coût. Les déploiements MarkLogic mettent généralement l'accent sur l'analyse et l'accès aux données en temps réel, plutôt que par étapes intermédiaires, ETL ou encore par lots ; une utilisation appropriée de Hadoop peut renforcer MarkLogic dans ces domaines, en réduisant votre TCO et en augmentant l'agilité.

  • Les déploiements MarkLogic peuvent stocker des données sur Hadoop HDFS, permettant ainsi un stockage moins onéreux qu'un réseau SAN
  • Les tâches Hadoop MapReduce peuvent s'exécuter directement sur les données MarkLogic, de manière parallèle et massive, sans programmation compliquée
  • Les données plus anciennes, de moindre importance peuvent être déplacées de MarkLogic vers un cluster Hadoop distinct pour un traitement par lots plus lent, tout en conservant la pleine puissance de MarkLogic sur vos données les plus précieuses

MarkLogic Deployment Accelerator for Hadoop vous accompagne sur ces points et d'autres choix technologiques pour déplacer les données au bon endroit et au bon format, utiliser les outils adéquats et fournir des informations précieuses aux utilisateurs.


Approche du déploiement MarkLogic

Conception et Architecture

Deployment Accelerator inclut la fourniture de documents de conception et d'architecture qui définissent les flux de données, les transformations et les modèles de traitement. L'équipe MarkLogic examinera les données disponibles, leur provenance et la manière dont elles doivent être utilisées, et utilisera ces informations pour développer et fournir une conception adaptée à votre entreprise.

Installation et Configuration

Après livraison, discussion et accord sur l'approche de conception avec votre équipe, les conseillers MarkLogic identifieront les principales tâches d'installation et de configuration à effectuer. Celles-ci peuvent inclure l'installation de MarkLogic Server, sa configuration pour communiquer avec Hadoop ou stocker de données directement dans HDFS, ainsi que le déploiement de MarkLogic Content Pump pour déplacer des données.

Mise en œuvre

Pour profiter le plus vite possible de votre déploiement Hadoop et MarkLogic, nous collaborons avec vos développeurs pour créer les premiers flux de données et processus, et exposer les données en tant que services ou applications d'accès aux informations. Ces tâches concrètes permettront de former vos propres développeurs et de mettre de côté le travail sur le code qui pourra être davantage effectué par votre équipe. Si nos activités de conception et d'architecture recommandent certaines orientations pour l'ensemble de la démarche Hadoop, nos efforts de mise en œuvre se concentrent sur les technologies MarkLogic.


Nous contacter

Pour vous lancer avec MarkLogic Consulting Services ou obtenir de plus amples informations, vous pouvez contacter votre chargé de compte, composer le 1-877-992-8885 ou nous envoyer un e-mail à l'adresse sales@marklogic.com.