American Psychological Association

L'APA compte 150 000 membres et 54 spécialités. L'un des principaux objectifs de l'association est l'échange d'informations scientifiques. À cette fin, le service des publications et des bases de données, une importante division de l'APA, publie chaque année diverses revues universitaires, des dizaines de livres et plusieurs bases de données à visée universitaires, tels que PsycINFO et PsycARTICLES.

Télécharger l'étude de cas au format PDF »


Le défi

Première source d'informations dans le domaine de la psychologie, le site de l'APA totalise plus d'un million de recherches par jour. En 2008, l'APA a migré ses contenus vers la plateforme MarkLogic. La base de données opérationnelle compte aujourd’hui un ensemble complexe de mégadonnées, tels que 160 000 articles de journaux complets, 3 millions d'extraits et 54 millions de citations remontant jusqu'au XIXe siècle. La principale difficulté de cette base de données porte sur la diversité et la complexité de ses documents. Les articles ont souvent des liens étroits qui doivent être mis en lumière afin que les chercheurs puissent travailler efficacement.

Bien que l'APA ne néglige pas la notoriété et l'efficacité du moteur de recherche Lucene, son utilisation présentait plusieurs difficultés. L'une des difficultés est son architecture en couches superposées, nécessitant des tâches de programmation, de gestion d'infrastructure et de déploiement supplémentaires, contrairement à une base de données et à une solution de recherche unifiées. De plus, les temps de réponse des recherches variaient grandement, ce qui rendait l'expérience utilisateur assez décevante. Le principal problème de Lucene était la remise dans les temps des contenus aux utilisateurs de l'APA. Avec l'implémentation basée sur Lucene, en fonction de la taille et de la complexité des packages, la préparation, la diffusion et la publication de contenus sur les sites Web de l'APA pouvaient prendre jusqu'à 48 heures.

L'APA étant la seule source faisant autorité pour ces contenus, la ponctualité de la mise en ligne est primordiale pour les auteurs, les lecteurs et les partenaires, pour qui ces ressources sont indispensables. Pour Beverly Jamison, directrice en chef des solutions de publication et de l'architecture informatique, la situation était tout bonnement inacceptable : « La recherche a un impact considérable sur l'utilisation de nos ressources par nos clients. La capacité à publier rapidement des contenus offre des avantages considérables sur le marché. »


La solution

Beverly Jamison était en quête d'une solution permettant de publier rapidement des contenus. Pour améliorer les performances de Lucene, l'équipe de développement de l'APA aurait dû consacrer un temps et des ressources considérables pour paramétrer, tester et réajuster la plateforme, le tout pour des résultats inférieurs à ceux proposés par MarkLogic en termes de solidité et de durabilité.

Pour l'APA, le choix était évident. Déjà au fait de la rapidité et de la flexibilité de MarkLogic en tant que base de données, Beverly Jamison connaissait également plusieurs grandes entreprises ayant fait confiance à MarkLogic pour la recherche et l'analyse de données. MarkLogic et sa communauté ont également gagné sa confiance : « La notion de service a été un réel soutien dans mon entreprise. Je n'ai pas rencontré un seul ingénieur incompétent chez MarkLogic ».

Au terme des premiers essais, MarkLogic a montré qu'il pouvait résoudre rapidement les problèmes rencontrés par l'APA. Lors des tests, les requêtes affichaient régulièrement des temps de réponse inférieurs à une seconde. Moins de 4 mois plus tard, l'APA a migré complètement de Lucene à MarkLogic, sans aucune interruption de service. Les clients saluent déjà l'accélération des temps de réponse. La maintenance des répertoires n'est gérée que par une seule personne. Cela a permis de libérer deux développeurs, afin que ces derniers puissent se concentrer sur de nouvelles fonctionnalités et l'amélioration des performances, et non sur le système existant. Ainsi, l'équipe a pu ajouter des fonctions de correction orthographique à la volée et de frappe anticipée quelques semaines seulement après le déploiement de la fonction de recherche. L'APA a également pu réduire le nombre de serveurs de dix à trois.

L'impact le plus important est tout simplement l'accélération des recherches et leur fiabilité accrue. 70 % des bénéfices de l'APA étant générés par la publication de contenus, le fait de pouvoir délivrer des informations en exclusivité représente un avantage crucial. MarkLogic a réduit le temps de gestion des nouveaux contenus de deux jours à seulement quelques minutes et a diminué le temps de réponse des recherches à moins d’une seconde. « Les délais de publication ont une incidence majeure sur les clients et les partenaires potentiels », explique Beverly Jamison. « Avec MarkLogic, nous pouvons mettre en place les contenus en seulement une heure, les publier en quelques minutes et effectuer des recherches et des analyses en moins d’une seconde. Ces nouvelles performances sont une révolution pour notre activité et notre technologie. »

Avec MarkLogic, nous pouvons mettre en place les contenus en seulement une heure, les publier en quelques minutes et effectuer des recherches et des analyses en moins d'une seconde. Ces nouvelles performances sont une révolution pour notre activité et notre technologie.

Beverly Jamison, directrice en chef, solutions de publication et architecture informatique, American Psychological Association

Conclusion

Pour Beverly Jamison, l'architecture de MarkLogic et la nouvelle infrastructure de l’APA offrent des avantages continus. Avant tout, l'équipe de développement peut à nouveau concevoir et tester de nouvelles applications et des fonctionnalités front-end, en seulement quelques semaines. L'APA se concentre désormais sur l'ajout de services sémantiques pour les clients et la conception de nouvelles options de visualisation. L'association simplifie continuellement son architecture et élimine progressivement ses anciens systèmes afin d'optimiser le processus de publication de livres et de revues.

En passant de Lucene à MarkLogic pour la recherche de contenus, l'APA a non seulement atteint son objectif initial, à savoir accélérer la recherche des clients, mais a également réduit ses coûts de maintenance et de matériel, tout en offrant régulièrement des temps de réponse inférieurs à une seconde. Le résultat final offre un avantage en termes de négociations pour de nouvelles activités et une infrastructure plus innovante en phase avec l'activité de l'APA.

Plus de témoignages de clients

ABN AMRO
ALM
American Psychological Association
American Society of Agronomy
Bowker
Broadridge
BSi Group
CABI
Codifyd
Condé Nast
CQ Roll Call
De Gruyter
EBCONT
Elsevier
Fairfax County, Virginia
Federal Aviation Administration
Global Nonprofit
Hannover Re
Healthcare.gov
HEROLD.at
Informatics Corporation of America
Institute of Engineering and Technology
Institute of Physics
Banque d'investissement
Banque d'investissement (Tier 1)
Banque d'investissement (Top 5)
JWG Group
Klopotek
Lagardère Active
M*Modal
Mitchell 1
MVB
National Archives & Records Administration
NBC Universal
OECD Publishing
Oxford University Press
Press Association
Princeton Theological Seminary
Reed Business Information
Royal Society of Chemistry
RSuite CMS
Springer
Thieme
Triumph Learning
University of Virginia
Warrior Gateway
Wiley
Yell.com