Actualités

Microsoft publie GraphRAG 2.0 avec intégration améliorée des graphes de connaissances

3 octobre 2025
5 min de lecture
Équipe de Recherche Ailog

Microsoft Research dévoile GraphRAG 2.0, avec extraction d'entités améliorée, cartographie des relations, et 40% de meilleure précision sur les requêtes multi-sauts complexes.

Présentation

Microsoft Research a publié GraphRAG 2.0, une mise à jour majeure de leur système de récupération augmenté par graphe qui combine les graphes de connaissances avec la recherche vectorielle traditionnelle pour améliorer les réponses aux questions.

Améliorations principales

Extraction d'entités améliorée

GraphRAG 2.0 introduit un nouveau modèle neuronal d'extraction d'entités qui atteint 92% de précision sur des documents techniques complexes, contre 78% dans la version précédente.

DEVELOPERpython
# Example entity extraction entities = graphrag.extract_entities(document) # Output includes: # - Named entities (people, organizations, locations) # - Technical concepts # - Relationships between entities # - Confidence scores

Cartographie des relations

La nouvelle version détecte et cartographie automatiquement les relations entre entités, créant un graphe de connaissances riche qui permet le raisonnement multi-sauts.

Gains de performance :

  • Amélioration de 40% sur les questions multi-sauts
  • Réduction de 25% des hallucinations
  • Meilleure gestion de la désambiguïsation des entités

Architecture de recherche hybride

GraphRAG 2.0 combine trois méthodes de recherche :

  1. Similarité vectorielle : Recherche sémantique dans les documents
  2. Traversée de graphe : Suivi des relations entre entités
  3. Correspondance textuelle : Récupération basée sur les mots-clés

Les résultats sont fusionnés à l'aide d'un modèle de classement appris.

Résultats de benchmark

Testé sur le dataset HotpotQA (questions multi-sauts) :

MétriqueGraphRAG 1.0GraphRAG 2.0Amélioration
Exact Match52.3%73.1%+39.8%
F1 Score64.7%81.2%+25.5%
Answer Recall71.2%89.4%+25.6%

Cas d'usage

GraphRAG 2.0 excelle particulièrement dans :

  • L'analyse d'articles de recherche (suivi des réseaux de citations)
  • La revue de documents juridiques (traçabilité des précédents de jurisprudence)
  • La documentation technique (compréhension des relations entre composants)
  • Les bases de connaissances d'entreprise (connexion d'informations cloisonnées)

Implémentation

Disponible sous forme de package Python open-source :

DEVELOPERpython
from graphrag import GraphRAG # Initialize with your documents rag = GraphRAG( documents=documents, embedding_model="text-embedding-3-large", graph_extraction_model="gpt-4" ) # Build knowledge graph rag.build_graph() # Query with graph-aware retrieval answer = rag.query( "How does component A interact with system B?", use_graph_traversal=True, max_hops=3 )

Limitations

Bien que puissant, GraphRAG 2.0 présente certaines contraintes :

  • Coût computationnel plus élevé (la construction du graphe est coûteuse)
  • Nécessite des données structurées ou semi-structurées pour de meilleurs résultats
  • La qualité du graphe dépend de la précision de l'extraction d'entités
  • Pas idéal pour les requêtes purement sémantiques/floues

Disponibilité

  • Open source sur GitHub
  • Supporte OpenAI, Azure OpenAI et les LLMs locaux
  • Nécessite Python 3.10+
  • Image Docker disponible pour un déploiement facile

Impact sur l'industrie

GraphRAG représente une évolution vers des systèmes de récupération hybrides qui combinent plusieurs paradigmes. Les premiers utilisateurs rapportent des améliorations significatives dans le traitement de requêtes complexes, particulièrement dans des domaines avec de riches relations entre entités.

Directions futures

Microsoft Research a indiqué que les versions futures se concentreront sur :

  • L'inférence automatique de schéma de graphe
  • Les mises à jour de graphe en temps réel
  • Le support d'entités multimodales (images, tableaux)
  • La construction de graphes fédérés à travers plusieurs bases de connaissances

Ressources

  • GitHub: github.com/microsoft/graphrag
  • Article: "GraphRAG 2.0: Graph-Augmented Retrieval for Complex Question Answering"
  • Documentation: microsoft.github.io/graphrag

Tags

GraphRAGMicrosoftknowledge graphsresearch

Articles connexes

Ailog Assistant

Ici pour vous aider

Salut ! Pose-moi des questions sur Ailog et comment intégrer votre RAG dans vos projets !