Sans hallucinations, vraiment[nbsp]?

Sans hallucinations, vraiment[nbsp]?

C’est le titre un brin provocateur d’un récent papier écrit par le Stanford HAI (Human-Centred AI Group) qui a décortiqué deux solutions de RAG du marché nord-américain et en tire des conclusions plus nuancées que les discours marketing triomphant qui prétendent éradiquer définitivement le phénomène des hallucinations.

Un dataset d’évaluation de référence en matière juridique[nbsp]:[nbsp]le LegalBench

Un dataset d’évaluation de référence en matière juridique[nbsp]:[nbsp]le LegalBench

À l’heure où les applications issues des LLM dans le secteur du droit prolifèrent, il est essentiel que les juristes, et notamment les avocats, s’emparent de ce phénomène en produisant et validant des jeux de données de référence pour évaluer ces applications. Comme je l’ai montré pour la mise en place d’un chatbot ou d’un moteur de recherche interne, cela est plus simple qu’il n’y paraît, mais nécessite une bonne dose d’acculturation, de coordination et de motivation.