Étiquettes

, , , ,

Pour ceux qui ont encore en mémoire le match de 1997 entre Kasparov et Deep Blue, il demeure l’idée de l’époque : déterminer la supériorité entre l’homme et la machine. Depuis, la constante évolution de l’intelligence artificielle a poursuivi son chemin, cherchant à élaborer un ordinateur possédant les attributs de l’entendement humain. Nous avons vu ainsi l’émergence d’une informatique dite cognitive. Cette dernière travaille, entre autres, sur des solutions relatives au traitement du langage et au raisonnement. Par exemple, la machine ne se limite plus à donner une réponse qui serait simplement de type oui ou non, mais développe des capacités d’adaptation plus étendues à un contexte précis.

Cette évolution dans le concept de réponse permet d’améliorer le dialogue, voir la collaboration entre l’humain et l’ordinateur. Dans cette optique, tout en restant dans l’élément de la compétitivité, un chercheur d’IBM a suggéré, en 2006, le développement d’un ordinateur pour participer au jeu télévisé Jeopardy!. Dans ce programme télévisuel, le candidat doit formuler une question à partir d’un petit texte comprenant un indice. Une équipe de 20 chercheurs et développeurs s’est vu confier cette mission et la première participation au jeu a eu lieu en 2011. Ce fût un succès  pour « Watson » (nom de l’ordinateur en question, rendant ainsi hommage au fondateur d’IBM), ce qui mit en lumière les possibilités et le potentiel du Question Answering (QA).

Les systèmes de QA ont pour but d’interpréter une question posée en langage naturel afin de fournir à l’utilisateur une réponse construite à partir d’un document correspondant. Pour réaliser cette opération, ce genre de système doit retrouver dans la littérature existante, les documents pertinents, puis extraire les réponses potentiellement attendues par l’utilisateur. Nous retrouvons ici la notion de réponse rattachée à la compréhension d’un contexte et non uniquement issue d’opérations calculatoires. Ces systèmes sont en mesure de traiter l’ensemble de la diversité du web, ce qui a été rapidement remarqué dans le contexte de la biomédecine.

Un déluge de publications

Le domaine des sciences biomédicales donne lieu à une littérature qui croit de manière toujours plus exponentielle. La quantité de données générées par la communauté scientifique est trop importante pour être traitée ou assimilée à l’échelle d’un individu. En effet, il est estimé que chaque jour, plus de 3000 nouveaux articles sont publiés dans des revues biomédicales. Ceci fait en moyenne plus de 2 articles par minute (Paliouras, Krithara 2015, p.1) [1]. Ce phénomène crée une dépendance de plus en plus forte au soutien automatisé pour la recherche. Pour cette branche, nous dépassons l’idée de jeu amené avec « Watson » pour arriver sur un concept de nécessité. Un professionnel de la branche a besoin d’un premier tri dans « l’océan » des informations pour obtenir une sélection de documents manipulable à l’échelle humaine. Un médecin par exemple, dispose de peu temps pour déterminer des pistes utiles à l’élaboration d’un diagnostic. D’autre part il doit se tenir régulièrement au courant des nouveautés dans son domaine. Au niveau pratique, les systèmes de QA font par exemple le lien entre une pathologie et les médicaments associés. L’essentiel se trouve ici, car il ne s’agit plus de retourner les bons documents mais les concepts même qui étaient attendus lors de la question. Nous pouvons ainsi définir l’objectif essentiel dans ce domaine, qui est d’obtenir rapidement (puisque la santé est souvent synonyme d’urgence) des réponses précises en effectuant le moins de lecture professionnelle possible.

Ce domaine de la recherche d’information (RI) en pleine expansion a vu naître des compétitions de moteurs de recherches. Le challenge BioASQ en est une. Elle permet d’obtenir une vue des techniques de classification de textes, d’indexation sémantique, la récupération de passage pertinent voir même l’élaboration de résumé. Ces éléments combinés peuvent permettre une réponse concise pour un usager. BioASQ vise à pousser les systèmes vers un accès à l’information biomédicale de haute précision. Les publications scientifiques qui sont retournées font partie de la collection MEDLINE, qui contient plus de 23 millions de résumés de publications couvrant l’essentiel des résultats de la médecine et de la biologie. Ce type de challenge amène un perfectionnement régulier des systèmes et ne fait que confirmer le rôle précieux qu’ils auront dans les champs cliniques et biomédicaux.

A l’heure où le concept de médecine personnalisée prend vraisemblablement de l’importance, il est probable que les systèmes de QA dans le domaine du biomédical auront un rôle important à jouer pour assister les professionnels de la santé dans la définition d’un diagnostic toujours plus précis.

Billet rédigé par Philippe Cosandey, Romilda Chalard et Alexandre Racine

[1] PALIOURAS, Georgios et KRITHARA, Anastasia, 2015. BioASQ : Final Report [en ligne]. Intelligent Information Management Targeted Competition Framework, March 2015. [Consulté le 29 décembre 2015]. FP7-318652 / BioASQ, D1.6. Disponible à l’adresse :
http://www.bioasq.org/sites/default/files/BioASQ_publishable_summary_report.pdf