Management and Access of Biomedical knowledge through Ontology network

Résumé du projet

La gestion des connaissances, l’ingénierie des ontologies et le web sémantique, sous-domaines de l’Intelligence Artificielle, ont été au cœur de plusieurs projets de recherche dans les vingt dernières années en Afrique de l’ouest (Sénégal,Burkina Faso et Côte d’Ivoire) et centrale (Cameroun). Des dizaines de thèses et de mémoires de recherche ont été soutenus en collaboration avec des équipes spécialisées du nord et particulièrement en France (INRIA et laboratoires universitaires). Deux axes phares ont été développés et concernent d’une part,la gestion des connaissances et l’ingénierie des ontologies en santé et épidémiologie avec les thèses de (Camara, 2013 ; Kouamé, 2018), et d’autre part,les wikis sémantiques avec les thèses de (Diallo, 2016 ; Kaladzavi, 2016 ;Traoré, 2017 ; Kouamé, 2018) dans le cadre du projet Knowledge-Ontology-Culture-Community (KOCC) portant sur la modélisation d’ontologies des connaissances socioculturelles africaines initié au sein de l’équipe Informatique du Laboratoire d’Analyse Numérique et d’Informatique(LANI) de l’Université Gaston Berger de Saint-Louis.

A ce jour, plusieurs travaux méthodologiques et d’ingénierie ont été réalisés pour la construction d’ontologies dans le domaine biomédicale :

  • IDOSCHISTO : une ontologie de la schistosomiase au Sénégal (Camara et al., 2014)

  • IDOMEN : une ontologie de la méningite au Burkina Faso (Béré et al., 2017)

  • ontoEPICAM : une ontologie de la tuberculose au Cameroun (Azanzi and Camara, 2017)

  • OntoMEDTRAD : une ontologie de la médecine traditionnelle en Côte d’Ivoire (Kouamé et al., 2015)

Cependant, toutes ces ontologies résultantes sont spécifiques à leurs sous-domaines respectifs et ont été conçues pour une application donnée. Aussi, leur stade de développement nécessite des étapes additionnelles de validation et d’adoption. Toutes choses qui constituent des points d’insuffisances notifiés comme suit :

  • une absence de cadre méthodologique commun de conception de ces ontologies ;

  • une absence d’abstraction permettant de favoriser la réutilisation de modules ontologies noyaux existants ;

  • une absence d’une plateforme d’accès (par exemple un wiki) à ces connaissances biomédicales parles communautés d’utilisateurs ;

  • une faible interopérabilité sémantique des applications existantes ;

  • une visibilité très faible de ces ontologies par les communautés professionnelles ;

  • un frein pour une utilisation accrue et transversale de ces ontologies pour la production et la capitalisation de connaissances ;

  • un frein à la production d’applications intelligentes à base de ces ontologies.

Face à ces problématiques, des objectifs ont été fixé. Pour atteindre ces objectifs, nous nous appuyons sur une équipe expérimentée dans la construction des ontologies biomédicales et la construction de wikis sémantiques. Les membres de l’équipe sont les acteurs clefs des différents projets et thèses ayant fourni les acquis(ontologies et méthodes) sur lesquels se base le projet MABO. Par exemple, le fait que les concepteurs des ontologies soient impliqués dans la mise en place du framework de modélisation et d’intégration d’ontologies biomédicales  est un atout majeur car  l’une des limites des projets d’intégration d’ontologies provient du fait que les concepteurs des ontologies sont souvent différents des aligneurs/intégrateurs. Par ailleurs, ce projet se trouve au cœur d’une collaboration sud-sud et un partenariat inter-régional (Afrique centrale et Afrique de l’Ouest). Il réunit des chercheurs venant de quatre pays : Sénégal, Burkina-Faso,Cameroun et Côte d’ivoire.

Contexte

Ce projet de recherche se place dans un contexte africain où la problématique principale est celle du développement économique et social et des moyens pour y accéder. En effet, après l’échec et la remise en cause de plusieurs modèles de développement ces dernières décennies, la recherche théorique semble se tourner vers des approches du développement basées sur les connaissances (UNESCO, 2013). La place du savoir, des sciences et des technologies dans la dynamique actuelle de la croissance donne lieu à une intense réflexion au sein du champ économique. En particulier, de nombreux auteurs soulignent que l’on serait entré dans une nouvelle phase du développement basée sur la connaissance succédant à une phase d’accumulation de capital physique.

Cependant, l’univers des connaissances est une énigme et il est difficile de le percevoir dans sa totalité. Pour comprendre, enseigner,produire des nouvelles connaissances, communiquer et appliquer des traitements appropriés, etc., il faut l’organiser, lui dessiner des frontières, lui donner des attributs, des composantes distinctes et les relier, les unes aux autres. Selon (Polity, 2003) par organisation et gestion des connaissances, il faut entendre :

« toutes sortes de schéma d’organisation allant des simples listes alphabétiques ou faiblement structurées (listes d’autorités, glossaires, dictionnaires, nomenclatures,etc.) à des schémas classificatoires hiérarchiques (plans de classement,classifications générales ou spécialisées, taxinomies, listes des vedettes,matières, etc.) ou encore à des organisations privilégiant des relations non-exclusivement hiérarchiques (thésaurus, réseaux sémantiques, ontologies,etc.) portant sur toutes sortes d’objets allant des documents au sens classique du terme (texte, images fixes et animées, enregistrements sonores etc.) jusqu’à l’ensemble des phénomènes concrets ou abstraits que l’on peut avoir besoin de recenser, d’organiser et de traiter (objets, événements, processus, etc.) avec des buts et d’objectifs divers : retrouver, enseigner, produire de nouvelles connaissances, communiquer appliquer des traitements appropriés, etc. ».

Les outils d’organisation/gestion catégorisés dans cette définition sont des vocabulaires qui de manière implicite (ré)organisent tous les aspects de la société et de toutes les sociétés pour une gestion efficace des savoirs. Les sociétés africaines et ses connaissances sont les plus concernées : d’abord transmises de générations en générations sous l’emprise de la tradition orale, ensuite perturbées par des événements sociaux ou sociétaux tels que l’esclavage, la colonisation, les conflits et les génocides, les connaissances africaines ont d’abord besoin d’une capitalisation, d’une formalisation, d’une (ré)organisation et ensuite d’une exploitation efficace à l’heure du modèle de développement basé sur les connaissances.

Nos travaux se focalisent essentiellement sur les modèles de représentation des connaissances basés sur les ontologies. Le principal objectif des ontologies est de doter des applications d’une couche sémantique. Cette couche sémantique a pour objectif d’aiguiser la recherche d’information ,d’automatiser l’indexation, d’organiser des connaissances, de rendre possible le raisonnement et ainsi donc faciliter l’intégration sémantique et l’intégration des savoirs locaux. En particulier, l’apport de l’annotation sémantique des connaissances biomédicales peut être perçu au moins sur les aspects suivants : l’organisation, la capitalisation, la diffusion, l’accès et la valorisation.

Problèmatique

La dynamique de la communauté de Web sémantique et d’Ingénierie des Connaissances a abouti à la construction de multiples ontologies, parfois pour un même domaine de connaissance. C’est le cas de multiples ontologies conçues dans le domaine biomédical en Afrique pour des maladies telles que la méningite au Burkina Faso (Béré et al. 2017), la schistosomiase au Sénégal (Camara et al., 2014), la tuberculose au Cameroun (Azanzi and Camara, 2017) et la Médecine Traditionnelle en Côte d’Ivoire (Kouamé et al., 2014). Ces ontologies interviennent d’une manière ou d’une autre dans des applications de surveillance épidémiologique de ces maladies dans leurs pays de conception respectifs. Aujourd’hui, nous voulons mettre en place une plateforme de surveillance épidémiologique intégrée à l’échelle sous-régionale. Ainsi, la problématique d’intégration de ces ontologies existantes se pose. De plus, nous devons anticiper sur les besoins futurs de construction de nouvelles ontologies d’autres maladies en proposant un cadre de modélisation abstrait favorisant la réutilisation de composants ontologiques existants. En outre, l’accès aux experts de domaine reste un obstacle majeur à l’acquisition de connaissances pour la construction des ontologies. C’est pourquoi nous intégrons dans notre projet un volet d’acquisition de connaissances à partir de ressources ontologiques et non ontologiques pour surmonter ces limites. Par ailleurs, pour une meilleure production collaborative et une meilleure dissémination des connaissances du domaine biomédicales dans le cadre de la surveillance épidémiologique, le web constitue un support indispensable à travers les wikis sémantiques. La qualité de la connexion Internet nous pousse aussi à recourir à un accès mobile optimisé d’autant plus que les terminaux mobiles ont atteint un niveau d’ubiquité avancés dans les communautés africaines.