Les mod les de processus de d cision de Markov (PDM) sont largement utilis s pour mod liser les probl mes de prise de d cision dans de nombreux domaines de recherche. Les PDM peuvent tre facilement con us par mod lisation et simulation (M&S) l'aide du formalisme de sp cification des syst mes v nements discrets (DEVS) en raison de leurs aspects modulaires et hi rarchiques, qui am liorent l'explicabilit des mod les. En particulier, la s paration entre l'agent et les composantes de l'environnement impliqu es dans l'algorithme traditionnel d'apprentissage par renforcement, tel que l'apprentissage Q, est clairement formalis e pour am liorer l'observabilit et envisager l'int gration des composantes de l'IA dans le processus de prise de d cision. L'objectif principal de ce travail est d'offrir la possibilit de concevoir un syst me markovien avec un formalisme de mod lisation et de simulation afin d'optimiser un processus de prise de d cision avec une plus grande explicabilit gr ce la simulation. En outre, le travail comprend une tude bas e sur la gestion des processus financiers, sa sp cification en tant que syst me RL bas sur MDP, et sa mod lisation et simulation avec le formalisme DEVS.