Uma abordagem baseada em programação dinâmica aproximada para o problema de corte de estoque multiperíodo estocástico

Abstract

Formula-se o problema de corte de estoque multiperíodo estocástico como um processo de decisão markoviano. Devido ao tamanho do espaço de estados, desenvolve-se uma solução por meio de programação dinâmica aproximada. Propõe-se uma política parametrizada com base em uma aproximação linear da função de valor do pós-estado. Para um dado estado, a decisão sobre quantos objetos devem ser cortados em cada padrão de corte para atender a demanda por itens corresponde a um programa linear inteiro. Desenvolve-se um algoritmo para a otimização online da política com uso de um filtro de Kalman. Experimentos computacionais são realizados para ilustrar a aplicação da abordagem com uso de dados reais de corte de barras de aço em obras de construção civil. Os resultados indicam que o desempenho da política propostá e superior a uma política míope.

Publication
XIV Conferência Brasileira de Dinâmica, Controle e Aplicações - DINCON 2019
Avatar
Arthur H. F. Murta
Reinforcement learning

Related