Procesos de Markov con costo promedio Público Deposited

En esta tesis se estudian procesos de control de Markov en espacios de Borel con costo promedio, permitiendo que la función costo sea no acotada, y que los conjuntos de controles admisibles en cada estado no sean compactos. El objetivo principal consiste en proponer condiciones que garanticen la existencia de políticas óptimas y que permitan. caracterizar dichas políticas, así como el valor promedio óptimo, mediante técnicas de Programación Dinámica. Las condiciones propuestas en este trabajo están dadas principalmente en base a la función de valor óptimo para problemas de control con costo total descontado, por lo que el trabajo cae en el ·contexto del método del "factor de descuento desvaneciente". Tales condiciones permiten obtener soluciones de la desigualdad y de la ecuación de optimalidad, que a su vez permiten obtener y caracterizar políticas óptimas y el valor promedio óptimo. Bajo condiciones adicionales, también se obtiene la convergencia del algoritmo de iteración de valores. La generalidad de nuestras condiciones permite que sean aplicables a la mayoría de los modelos de control de Markov que surgen en la teoría de control estocástico en tiempo discreto. Esto permite, en particular, ilustrar nuestros resultados con el problema del regulador lineal con costo cuadrático, para el cual no son aplicables resultados anteriores.

Relacionamentos

No conjunto administrativo:

Descrições

Nome do AtributoValores
Creador
Colaboradores
Tema
Editor
Idioma
Identificador
Palavra-chave
Año de publicación
  • 1994
Tipo de Recurso
Derechos
División académica
Línea académica
Licencia
Última modificação: 12/21/2023
Citações:

EndNote | Zotero | Mendeley

Unid