Procesos de Markov con costo promedio Public Deposited
En esta tesis se estudian procesos de control de Markov en espacios de Borel con costo promedio, permitiendo que la función costo sea no acotada, y que los conjuntos de controles admisibles en cada estado no sean compactos. El objetivo principal consiste en proponer condiciones que garanticen la existencia de políticas óptimas y que permitan. caracterizar dichas políticas, así como el valor promedio óptimo, mediante técnicas de Programación Dinámica. Las condiciones propuestas en este trabajo están dadas principalmente en base a la función de valor óptimo para problemas de control con costo total descontado, por lo que el trabajo cae en el ·contexto del método del "factor de descuento desvaneciente". Tales condiciones permiten obtener soluciones de la desigualdad y de la ecuación de optimalidad, que a su vez permiten obtener y caracterizar políticas óptimas y el valor promedio óptimo. Bajo condiciones adicionales, también se obtiene la convergencia del algoritmo de iteración de valores. La generalidad de nuestras condiciones permite que sean aplicables a la mayoría de los modelos de control de Markov que surgen en la teoría de control estocástico en tiempo discreto. Esto permite, en particular, ilustrar nuestros resultados con el problema del regulador lineal con costo cuadrático, para el cual no son aplicables resultados anteriores.
Des relations
Dans l'ensemble administratif: |
---|
Descriptions
Nom d'attribut | Valeurs |
---|---|
Creador | |
Contributeurs | |
Tema | |
Editor | |
Idioma | |
Identificador | |
Mot-clé | |
Año de publicación |
|
Tipo de Recurso | |
Derechos | |
División académica | |
Línea académica | |
Licencia |