La ubicación de plataformas de despegue y aterrizaje a baja altitud (vertipuertos) es un desafío fundamental para el desarrollo de la movilidad aérea urbana (UAM). Este estudio formula este problema como una variante del problema de localización de instalaciones con capacidad, incorporando restricciones de alcance de vuelo y capacidad de servicio, y propone SPID, un marco de solución basado en aprendizaje profundo por refuerzo (DRL) que modela el problema como un proceso de decisión de Markov. Para manejar la cobertura dinámica, el marco SPID basado en DRL utiliza un mecanismo de atención multi-cabeza para capturar patrones espacio-temporales, seguido por la integración de información dinámica y estática en un vector de estado de entrada unificado. Luego, se utiliza una unidad recurrente con puertas (GRU) para generar el vector de consulta, mejorando así la toma de decisiones secuenciales. La red de acciones dentro de la red DRL está regulada por una función de pérdida que integra costos de distancia de servicio con penalizaciones por demanda insatisfecha, lo que permite una optimización de extremo a extremo. Los resultados experimentales posteriores demuestran que SPID mejora significativamente la eficiencia y robustez de la solución en comparación con los métodos tradicionales bajo restricciones de vuelo y capacidad. En especial, en las métricas de desempeño social enfatizadas en este estudio, SPID supera las soluciones subóptimas producidas por métodos tradicionales de agrupamiento y métodos basados en redes neuronales gráficas (GNN) hasta en aproximadamente un 29%. Esta mejora viene con un aumento en el costo basado en la distancia que se mantiene dentro del 10%. En general, demostramos un enfoque eficiente y escalable para la ubicación de vertipuertos, apoyando la toma rápida de decisiones en escenarios UAM a gran escala.
Keywords
Planificación a baja altitud; Ubicación de vertipuertos; Aprendizaje profundo por refuerzo; Exploración de algoritmos