Información práctica
Introducción
En el entorno actual hay un incremento exponencial de los datos. La disponibilidad de información de calidad pasa a ser fundamental para el entrenamiento, validación y mejora de modelos de Inteligencia Artificial. Sin embargo, en sectores sensibles como la defensa y la ciberseguridad, el acceso a datos reales puede estar limitado por consideraciones de privacidad, confidencialidad o escasez. Es en este contexto donde los datos sintéticos emergen como una alternativa poderosa y estratégica.
Objetivos del curso
Este curso pretende proporcionar una mayor comprensión sobre los datos sintéticos: qué son, cómo se generan y de qué manera pueden aplicarse en contextos reales, con un enfoque especial en los ámbitos de la seguridad y la defensa. A lo largo del curso, se abordarán tanto técnicas tradicionales de modelado y simulación como enfoques de última generación basados en Inteligencia Artificial Generativa.
Dirigido a
Profesionales de los ámbitos de defensa, ciberseguridad y análisis de datos que necesiten comprender y aplicar datos sintéticos en entornos donde el acceso a datos reales es limitado por razones de privacidad, seguridad o confidencialidad.
También dirigido a analistas, ingenieros, científicos de datos y técnicos que quieran aprender técnicas de generación de datos tanto con ML tradicional como con IA Generativa, así como su aplicación en simulación, detección de anomalías y casos de uso de seguridad.
Programa del curso
- Introducción a los Datos Sintéticos
- Concepto, importancia y retos
- Tipos de datos sintéticos
- Aplicaciones en defensa y seguridad
- Este módulo ofrece una visión general sobre los datos sintéticos: qué son, por qué son relevantes y qué desafíos conllevan. Se exploran los distintos tipos de datos (estructurados, no estructurados, numéricos, texto, imágenes, audio, señales) y se analizan sus aplicaciones clave en contextos de defensa y seguridad.
- Generación de Datos Sintéticos con ML Tradicional
- Modelado de distribuciones y simulaciones probabilísticas
- Sobre-muestreo y SMOTE
- Modelos clásicos generativos
- Ejercicios prácticos en Google Colab
- En este módulo se abordan técnicas clásicas de generación de datos, como la simulación probabilística, el sobre-muestreo (incluido SMOTE) y modelos generativos tradicionales como regresión, clustering y GMM.
- Generación de Datos Sintéticos con IA Generativa
- Introducción a GANs
- Variational Autoencoders (VAEs)
- Generación para series temporales
- Modelos de difusión (se sugiere incluir LLMs)
- Implementación práctica en Google Colab
- Se exploran técnicas avanzadas de generación con inteligencia artificial, incluyendo redes generativas adversariales, autoencoders variacionales, modelos para series temporales y modelos de difusión. También se introducen conceptos clave sobre modelos de lenguaje y su potencial en la generación de datos sintéticos.
- Casos de Uso Aplicados
- Privacidad, ética y regulación
- Simulación para defensa y ciberseguridad
- Detección de anomalías con datos sintéticos
- Evaluación de la calidad de los datos generados
- Este módulo conecta la teoría con la práctica mediante casos de uso reales y ciberseguridad. Se abordan aspectos éticos, regulatorios y de privacidad, junto con simulaciones aplicadas y técnicas de detección de anomalías. Se evalúa la calidad de los datos generados y se realizan ejercicios prácticos contextualizados.
- Cierre y Proyecto Final
- Desarrollo de un proyecto final
- Presentación y discusión
- Conclusiones y próximos pasos
- Los participantes aplicarán todo lo aprendido desarrollando un proyecto basado en un escenario propuesto. Se presentarán los resultados, se discutirán en grupo y se reflexionará sobre las conclusiones y retos.
Información adicional
Todos nuestros cursos son bonificables por empresas (excepto autónomos) a través de la Fundación Estatal para la Formación en la Ocupación (FUNDAE).
Consultar descuentos especiales para estudiantes, personas en situación de paro, y empresas que realicen dos o más inscripciones en un mismo curso.