Información práctica
Descripció
En l’entorn actual hi ha un increment exponencial de les dades. La disponibilitat d’informació de qualitat esdevé fonamental per a l’entrenament, validació i millora de models d’Intel·ligència Artificial. Tanmateix, en sectors sensibles com la defensa i la ciberseguretat, l’accés a dades reals pot estar limitat per consideracions de privacitat, confidencialitat o escassetat. És en aquest context on les dades sintètiques emergeixen com una alternativa poderosa i estratègica.
Objectius
Aquest curs pretén oferir una comprensió més profunda sobre les dades sintètiques: què són, com es generen i de quina manera poden aplicar-se en contextos reals, amb un enfocament especial en els àmbits de la seguretat i la defensa. Al llarg del curs, s’hi abordaran tant tècniques tradicionals de modelatge i simulació com enfocaments d’última generació basats en Intel·ligència Artificial Generativa.
Adreçat a
Professionals dels àmbits de defensa, ciberseguretat i anàlisi de dades que necessitin comprendre i aplicar dades sintètiques en entorns on l’accés a dades reals és limitat per privacitat, seguretat o confidencialitat.
També adreçat a analistes, enginyers, científics de dades i tècnics interessats en tècniques de generació de dades amb ML tradicional i IA Generativa, així com en la seva aplicació en simulació, detecció d’anomalies i casos d’ús en seguretat.
Programa del curs
- Introducció a les Dades Sintètiques
- Concepte, importància i reptes
- Tipus de dades sintètiques
- Aplicacions en defensa i seguretat
- Aquest mòdul ofereix una visió general sobre les dades sintètiques: què són, per què són rellevants i quins reptes presenten. S’hi exploren els diferents tipus de dades (estructurades, no estructurades, numèriques, text, imatges, àudio, senyals) i s’analitzen les seves aplicacions clau en contextos de defensa i seguretat.
- Generació de Dades Sintètiques amb ML Tradicional
- Modelatge de distribucions i simulacions probabilístiques
- Sobre-mostreig i SMOTE
- Models generatius clàssics
- Exercicis pràctics a Google Colab
- En aquest mòdul es treballen tècniques clàssiques de generació de dades, com la simulació probabilística, el sobre-mostreig (incloent-hi SMOTE) i models generatius tradicionals com la regressió, el clustering i els GMM.
- Generació de Dades Sintètiques amb IA Generativa
- Introducció a les GANs
- Autoencoders Variacionals (VAEs)
- Generació per a sèries temporals
- Models de difusió (es suggereix incloure LLMs)
- Implementació pràctica a Google Colab
- S’hi exploren tècniques avançades de generació amb intel·ligència artificial, incloent-hi xarxes generatives adversàries, autoencoders variacionals, models per a sèries temporals i models de difusió. També s’introdueixen conceptes clau sobre els models de llenguatge i el seu potencial en la generació de dades sintètiques.
- Casos d’ús aplicats
- Privacitat, ètica i regulación
- Simulació per a defensa i ciberseguretat
- Detecció d’anomalies amb dades sintètiques
- Avaluació de la qualitat de les dades generades
- Aquest mòdul connecta la teoria amb la pràctica mitjançant casos d’ús reals en ciberseguretat. S’hi aborden aspectes ètics, regulatoris i de privacitat, juntament amb simulacions aplicades i tècniques de detecció d’anomalies. Es valora la qualitat de les dades generades i es duen a terme exercicis contextualitzats.
- Tancament i Projecte Final
- Desenvolupament d’un projecte final
- Presentació i discussió
- Conclusions i propers pasos
- Els participants aplicaran tot el que han après desenvolupant un projecte basat en un escenari proposat. Es presentaran els resultats, es discutiran en grup i es reflexionarà sobre les conclusions i els reptes futurs.
Informació addicional
Tots els nostres cursos són bonificables per empreses (excepte autònoms) a través de la Fundació Estatal per a la Formació en l’Ocupació (FUNDAE).
Consultar descomptes especials per a estudiants, persones en situació d’atur, i empreses que realitzin dues o més inscripcions en un mateix curs.