Información práctica
Introducción
La mineria, anàlisi i visualització de dades representen una aposta estratègica per a la digitalització i la innovació en les organitzacions. A través d’aquestes tecnologies, les empreses poden identificar patrons no evidents, anticipar tendències de mercat, optimitzar processos productius i prendre decisions més informades i eficaces. L’aplicació d’eines d’Intel·ligència Artificial (IA) i Machine Learning (ML) permet optimitzar la gestió de grans volums d’informació, garantint la fiabilitat, la seguretat i la qualitat de les dades, i impulsant la competitivitat empresarial. La formació s’adapta als requeriments de cada empresa, facilitant la transferència directa de coneixement als reptes específics del seu negoci.
Els primers mòduls de programació en Python s’adaptaran al nivell inicial dels participants. A l’inici del curs, es farà una avaluació diagnòstica per garantir que tots els assistents disposen dels coneixements bàsics del llenguatge, independentment de la formació prèvia. A més, es proporcionaran cursets de Python previs a la formació principal, assegurant que el bloc pràctic s’inicia amb un nivell homogeni entre els alumnes.
Objetivos
Dirigido a
Curso dirigido a empresas que quieran formar a sus directivos, gestores e ingenieros en Big Data, analítica avanzada y Machine Learning para mejorar la toma de decisiones y la transformación digital interna.
Programa
-
- INTRODUCCIÓN AL BIG DATA
- Digitalización, Big Data y el ciclo de vida del dato
- Arquitecturas Big Data (ETL, Batch & Stream processing, Lambda & Kappa, Data Warehouse & Data Lake, …)
- Stack genérico y arquitectura Big Data de referencia
- Ecosistema Apache Hadoop (Hadoop, Yarn, Map Reduce, Spark, …) y otras opciones para la gestión y procesado de grandes volúmenes de datos
- Herramientas de visualización de datos
- Práctica: Generación y captura de datos, Publicación sistema publish-subscribe- Procesado – Visualización
- FUNDAMENTOS DE ESTADÍSTICA ENFOCADA A BIG DATA
- Conceptos básicos de datos
- Probabilidad
- Distribución de variables aleatorias
- Base para la inferencia
- Regresión lineal – Mínimos cuadrados y ecuaciones normales
- Regresión logística
- Regresión múltiple
- Utilización de modelos estadísticos y técnicas de pronóstico para comprender el futuro
- Prácticas
- METODOLOGÍA CRISP-DM PARA EL DESARROLLO DE PROYECTOS DE CIENCIA DE DATOS
- Business Understanding
- Data Understanding
- Exploratory Data Analysis
- Data Preparation
- Data cleaning
- Imputación de valores
- Feature engineering
- Variables selection
- Modeling
- Hyperparámetros y Cross-validation
- Evaluation
- Deployment
- Prácticas
- APRENDIZAJE AUTOMÁTICO
- Comprensión de los principales tipos de aprendizaje automático
- Supervised learning Aprendizaje supervisado
- Regresión y métricas
- Clasificación y métricas
- Modelos lineales
- Stochastic Gradient Descent
- Árbol de decisión
- Suport Vector Machines
- Models ensamblados
- Random Forest
- Gradient Boosting machines
- Prácticas
- UNSUPERVISED LEARNING (APRENDIZAJE NO SUPERVISADO)
- K-means clustering
- Hierarchical clustering
- Novelty and Outlier Detection
- Reducción de la dimensionalidad
- Prácticas
- INTRODUCCIÓN A LAS REDES NEURONALES
- Prácticas
Competencias adquiridas
- Conocimientos técnicos en Big Data y sus arquitecturas.
- Habilidades en Python para la manipulación y análisis de datos.
- Conocimientos estadísticos para el análisis e inferencia de datos.
- Capacidad para aplicar metodologías de ciencia de datos en proyectos reales.
- Experiencia práctica en técnicas de aprendizaje automático y redes neuronales.
Información adicional
Todos nuestros cursos son bonificables para empresas (excepto autónomos) a través de la Fundación Estatal para la Formación en el Empleo (FUNDAE).
Consultar descuentos especiales para estudiantes, personas en situación de desempleo, y empresas que realicen dos o más inscripciones en un mismo curso.