Información práctica
Fecha y horarios
Introducción
La tecnología de minería, análisis y visualización de datos ofrece grandes posibilidades en la resolución de problemas y la previsión de tendencias ya que permite extraer información no evidente tanto de los conjuntos de datos existentes como de los recogidos en tiempos de ejecución.
Objetivos
- Ofrecer una introducción a las tecnologías y metodologías para la extracción de información en grandes conjuntos de datos, tanto ya existentes como de los recogidos en tiempos de ejecución.
- Mejorar los conocimientos técnicos en Data Mining.
Dirigido a
Todo aquel profesional que se quiera adentrar en el mundo de la ciencia de datos y la inteligencia artificial.
Programa
MÓDULO 1: INSTALACIÓN Y CONFIGURACIÓN DE PYTHON
- Preparación de entorno de trabajo personal para las prácticas
MÓDULO 2: INTRODUCCIÓN A PYTHON PARA LA CIENCIA DE LOS DATOS
- Introducción a Python
- Variables, tipos de datos y operadores.
- Estructuras de control de flujo: if, else, for, while.
- Funciones y bibliotecas estándar.
- Manipulación de datos con NumPy y Pandas
- Matplotlib
- Prácticas
MÓDULO 3: INTRODUCCIÓN AL BIG DATA
- Digitalización, Big Data y el ciclo de vida del dato
- Arquitecturas Big Data (ETL, Batch & Stream processing, Lambda & Kappa, Data Warehouse & Data Lake, …)
- Stack genérico y arquitectura Big Data de referencia
- Ecosistema Apache Hadoop (Hadoop, Yarn, Map Reduce, Spark, …) y otras opciones para la gestión y procesado de grandes volúmenes de datos
- Herramientas de visualización de datos
- Práctica: Generación y captura de datos, Publicación sistema publish-subscribe- Procesado – Visualización
MÓDULO 4: FUNDAMENTOS DE ESTADÍSTICA ENFOCADA A BIG DATA
- Conceptos básicos de datos
- Probabilidad
- Distribución de variables aleatorias
- Base para la inferencia
- Regresión lineal – Mínimos cuadrados y ecuaciones normales
- Regresión logística
- Regresión múltiple
- Utilización de modelos estadísticos y técnicas de pronóstico para comprender el futuro
- Prácticas
MÓDULO 5: METODOLOGÍA CRISP-DM PARA EL DESARROLLO DE PROYECTOS DE CIENCIA DE DATOS
- Business Understanding
- Data Understanding
- Exploratory Data Analysis
- Data Preparation
- Data cleaning
- Imputación de valores
- Feature engineering
- Variables selection
- Modeling
- Hyperparámetros y Cross-validation
- Evaluation
- Deployment
- Prácticas
MÓDULO 6: APRENDIZAJE AUTOMÁTICO
- Comprensión de los principales tipos de aprendizaje automático
- Supervised learning Aprendizaje supervisado
- Regresión y métricas
- Clasificación y métricas
- Modelos lineales
- Stochastic Gradient Descent
- Árbol de decisión
- Suport Vector Machines
- Models ensamblados
- Random Forest
- Gradient Boosting machines
- Prácticas
MÓDULO 7: UNSUPERVISED LEARNING (APRENDIZAJE NO SUPERVISADO)
- K-means clustering
- Hierarchical clustering
- Novelty and Outlier Detection
- Reducción de la dimensionalidad
- Prácticas
MÓDULO 8: INTRODUCCIÓN A LAS REDES NEURONALES
- Prácticas
Aprende con expertos de la industria

Núria Nievas
Docente del curso – Investigadora en Inteligencia Artificial Aplicada en Eurecat
Núria Nievas es investigadora en la unidad de Inteligencia Artificial Aplicada de Eurecat, donde desarrolla soluciones de optimización para la toma de decisiones en entornos industriales y empresariales. Su trabajo se centra en la aplicación de algoritmos de optimización multicriterio, aprendizaje automático y aprendizaje por refuerzo. Ha participado en diversos proyectos de I+D a nivel nacional y europeo relacionados con el análisis de datos, la gestión de recursos y la industria 4.0.
Graduada en Matemáticas y en Administración y Dirección de Empresas por la Universidad de Barcelona, donde también cursó un máster en Ciencia de Datos e Inteligencia Artificial. Actualmente es doctoranda en la Universidad de Lleida, donde investiga la aplicación del aprendizaje por refuerzo en la toma de decisiones en procesos industriales.

Lluís Echeverria Rovira
Docente del curso – Investigador en Inteligencia Artificial y Big Data en Eurecat
Lluís Echeverria es investigador en Eurecat, donde participa en proyectos de I+D relacionados con analítica de datos, Inteligencia Artificial, Big Data e Internet de las Cosas (IoT), aplicados en ámbitos como la industria 4.0 o la gestión eficiente e inteligente de los recursos hídricos. Cuenta con una amplia experiencia en el desarrollo de arquitecturas híbridas Big Data/IoT para el procesamiento de datos masivos en tiempo real, así como en el análisis de datos mediante técnicas de minería de datos y aprendizaje automático.
Tiene un máster en Ingeniería Informática con especialización en Big Data e Inteligencia Artificial por la Universidad de Lleida, donde también se graduó en Ingeniería Informática. Además, es ingeniero técnico en Topografía por la Universidad Politécnica de Cataluña. Actualmente desarrolla una tesis doctoral sobre control óptimo y autónomo de procesos industriales mediante técnicas de aprendizaje por refuerzo.

Jordi Sellés
Coordinador del curso
En este curso contarás con la experiencia de profesionales como Jordi, ingeniero técnico en telecomunicaciones con un Máster en Ingeniería del Software y un MBA. Su trayectoria destaca por la gestión de proyectos en el ámbito de la formación y el emprendimiento, con una especial orientación al desarrollo y promoción de servicios tecnológicos innovadores. Jordi ha liderado estrategias de posicionamiento y crecimiento de negocio en el sector TIC, combinando su capacidad analítica con una marcada orientación a resultados. Gracias a su habilidad para coordinar equipos multidisciplinares, aporta una visión integral que conecta el mundo educativo con las necesidades reales de la empresa.
Información adicional
Todos nuestros cursos son bonificables para empresas (excepto autónomos) a través de la Fundación Estatal para la Formación en el Empleo (FUNDAE).
Consultar descuentos especiales para estudiantes, personas en situación de desempleo, y empresas que realicen dos o más inscripciones en un mismo curso.