Información práctica

  • Tipología: Formación In Company
  • Especialidad: Inteligencia artificial y Tecnología de datos
  • Duración del curso: 33 horas

Introducción

La mineria, anàlisi i visualització de dades representen una aposta estratègica per a la digitalització i la innovació en les organitzacions. A través d’aquestes tecnologies, les empreses poden identificar patrons no evidents, anticipar tendències de mercat, optimitzar processos productius i prendre decisions més informades i eficaces. L’aplicació d’eines d’Intel·ligència Artificial (IA) i Machine Learning (ML) permet optimitzar la gestió de grans volums d’informació, garantint la fiabilitat, la seguretat i la qualitat de les dades, i impulsant la competitivitat empresarial. La formació s’adapta als requeriments de cada empresa, facilitant la transferència directa de coneixement als reptes específics del seu negoci.

Els primers mòduls de programació en Python s’adaptaran al nivell inicial dels participants. A l’inici del curs, es farà una avaluació diagnòstica per garantir que tots els assistents disposen dels coneixements bàsics del llenguatge, independentment de la formació prèvia. A més, es proporcionaran cursets de Python previs a la formació principal, assegurant que el bloc pràctic s’inicia amb un nivell homogeni entre els alumnes.

Objetivos

  • Introducir las tecnologías de minería de datos, análisis avanzado y visualización, mostrando su impacto en la toma de decisiones empresariales.
  • Presentar y aplicar metodologías para la extracción de información en grandes conjuntos de datos, tanto históricos como recogidos en tiempo real.
  • Desarrollar habilidades en la gestión de datos masivos con arquitecturas Big Data y herramientas actuales del sector (ETL, Hadoop, Spark, Data Lakes, …).
  • Formar en programación Python aplicada a la ciencia de datos, adaptando el contenido al ritmo y conocimientos del grupo. Garantizar la igualdad de base inicial con recursos formativos previos y evaluación del nivel.
  • Aprender fundamentos de estadística, probabilidad y modelos predictivos enfocados a la interpretación y utilización empresarial de los datos.
  • Aplicar la metodología CRISP-DM para el desarrollo sistemático de proyectos analíticos.
  • Capacitar en diseño, implementación y validación de modelos de aprendizaje automático supervisado y no supervisado, abordando problemas reales dentro de la organización.
  • Aproximarse a las redes neuronales y al uso de datos sintéticos como valor añadido en proyectos innovadores.
  • Consolidar las competencias necesarias para aplicar la ciencia de datos, la IA y el ML con rigor, criterio ético-profesional y orientación a resultados.

Dirigido a

Curso dirigido a empresas que quieran formar a sus directivos, gestores e ingenieros en Big Data, analítica avanzada y Machine Learning para mejorar la toma de decisiones y la transformación digital interna.

Programa

  1. INSTALACIÓN Y CONFIGURACIÓN DE PYTHON. PRUEBA DE NIVEL

    • Preparación del entorno de trabajo personal para las prácticas

  2. INTRODUCCIÓN AL BIG DATA
    • Digitalización, Big Data y el ciclo de vida del dato
    • Arquitecturas Big Data (ETL, Batch & Stream processing, Lambda & Kappa, Data Warehouse & Data Lake, …)
    • Stack genérico y arquitectura Big Data de referencia
    • Ecosistema Apache Hadoop (Hadoop, Yarn, Map Reduce, Spark, …) y otras opciones para la gestión y procesado de grandes volúmenes de datos
    • Herramientas de visualización de datos
    • Práctica: Generación y captura de datos, Publicación sistema publish-subscribe- Procesado – Visualización
  3. FUNDAMENTOS DE ESTADÍSTICA ENFOCADA A BIG DATA
    • Conceptos básicos de datos
    • Probabilidad
    • Distribución de variables aleatorias
    • Base para la inferencia
    • Regresión lineal – Mínimos cuadrados y ecuaciones normales
    • Regresión logística
    • Regresión múltiple
    • Utilización de modelos estadísticos y técnicas de pronóstico para comprender el futuro
    • Prácticas
  4. METODOLOGÍA CRISP-DM PARA EL DESARROLLO DE PROYECTOS DE CIENCIA DE DATOS
    • Business Understanding
    • Data Understanding
    • Exploratory Data Analysis
    • Data Preparation
    • Data cleaning
    • Imputación de valores
    • Feature engineering
    • Variables selection
    • Modeling
    • Hyperparámetros y Cross-validation
    • Evaluation
    • Deployment
    • Prácticas
  5. APRENDIZAJE AUTOMÁTICO
    • Comprensión de los principales tipos de aprendizaje automático
    • Supervised learning Aprendizaje supervisado
    • Regresión y métricas
    • Clasificación y métricas
    • Modelos lineales
    • Stochastic Gradient Descent
    • Árbol de decisión
    • Suport Vector Machines
    • Models ensamblados
    • Random Forest
    • Gradient Boosting machines
    • Prácticas
  6. UNSUPERVISED LEARNING (APRENDIZAJE NO SUPERVISADO)
    • K-means clustering
    • Hierarchical clustering
    • Novelty and Outlier Detection
    • Reducción de la dimensionalidad
    • Prácticas
  7. INTRODUCCIÓN A LAS REDES NEURONALES
    • Prácticas

Competencias adquiridas

  • Conocimientos técnicos en Big Data y sus arquitecturas.
  • Habilidades en Python para la manipulación y análisis de datos.
  • Conocimientos estadísticos para el análisis e inferencia de datos.
  • Capacidad para aplicar metodologías de ciencia de datos en proyectos reales.
  • Experiencia práctica en técnicas de aprendizaje automático y redes neuronales.

Información adicional

Todos nuestros cursos son bonificables para empresas (excepto autónomos) a través de la Fundación Estatal para la Formación en el Empleo (FUNDAE).

Consultar descuentos especiales para estudiantes, personas en situación de desempleo, y empresas que realicen dos o más inscripciones en un mismo curso.