Información práctica

  • Tipología: Formación superior
  • Especialidad: Big Data / Inteligencia Artificial (IA)
  • Modalidad: Online
  • Sede: Online
  • Precio: 560 €

Fecha y horarios

  • Inicio:14/05/2025
  • Finalización:25/06/2025
  • Lunes y miércoles de 17:00 a 20:00
  • Duración del curso: 33 horas

La tecnología de minería, análisis y visualización de datos ofrece grandes posibilidades en la resolución de problemas y la previsión de tendencias ya que permite extraer información no evidente tanto de los conjuntos de datos existentes como de los recogidos en tiempos de ejecución.

Objetivos

  • Ofrecer una introducción a las tecnologías y metodologías para la extracción de información en grandes conjuntos de datos, tanto ya existentes como de los recogidos en tiempos de ejecución.
  • Mejorar los conocimientos técnicos en Data Mining.

Dirigido a

Todo aquel profesional que se quiera adentrar en el mundo de la ciencia de datos y la inteligencia artificial.

Programa

1.Introducción al Big Data

  • Digitalización, Big Data y el ciclo de vida del dato
  • Arquitecturas Big Data (ETL, Batch & Stream processing, Lambda & Kappa, Data Warehouse & Data Lake, …)
  • Stack genérico y arquitectura Big Data de referencia
  • Ecosistema Apache Hadoop (Hadoop, Yarn, Map Reduce, Spark, …) y otras opciones para la gestión y procesado de grandes volúmenes de datos
  • Herramientas de visualización de datos
  • Práctica: Generación y captura de datos, Publicación sistema publish-subscribe- Procesado – Visualización

2.Instalación y configuración de Python.

  • Preparación de entorno de trabajo personal para las prácticas

3.Introducción a Python para la ciencia de los datos.

  • Introducción a Python
  • Variables, tipos de datos y operadores.
  • Estructuras de control de flujo: if, else, for, while.
  • Funciones y bibliotecas estándar.
  • Manipulación de datos con NumPy y Pandas
  • Matplotlib
  • Prácticas

4.Fundamentos de estadística enfocada a Big Data.

  • Conceptos básicos de datos
  • Probabilidad
  • Distribución de variables aleatorias
  • Base para la inferencia
  • Regresión lineal – Mínimos cuadrados y ecuaciones normales
  • Regresión logística
  • Regresión múltiple
  • Utilización de modelos estadísticos y técnicas de pronóstico para comprender el futuro
  • Prácticas

5.Metodología CRISP-DM para el desarrollo de proyectos de ciencia de datos.

  • Business Understanding
  • Data Understanding
    • Exploratory Data Analysis
  • Data Preparation
    • Data cleaning
    • Imputación de valores
    • Feature engineering
    • Variables selection
  • Modeling
    • Hyperparámetros y Cross-validation
  • Evaluation
  • Deployment
  • Prácticas

6.Aprendizaje automático.

  • Comprensión de los principales tipos de aprendizaje automático
  • Supervised learning Aprendizaje supervisado
  • Regresión y métricas
  • Clasificación y métricas
  • Modelos lineales
    • Stochastic Gradient Descent
  • Árbol de decisión
  • Suport Vector Machines
  • Models ensamblados
    • Random Forest
    • Gradient Boosting machines
  • Prácticas

7.Unsupervised Learning Aprendizaje No Supervisado.

  • K-means clustering
  • Hierarchical clustering
  • Novelty and Outlier Detection
  • Reducción de la dimensionalidad
  • Prácticas

8.Introducción a las Redes Neuronales.

  • Prácticas

Información adicional

Todos nuestros cursos son bonificables para empresas (excepto autónomos) a través de la Fundación Estatal para la Formación en el Empleo (FUNDAE).

Consultar descuentos especiales para estudiantes, personas en situación de desempleo, y empresas que realicen dos o más inscripciones en un mismo curso.