Información práctica
Fecha y horarios
La tecnología de minería, análisis y visualización de datos ofrece grandes posibilidades en la resolución de problemas y la previsión de tendencias ya que permite extraer información no evidente tanto de los conjuntos de datos existentes como de los recogidos en tiempos de ejecución.
Objetivos
- Ofrecer una introducción a las tecnologías y metodologías para la extracción de información en grandes conjuntos de datos, tanto ya existentes como de los recogidos en tiempos de ejecución.
- Mejorar los conocimientos técnicos en Data Mining.
Dirigido a
Todo aquel profesional que se quiera adentrar en el mundo de la ciencia de datos y la inteligencia artificial.
Programa
1.Introducción al Big Data
- Digitalización, Big Data y el ciclo de vida del dato
- Arquitecturas Big Data (ETL, Batch & Stream processing, Lambda & Kappa, Data Warehouse & Data Lake, …)
- Stack genérico y arquitectura Big Data de referencia
- Ecosistema Apache Hadoop (Hadoop, Yarn, Map Reduce, Spark, …) y otras opciones para la gestión y procesado de grandes volúmenes de datos
- Herramientas de visualización de datos
- Práctica: Generación y captura de datos, Publicación sistema publish-subscribe- Procesado – Visualización
2.Instalación y configuración de Python.
- Preparación de entorno de trabajo personal para las prácticas
3.Introducción a Python para la ciencia de los datos.
- Introducción a Python
- Variables, tipos de datos y operadores.
- Estructuras de control de flujo: if, else, for, while.
- Funciones y bibliotecas estándar.
- Manipulación de datos con NumPy y Pandas
- Matplotlib
- Prácticas
4.Fundamentos de estadística enfocada a Big Data.
- Conceptos básicos de datos
- Probabilidad
- Distribución de variables aleatorias
- Base para la inferencia
- Regresión lineal – Mínimos cuadrados y ecuaciones normales
- Regresión logística
- Regresión múltiple
- Utilización de modelos estadísticos y técnicas de pronóstico para comprender el futuro
- Prácticas
5.Metodología CRISP-DM para el desarrollo de proyectos de ciencia de datos.
- Business Understanding
- Data Understanding
- Exploratory Data Analysis
- Data Preparation
- Data cleaning
- Imputación de valores
- Feature engineering
- Variables selection
- Modeling
- Hyperparámetros y Cross-validation
- Evaluation
- Deployment
- Prácticas
6.Aprendizaje automático.
- Comprensión de los principales tipos de aprendizaje automático
- Supervised learning Aprendizaje supervisado
- Regresión y métricas
- Clasificación y métricas
- Modelos lineales
- Stochastic Gradient Descent
- Árbol de decisión
- Suport Vector Machines
- Models ensamblados
- Random Forest
- Gradient Boosting machines
- Prácticas
7.Unsupervised Learning Aprendizaje No Supervisado.
- K-means clustering
- Hierarchical clustering
- Novelty and Outlier Detection
- Reducción de la dimensionalidad
- Prácticas
8.Introducción a las Redes Neuronales.
- Prácticas
Información adicional
Todos nuestros cursos son bonificables para empresas (excepto autónomos) a través de la Fundación Estatal para la Formación en el Empleo (FUNDAE).
Consultar descuentos especiales para estudiantes, personas en situación de desempleo, y empresas que realicen dos o más inscripciones en un mismo curso.