Información práctica
Introducció
La mineria, anàlisi i visualització de dades representen una aposta estratègica per a la digitalització i la innovació en les organitzacions. A través d’aquestes tecnologies, les empreses poden identificar patrons no evidents, anticipar tendències de mercat, optimitzar processos productius i prendre decisions més informades i eficaces. L’aplicació d’eines d’Intel·ligència Artificial (IA) i Machine Learning (ML) permet optimitzar la gestió de grans volums d’informació, garantint la fiabilitat, la seguretat i la qualitat de les dades, i impulsant la competitivitat empresarial. La formació s’adapta als requisits de cada empresa, facilitant la transferència directa de coneixement als reptes específics del seu negoci.
Els primers mòduls de programació en Python s’adaptaran al nivell inicial dels participants. A l’inici del curs, es farà una avaluació diagnòstica per garantir que tots els assistents disposen dels coneixements bàsics del llenguatge, independentment de la formació prèvia. A més, es proporcionaran cursets de Python previs a la formació principal, assegurant que el bloc pràctic s’inicia amb un nivell homogeni entre els alumnes.
Objectius del curs
- Introduir les tecnologies de mineria de dades, anàlisi avançada i visualització, mostrant el seu impacte en la presa de decisions empresarials.
- Presentar i aplicar metodologies per a l’extracció d’informació en grans conjunts de dades, tant històrics com recollits en temps real.
- Desenvolupar habilitats en la gestió de dades massives amb arquitectures Big Data i eines actuals del sector (ETL, Hadoop, Spark, Data Lakes, …).
- Formar en programació Python aplicada a la ciència de dades, adaptant el contingut al ritme i coneixements del grup. Garantir la igualtat de base inicial amb recursos formatius previs i avaluació del nivell.
- Aprendre fonaments d’estadística, probabilitat i models predictius enfocats a la interpretació i utilització empresarial de les dades.
- Aplicar la metodologia CRISP-DM per al desenvolupament sistemàtic de projectes analítics.
- Capacitar en disseny, implementació i validació de models d’aprenentatge automàtic supervisat i no supervisat, abordant problemes reals dins de l’organització.
- Aproximar-se a les xarxes neuronals i a l’ús de dades sintètiques com a valor afegit en projectes innovadors.
- Consolidar les competències necessàries per aplicar la ciència de dades, la IA i el ML amb rigor, criteri ètic-professional i orientació als resultats.
Adreçat a
Programa del curs
- INSTAL·LACIÓ I CONFIGURACIÓ DE PYTHON. PROVA DE NIVELL
- Preparació d’entorn de treball personal per a les pràctiques
- INTRODUCCIÓ AL BIG DATA
- Digitalització, Big Data i el cicle de vida de la dada
- Arquitectures Big Data (ETL, Batch & Stream processing, Lambda & Kappa, Data Warehouse & Data Lake, …)
- Stack genèric i arquitectura Big Data de referència
- Ecosistema Apache Hadoop (Hadoop, Yarn, Map Reduce, Spark, …) i altres opcions per a la gestió i processament de grans volums de dades
- Eines de visualització de dades
- Pràctica: Generació i captura de dades, Publicació sistema publish-subscribe- Processat – Visualització
- FONAMENTS D’ESTADÍSTICA ENFOCADA A BIG DATA
- Conceptes bàsics de dades
- Probabilitat
- Distribució de variables aleatòries
- Base per a la inferència
- Regressió lineal – Mínims quadrats i equacions normals
- Regressió logística
- Regressió múltiple
- Utilització de models estadístics i tècniques de pronòstic per comprendre el futur
- Pràctiques
- METODOLOGIA CRISP-DM PER AL DESENVOLUPAMENT DE PROJECTES DE CIÈNCIA DE DADES
- Business Understanding
- Data Understanding
- Exploratory Data Analysis
- Data Preparation
- Data cleaning
- Imputació de valors
- Feature engineering
- Variables selection
- Modeling
- Hyperparàmetres i Cross-validation
- Evaluation
- Deployment
- Pràctiques
- APRENENTATGE AUTOMÀTIC
- Comprensió dels tipus d’aprenentatge automàtic principals
- Supervised learning Aprenentatge supervisat
- Regressió i mètriques
- Classificació i mètriques
- Models lineals
- Stochastic Gradient Descent
- Arbre de decisió
- Suport Vector Machines
- Models acoblats
- Random Forest
- Gradient Boosting machines
- Pràctiques
- UNSUPERVISED LEARNING (APRENENTATGE NO SUPERVISAT)
- K-means clustering
- Hierarchical clustering
- Novelty and Outlier Detection
- Reducció de la dimensionalitat
- Pràctiques
- INTRODUCCIÓ A LES XARXES NEURONALS
- Pràctiques
Competències adquirides
- Coneixements tècnics en Big Data i les seves arquitectures.
- Habilitats en Python per a la manipulació i anàlisi de dades.
- Coneixements estadístics per a l’anàlisi i inferència de dades.
- Capacitat per aplicar metodologies de ciència de dades en projectes reals.
- Experiència pràctica en tècniques d’aprenentatge automàtic i xarxes neuronals.
Informació addicional
Tots els nostres cursos són bonificables per a empreses (excepte autònoms) a través de la Fundació Estatal per a la Formació en l’Ocupació (FUNDAE).
Consultar descomptes especials per a estudiants, persones en situació de desocupació, i empreses que realitzin dues o més inscripcions en un mateix curs.