1. Introducción al
Business Intelligence y Big Data- Fundamentos del Business Intelligence
- El valor de los datos
- Fundamentos del Big Data
- Desarrollo de una Estrategia de Datos
- Elementos clave para el Gobierno y Gestión de los datos
- Organización Data Driven. Retos y oportunidades.
2. Herramientas de Big Data y Gobierno del Dato
Leer más
- Almacenamiento y procesamiento de la información
- Información estructurada
- Tecnologías Big Data
- Análisis y visualización de la información
- Herramienta SAS Visual Analytics
- Gobierno del Dato.
3. Big Data Dentro de la Informática
- Capacidad de procesamiento y paralelización extrema. Arquitecturas GPU vs CPU.
Núcleos Cuda. Escalabilidad.
- Entornos de trabajo para arquitecturas Deep Learning. Tensor Flow, Keras, Pytorch.
- Aprendizaje supervisado y no supervisado. Entrenamiento. Ejecución y Distribución de
modelos. Inteligencia Artificial.
- Regresiones. Series temporales autorregresivas. Clusterización, kmeans.
- Arboles de decisión: Random Forest. Xgboost.
- Redes neuronales, Perceptrón Multicapa. Redes Convolucionales.
4. Técnicas de Datamining para el Negocio:
- Planteamiento del problema. Análisis supervisado: regresión y clasificación. Análisis no
supervisado.
- Preparación de datos en análisis supervisado. Entrenamiento, validación y test.
- Validación cruzada (cross validation).
- Regresión lineal y logística.
- Arboles de decisión.
- Redes neuronales: perceptrón multicapa.
- Evaluación de resultados: curva ROC, lift chart, AUC, Accuracy, F-score, MSE...
- Dicotomía sesgo – varianza en data mining. Curva de aprendizaje.
- Análisis no supervisado: PCA y K-means.
5. Casos de uso Data Management:
- Definición de procesos de negocio. BMP’s y principales KPI’s.
- Remodelización. Del Modelo relacional al Modelo en estrella. Desnormalizaciones. Bucles.
- Procesos ETL (Extracción Transformación y Carga). Cargas masivas. Staging.
- Historificación. Agregados.
- Herramientas: ETLs open y comerciales. Herramientas de auto gestión. Business Objects.
- Algoritmos de optimización.
- Caso de uso. Monitorización en tiempo real de web de ventas vía ingesta de logs (desestructurado) y datos de ventas (estructurado).
6. Casos de uso en Finanzas:
- El dato a la información: de la métrica al KPI y las medidas de la vanidad.
- La selección y reducción de datos: informes periódicos- informes ad hoc. Coste de mantener más información de la necesaria y oportunidades de la automatización.
- Herramientas de seguimiento del negocio: evolutivos, year to date, grados de
cumplimiento, rentabilidad, amortización, Payback/ROI.
- Series temporales, estacionalidad, comparación con el pasado y grupos de control.
7. Casos de uso en Marketing:
- Modelos de Churn. Detectar posibles fugas de clientes antes de que sea demasiado tarde...
- Modelos de valoración “inteligente” de clientes (Customer Life Time Value)
- Crosselling y Upselling. Vincular y desarrollar al cliente.
- Casos de uso no supervisado. Análisis cluster y PCA. Conociendo al cliente.
- Marketing Modeling Mix. Evaluar el impacto de la inversión en medios y cómo
optimizarla.
8. Herramientas y Profesionales de BIBD
- El nuevo paradigma: open data y open source
- Principales repositorios de open data
- Landscape de herramientas de Data mining y Big Data
- El nuevo científico de datos en las tres esferas: matemática/estadística, informática y conocimiento del negocio
- La cultura de empresa en recursos humanos para incentivación, retención y actualización del talento.
9. Bases de datos Relacionales y no Relacionales
- Metodologías. Modelo Entidad Relación. Normalización. Técnicas de modelado.
- Estructura básica de una BBDD relacional. Patrones de diseño. Transacciones.
Implementaciones Físicas.
- Bases de Datos operacionales vs Datawarehouse. Modelos en estrella y desnormalizaciones.
- Principales engines actuales. Comparativa y campos de aplicación: Oracle, Microsoft, Mysql, MariaDB, Postgresql, Teradata, Vertica.
- Caso práctico: Modelización de un catálogo de productos para track de ventas.
- BBDD no relacionales. Paradigmas de procesamiento masivo: Apache Hbase. HDFS . Hadoop. Map Reduce.
- Deep Learning. GPU, Núcleos cuda y procesamiento matricial. Frameworks en detalle: Tensor Flow, Keras, Pytorch.
10. Lenguajes de Programación de Nuevo Entorno
- De C a Spark. Conceptos claves en los lenguajes de programación en la Ciencia de Datos.
Eficiencia, compatibilidad, curvas de aprendizaje. Tendencias actuales.
- Herramientas de desarrollo. Principales IDEs de Programación en la ciencia de datos: Eclipse, R-
Studio, Spyder, Jupyter Notebook.
- Caso práctico. Cotizaciones Nasdaq con python bajo Jupyter. Ingesta, tratamiento y visualización.
- On Promise, Hosting y Cloud. Definiciones y modelos. Mantenimiento, escalabilidad y despliegues.
- Cloud. Principales actores. Productos sobre cloud. Soluciones llave en mano.
- Caso práctico AWS. Despliegue tienda online extremo a extremo.
ITINERARIO DE NEGOCIO
11. Transformación Digital
- La Transformación Digital y la IV Revolución Industrial
- Start-Up y Digital Business frente a empresas tradicionales
- Contexto actual y desarrollo de nuevos modelos de negocio. Servicios Cloud
- La Uberización de la Economía
- Gestión de Recursos Humanos y Detección Digital de Talento
- Aspectos Legales: La GDPR.
12. Reporting y Seguimiento del Negocio
- Seguimiento del negocio: principales métricas y dimensiones
- Detección de oportunidades y base para estudios ad hoc: fraude, avería, seguimiento de objetivos
- Matriz abc-xyz de clientes.
- Mapas de clientes utilizando cuartiles
- Evaluación de acciones comerciales e interactuaciones con el cliente.
13. Datamining en la Digitalización
- Minería de datos en la Industria 4.0 y transformación digital.
- Inteligencia artificial en la gestión de clientes: user-centric, ad-centric, site-centric.
- Fuentes de información: cookies, Id’s e información interna comportamental del cliente
- Construcción de audiencias.
- Personalización de campañas: banners, Display Campaing, Campañas de remarketing
- Publicidad programática: DMP
ITINERARIO TÉCNICO
11. Modelización de datos estructurados
- QL. Estandarización. Versión ANSI 92. Otros dialectos. Dialectos propietarios.
- DDL. Definición de estructuras. Comandos principales.
- DML. Manipulación de Datos. Comandos principales.
- SELECT. Consulta de datos. JOINS. Relacionando Tablas.
- AGRUPACIONES Y FUNCIONES VENTANA. Conteos y funciones estadísticas.
- PRINCIPALES FUNCIONES. De cadena. Numéricas, Matemáticas, De fecha. Estadísticas,
- IMPLEMENTACIONES PROPIETARIAS. Principales diferencias entre engines.Fechas. Nulos.
- OPTIMIZACION. Herramientas de optimización de consultas. índices, vistas. Hints. Planes de ejecución.
12. Modelización de datos estructurados
- Distribución de datos. HDFS. Hadoop. Hbase.
- Diferencias con modelos relacionales.
- Algoritmos distribuidos. ingeniería de Features.
- Tratamiento de eventos. Buscadores. Recomendadores.
- Tratamiento de imágenes. Redes Convolucionales sobre imagen.
- Tratamiento semántico de la información. Bag of words. Clasificación. Análisis de Sentimiento.
- Voz. Speech to text. VRU.Chat Bots,
13. Machine learning e Inteligencia Artificial
- Python.- Instalación y componentes. Librerías. Comunidades de desarrollo. Módulos para la Ciencia de Datos.
- Bases del lenguaje. Estructuras de control, funciones y variables. Módulos y paquetes.
- Ingesta de datos. Scraping. Ficheros, BBDD. Ingeniería de Features.
- Estructuras de datos. Listas, Diccionarios. Tratamiento y procesamiento. Pandas. Numpy,
- Álgebra Computacional. Simpy.
- Librería matemática, SciPy.
- Machine Learning Sk-Learn
- Deep Learning: Pytorch y Keras.
14. Storytelling del Dato
- Optimización en la petición de la información: estados, fechas, clientes.
- Introducción a Power Bi
- Conexión con fuentes de datos
- Objetos visuales Power Bi, posibilidades y mejores combinaciones para la narrativa.
- Fuentes en Tableau
- Visualización en Tableau
15. Proyecto Fin de ProgramaLeer menos