BIG DATA: INTRODUCCIÓN AL DISEÑO E IMPLEMENTACIÓN DE ALMACENAMIENTO DE DATOS

Big Data, CIO, Cursos

10 septiembre 2018

El Centro de Investigación Operativa, organiza el nanocurso «BIGDATA: Introducción al diseño e implementación de almacenamiento de datos», impartido por Héctor Gomis, de Clavei.

Plan de Estudios

 

Justificación académica
Según se desprende de los datos publicados en un informe de la empresa Seagate y la consultora IDC, para el año 2025 se habrán creado más de 163 Zetabytes de datos en el mundo, un dato que será 10 veces superior al registrado en 2016.
Las compañías se encuentran pues, cada día más, con la necesidad de procesar grandes volúmenes de información de todo tipo y diferentes orígenes (ERP, CRM, BPM, Web corporativa, etc.) para generar información de valor no volátil e integrada que pueda servir como fuente única para la toma de decisiones de los sistemas de inteligencia empresarial.
De este modo se hace necesario contar con profesionales que conozcan las técnicas de procesamiento de información e integración de datos y que a través de procesos automatizados y ETLs, puedan generar y mantener arquitectura de almacenes de datos corporativos

 

Objetivos del curso
– Lograr que el estudiante adquiera conocimientos teóricos básicos sobre los sistemas de Data Warehouse, su diseño y su construcción.
– Conocer la suite de trabajo de Pentaho DI.
– Aprender el uso de los componentes y herramientas de automatización.

 

Estructura de los estudios
1.    Introducción y conceptos básicos.
2.    Arquitectura de datos.
3.    Introducción a los procesos ETL.
4.    Componentes de extracción de datos.
5.    Componentes de validación y transformación de datos.
6.    Componentes de carga y entrega de datos.
7.    Gestión y planificación de Jobs.
8.    Proyecto práctico.

 

Uso de instalaciones y programación temporal
El curso se compone de 20 horas, 8 horas presenciales y 12 horas no presenciales. Las 8 horas presenciales corresponden a 2 sesiones de 4 horas, una al inicio del curso y otra al final del curso, se impartirán en el Laboratorio de Computación del CIO. Para las sesiones no presenciales se dispondrá de material colgado en un blog que el matriculado debe ir trabajando a lo largo del curso.

 

Sesiones programadas:
Sesión Presencial: 3 de octubre, 4 horas. Horario: 16:00h a 20:00h en el Laboratorio de Computación del CIO.
1.    Introducción y conceptos básicos (2h)
2.    Arquitectura de datos (2h)
Sesión Presencial: 27 de octubre, 4 horas. Horario: 10:00h a 14:00h en el Laboratorio de Computación del CIO.
3.    Introducción a los procesos ETL (1.5h)
4.    Componentes de extracción de datos (1.5h)
5.    Componentes de validación y transformación de datos (1h)
Desarrollo y entrega online:
6.    Componentes de carga y entrega de datos (2h)
7.    Gestión y planificación de Jobs (2h)
8.    Proyecto práctico (8h)
En la fase online, el profesor estará accesible vía correo electrónico para resolver las dudas de los alumnos.

Requisitos de acceso

Es deseable que el alumno disponga de conocimientos básicos sobre bases de datos relacionales y lenguaje SQL.

 

Procedimiento de Evaluación

Evaluación continua mediante la entrega de trabajos prácticos.

 

Enlaces de interés general

 

Información del curso

Centro docente: Instituto Centro de Investigación Operativa

Rama de enseñanza: INGENIERÍA Y ARQUITECTURA

Preinscripción: 01/09/18 a 23/09/18

Matriculación: 24/09/18 a 28/09/18

Duración: 03/10/18 a 27/10/18

Horas: 20

Max. alumnos: 25

BIG-DATA-WEB