Download Presentación de PowerPoint

Document related concepts
no text concepts found
Transcript
BIG DATA
ANALYTICS
Sesiones:
Sábados 22 y 29 de octubre,
5 y 12 de noviembre
Horario:
9 a 14 hrs.
Sede:
Facultad de Ciencias UNAM
Información:
Contacto personal:
5528256572
[email protected]
Oficina:
70902513
70901068
Costo:
Público en general: $14,000.00
Comunidad UNAM: $ 8,000.00
Detalle del
TEMARIO
Fundamentos de SQL Spark
Creación de Data Frames en el Shell de Spark, con Scala y PySpark
Creación y ejecución de queries con el DataFrame API Y Spark SQL con Scala y Python
Creación de estructuras Apache Parquet con Scala y Python
Spark Avanzado
Creación de aplicaciones auto-suficientes con SBT y MAVEN
Ejecución en un ambiente distribuido en Spark con Scala
Ejecución en un ambiente distribuido en Spark con Python
Spark Streaming
Creación de mecanismos de Data streaming con Spark Streaming en Scala y Python
Pre-requisitos para la extracción de torrentes de datos con Apache Spark
Extracción de datos en streaming y su almacenamiento en repositorios del Hadoop HDFS
Obtención de Tweets con Spark Streaming
Filtrado de Tweets por temas específicos y almacenamiento en Hadoop HDFS
Análisis de Tweets con SQL Spark
Algoritmos de Aprendizaje Automatizado (ML)
Introducción al Aprendizaje Automatizado (Machine Learning)
Introducción a las técnicas de Sistemas de Recomendación
Instrumentación de un Sistema de Recomendación con Scala y Python
Introducción a los sistemas de análisis de textos LSA (Latent Semantic Analysis)
Instrumentación de un sistema Big Data de análisis de textos LSA con Spark MLlib en Scala
y Python
Visualización de datos
Visualización con bibliotecas de los lenguajes R y Python
Visualización de grandes volúmenes con Apache Spark, por medio de Spark R y Pyspark
Visualización con herramientas BI comerciales
Visualización con Bokeh Python
Requisitos:
Se requieren conocimientos básicos de programación en
cualquier lenguaje (Scala, Java, Python, R)