Download [Powerpoint] - DataScience

Document related concepts
no text concepts found
Transcript
Septiembre 12, 2015
Bogotá, Colombia
#sqlsatBogota
Capítulos Organizadores del SQL Saturday
Patrocinadores del SQL Saturday
Planea asistir al PASS Summit 2015? Comience a ahorrar hoy!
• El más grande evento del mundo que reúne a profesionales de SQL Server y BI
• Adquiera habilidades en SQL Server a un nivel superior al aprender de los mejores expertos
del mundo de SQL Server, en más de 190 sesiones técnicas
• Más de 5.000 registros, que representan a 2.000 empresas, de 52 países, listos para la red y
aprender
Ahorre $150
VC15JRJ4
Sea cual sea su pasión datos - hay un capítulo virtual para
usted!
Septiembre 17 | 12:00 UTC
Sesiones previas del PASS Summit 2015, obtenga 24
Horas de formación de SQL Server y BI de forma
gratuita!
Regístrese hoy: 24hoursofpass.com
Introducción a Data Science
Jose L Rivera, MBA
MVP | MCSE | MCSA | MCITP | MCSE
Chapter Leader – PASS Global Spanish VC
@SQLConqueror
Agenda
• Conceptos básicos de Data Science (DS)
• Herramientas Microsoft para DS
• Herramientas OpenSource para DS
• Demos
• Q&A
Conceptos Básicos
Data
hechos y estadísticas almacenadas para referencia o análisis
Business Intelligence
BI es un termino sombrilla que reúne a una variedad de aplicaciones usadas para
analizar la data de una empresa. Esta disciplina esta compuesta de actividades
relacionadas a minería de datos, procesamiento analítico (OLAP), queries y
reportes.
Conceptos Básicos
Data Science
es la extracción de conocimiento de grandes volúmenes de
datos estructurados y no estructurados mediante el uso de
técnicas de minería de datos y análisis predictivo
Que es Data Science?
• Análisis Estadístico
• estadística inferencial
• Algoritmos
• Experimentos
• Programación
• “Hacking”
• Python, R, etc..
• Conocimiento del Negocio
• Reglas y procesos
Copyright © 2014 by Steven Geringer Raleigh, NC.
Permision is granted to use, distribute or modify this image,
Provided that this copyright notice remains intact.
Recopilación de Datos
Eventos
• Características
• Ambiente
Comportamiento
Acción/Pruebas
• Actividades
significativas al
negocio
Resultado
Observación
• Medidas
Conjuntos
de Datos
• Estructurada
• No Estructurada
• Semi-Estructurada
Quieres ser un Data Scientist?
Quieres ser un Data Scientist?
Resultados 2014
R vs Python
http://www.kdnuggets.com/2015/05/r-vs-python-data-science.html
Reloj de Data Science
•
•
•
•
•
•
•
•
•
http://www.exploringdatascience.com/the-data-science-clock/
Destrezas básicas
Fundamentos
Análisis estadístico
Machine Learning
Text Mining/NLP
Visualización
Big Data
Data Ingestion + Munging
Herramientas
Ciclo de vida
Descubrimiento
de los datos
Monitoreo
Preparación de
los datos
Publicación
Desarrollo del
Modelo
Evaluación
SSAS Data Mining
• SQL Server 2005+
• Excel Add-in
Tipo de Algoritmo
Uso Común
Clasificación
predice una o más variables discretas basadas en los otros
atributos del conjunto de datos
Regresión
predice una o más variables continuas basadas en los otros
atributos del conjunto de datos
Segmentación
divide los datos en grupos (clusters) de elementos que tiene
propiedades similares
Asociación
encuentra correlaciones entre los diferentes atributos en un
conjunto de datos
Análisis Secuencial
resume las secuencias frecuentes o episodios de los datos
SSAS Data Mining
#sqlsatBogota
Excel Data Mining Add-in
5 | 12/9/2015 |
SQL Saturday #448 – Bogotá, Colombia
R
• CRAN (versión oficial) - http://cran.r-project.org/
• 5,000+ paquetes (librerías)
• v 3.2.4
• RStudio (http://www.rstudio.com/)
• IDE para R
• Provee un experiencia integrada y simple
• Revolution Analytics (http://www.revolutionanalytics.com/)
• Otra versión de R
• Paralelismo y Rendimiento
• SQL Server 2016
Python
• Lenguaje de programación de uso general
• OOP
• Open Source - http://www.python.org/
• v 3.4.3 | 2.7.10
• Multiples IDEs
• IDLE
• Canopy
• IPython Notebook
#sqlsatBogota
R en RStudio
5 | 12/9/2015 |
SQL Saturday #448 – Bogotá, Colombia
Azure ML
• Servicio en la nube
• Algoritmos de ML
• Componentes para R y Python
• Publicación a Web-Service
#sqlsatBogota
Azure Machine Learning (ML)
5 | 12/9/2015 |
SQL Saturday #448 – Bogotá, Colombia
Recursos Adicionales
• www.r-bloggers.com/
• www.datasciencecentral.com
#sqlsatBogota
Preguntas y Respuestas
6 | 12/9/2015 |
SQL Saturday #448 – Bogotá, Colombia
#sqlsatBogota
Evaluación
Sesión: http://www.sqlsaturday.com/448/sessions/sessionevaluation.aspx
Evento: http://www.sqlsaturday.com/448/eventeval.aspx
12 | 12/9/2015 |
SQL Saturday #448 – Bogotá, Colombia
Gracias !!!