Download [Powerpoint] - DataScience
Document related concepts
no text concepts found
Transcript
Septiembre 12, 2015 Bogotá, Colombia #sqlsatBogota Capítulos Organizadores del SQL Saturday Patrocinadores del SQL Saturday Planea asistir al PASS Summit 2015? Comience a ahorrar hoy! • El más grande evento del mundo que reúne a profesionales de SQL Server y BI • Adquiera habilidades en SQL Server a un nivel superior al aprender de los mejores expertos del mundo de SQL Server, en más de 190 sesiones técnicas • Más de 5.000 registros, que representan a 2.000 empresas, de 52 países, listos para la red y aprender Ahorre $150 VC15JRJ4 Sea cual sea su pasión datos - hay un capítulo virtual para usted! Septiembre 17 | 12:00 UTC Sesiones previas del PASS Summit 2015, obtenga 24 Horas de formación de SQL Server y BI de forma gratuita! Regístrese hoy: 24hoursofpass.com Introducción a Data Science Jose L Rivera, MBA MVP | MCSE | MCSA | MCITP | MCSE Chapter Leader – PASS Global Spanish VC @SQLConqueror Agenda • Conceptos básicos de Data Science (DS) • Herramientas Microsoft para DS • Herramientas OpenSource para DS • Demos • Q&A Conceptos Básicos Data hechos y estadísticas almacenadas para referencia o análisis Business Intelligence BI es un termino sombrilla que reúne a una variedad de aplicaciones usadas para analizar la data de una empresa. Esta disciplina esta compuesta de actividades relacionadas a minería de datos, procesamiento analítico (OLAP), queries y reportes. Conceptos Básicos Data Science es la extracción de conocimiento de grandes volúmenes de datos estructurados y no estructurados mediante el uso de técnicas de minería de datos y análisis predictivo Que es Data Science? • Análisis Estadístico • estadística inferencial • Algoritmos • Experimentos • Programación • “Hacking” • Python, R, etc.. • Conocimiento del Negocio • Reglas y procesos Copyright © 2014 by Steven Geringer Raleigh, NC. Permision is granted to use, distribute or modify this image, Provided that this copyright notice remains intact. Recopilación de Datos Eventos • Características • Ambiente Comportamiento Acción/Pruebas • Actividades significativas al negocio Resultado Observación • Medidas Conjuntos de Datos • Estructurada • No Estructurada • Semi-Estructurada Quieres ser un Data Scientist? Quieres ser un Data Scientist? Resultados 2014 R vs Python http://www.kdnuggets.com/2015/05/r-vs-python-data-science.html Reloj de Data Science • • • • • • • • • http://www.exploringdatascience.com/the-data-science-clock/ Destrezas básicas Fundamentos Análisis estadístico Machine Learning Text Mining/NLP Visualización Big Data Data Ingestion + Munging Herramientas Ciclo de vida Descubrimiento de los datos Monitoreo Preparación de los datos Publicación Desarrollo del Modelo Evaluación SSAS Data Mining • SQL Server 2005+ • Excel Add-in Tipo de Algoritmo Uso Común Clasificación predice una o más variables discretas basadas en los otros atributos del conjunto de datos Regresión predice una o más variables continuas basadas en los otros atributos del conjunto de datos Segmentación divide los datos en grupos (clusters) de elementos que tiene propiedades similares Asociación encuentra correlaciones entre los diferentes atributos en un conjunto de datos Análisis Secuencial resume las secuencias frecuentes o episodios de los datos SSAS Data Mining #sqlsatBogota Excel Data Mining Add-in 5 | 12/9/2015 | SQL Saturday #448 – Bogotá, Colombia R • CRAN (versión oficial) - http://cran.r-project.org/ • 5,000+ paquetes (librerías) • v 3.2.4 • RStudio (http://www.rstudio.com/) • IDE para R • Provee un experiencia integrada y simple • Revolution Analytics (http://www.revolutionanalytics.com/) • Otra versión de R • Paralelismo y Rendimiento • SQL Server 2016 Python • Lenguaje de programación de uso general • OOP • Open Source - http://www.python.org/ • v 3.4.3 | 2.7.10 • Multiples IDEs • IDLE • Canopy • IPython Notebook #sqlsatBogota R en RStudio 5 | 12/9/2015 | SQL Saturday #448 – Bogotá, Colombia Azure ML • Servicio en la nube • Algoritmos de ML • Componentes para R y Python • Publicación a Web-Service #sqlsatBogota Azure Machine Learning (ML) 5 | 12/9/2015 | SQL Saturday #448 – Bogotá, Colombia Recursos Adicionales • www.r-bloggers.com/ • www.datasciencecentral.com #sqlsatBogota Preguntas y Respuestas 6 | 12/9/2015 | SQL Saturday #448 – Bogotá, Colombia #sqlsatBogota Evaluación Sesión: http://www.sqlsaturday.com/448/sessions/sessionevaluation.aspx Evento: http://www.sqlsaturday.com/448/eventeval.aspx 12 | 12/9/2015 | SQL Saturday #448 – Bogotá, Colombia Gracias !!!