Download Metodología de la Minería de Datos
Document related concepts
Transcript
TRABAJO DE MINERIA DE DATOS WALTER ARLEY CADAVID MARTINEZ 11º HERNAN VALENCIA INGENIERO DE SISTEMAS INTITUCION EDUCATIVA CIUDAD DON BOSCO MEDELLIN 2011 INTRODUCCION En este trabajo en contrarían algunas informaciones de lo que es la minería de datos y poder saber sobre algunos temas de tecnología e informática en este trabajo en contrarias ¿Qué es Minería de Datos?, Orígenes de la Minería de Datos, Clasificación de la Minería de Datos, Características de la Minería de Datos, Usuarios de la Minería de Datos. TABLA DE CONTENIDO 1. MINERIA DE DATOS 1.1 Definiciones La minería de Datos es un campo interdisciplinario que conjunta las técnicas de aprendizaje automático, reconocimientos de patrones, estadística, base de datos y visualización, para dirigirla a la extracción e interpretación de base de datos in mensas. 1.2 ¿Qué es la Minería de datos? Es un mecanismo de explotación, consistente en la búsqueda de información valiosa en grandes volúmenes de datos. La minería de datos se centra en llenar la necesidad de descubrir el por que, para luego predecir y pronosticar las posibles acciones con cierto factor de confianza para cada predicción. Es el análisis de archivos y bitácoras de transacciones, trabaja a nivel del conocimiento con el fin de descubrir patrones, relaciones, reglas, asociaciones o incluso excepciones útiles para la toma de decisiones. 1.3 Orígenes de la Minería de datos La minería de datos se ha insertado desde los años 90 en el contexto de las tecnologías de la información, algoritmia y desarrollo de software. Las líneas de desarrollo en el ámbito de minería de datos tienen sus orígenes en tres conceptos importantes. Estadística Clásica Inteligencia Artificial Aprendizaje Automático Análisis de regresión, desviación estándar, varianza, análisis de clustering, intervalos de confianza, entre otros. Ciertamente, en las herramientas y técnicas utilizadas en minería de datos, el análisis de estadística clásica juega un rol sumamente importante . Esta disciplina se encuentra basada en heurísticas, de forma opuesta a la estadística, pero debido a que su implementación necesitaba de computadoras con un poder de procesamiento alto Podemos describir como la unión de las estadísticas e Inteligencia Artificial porque conjunta heurísticas con análisis estadístico avanzado. 1.4 Clasificación de la minería de datos La Minería de datos puede ser dividida en: Minería de datos predictiva (MDP) Minería de datos para descubrimiento de conocimiento (MDDC) Minería de Datos Usa primordialmente técnicas estadísticas Usa principalmente técnicas de inteligencia artificial La Minería de datos puede ser dividida en: Minería de datos predictiva (MDP) Minería de datos para descubrimiento de conocimiento (MDDC) Minería de Datos Usa primordialmente técnicas estadísticas Usa principalmente técnicas de inteligencia artificial 1.5 Características de la minería de datos: Las herramientas de la minería de datos se combinan fácilmente y pueden analizarse y procesarse rápidamente. Explorar los datos se encuentran en las profundidades de las bases de datos, como los almacenes de datos, que algunas veces contienen información almacenada durante varios años. El entorno de la minería de datos suele tener una arquitectura cliente servidor Debido a la gran cantidad de datos, algunas veces resulta necesario usar procesamiento en paralelo para la minería de datos. Hurgar y sacudir a menudo implica el descubrimiento de resultados valiosos e inesperados. En algunos casos, los datos se consolidan en un almacén de datos y en mercados de datos; en otros, se mantienen en servidores de Internet e Intranet. Los componentes esenciales de la tecnología de Minería de Datos han estado bajo desarrollo por décadas, en áreas de investigación como: Estadísticas. Inteligencia artificial. aprendizaje de máquinas. 1.6 Usuarios de la Minería de datos: Metodología de la Minería de Datos Proceso de la Minería de Datos es el proceso de aplicar a una determinada base de datos las operaciones requeridas de selección, exploración, muestre, transformación y métodos de modelado para extraer los patrones y posteriormente evaluarlos para identificar el conjunto de ellos que representaran el conocimiento. El proceso de KDD (Knowledge Discovery in Databases) es un proceso iterativo porque incluye numerosos pasos en los que el usuario tiene que tomar decisiones. Es iterativo porque puede ser necesario acceder desde una fase a cualquiera de las anteriores, e interactivo porque el proceso es supervisado por el usuario de forma directa. . Consta de 4 pasos : 1. Selección de Objetivos 2. Preparación de Datos 3. Construcción del Modelo 4. Análisis de los Resultados.
Related documents