Download Separar la mena de la ganga

Document related concepts

Cross Industry Standard Process for Data Mining wikipedia , lookup

Web mining wikipedia , lookup

Java Data Mining wikipedia , lookup

Aprendizaje basado en árboles de decisión wikipedia , lookup

Transcript
Separar la mena de la ganga · ELPAÍS.com
1 de 2
http://www.elpais.com/articulo/dinero/inversiones/Separar/mena/ganga...
registrar
Negocios
Inicio
Internacional
España
Deportes
Economía
Bolsas | Fondos |
DOCUMENTO
conectar
Martes, 29/9/2009, 17:09 h
Tecnología
Cultura
Gente y TV
Sociedad
Opinión
Blogs
Participa
Negocios
Consulta el auto del juez Pedreira con la lista de los 71 imputados por el Tribunal Superior de Madrid
ELPAIS.com > Economía > Negocios
ANÁLISIS: Carreras & capital humano QUÉ ES... Minería de datos
Separar la mena de la ganga
GUSTAVO PINTADO 14/06/2009
Vota
Resultado
1 votos
Para definir conceptos se puede usar la forma positiva (qué es) o la negativa (qué no
es). Para el caso de la Minería de Datos usaremos ambas, ya que frecuentemente se usa
este término para cosas que poco o nada tienen que ver con lo que es la Minería de
Datos.
Una definición muy extendida es: "Extracción no
trivial de información potencialmente útil,
implícita en los datos y previamente
webs en español
desconocida". La Minería de Datos es la ciencia
en otros idiomas
que se encarga a partir de grandes repositorios de
información de obtener la que es útil de forma
automática sin un conocimiento previo de qué se va a obtener. Se trata de descubrir
relaciones entre las variables, patrones de comportamiento e identificación de los
grupos de comportamiento y sus diferencias.
La noticia en otros webs
La información obtenida se puede usar para crear modelos de predicción, clasificación
o segmentación. Proporciona herramientas para la toma de decisiones o la
automatización de procesos complejos como la detección en tiempo real de
transacciones electrónicas fraudulentas o de averías o fallos de construcción.
Visto qué es Minería de Datos, veamos ejemplos de lo que muchas veces se presenta
como tal y no lo es, sobre todo porque no implica un "descubrimiento" de información
desconocida, sino que se trata de una organización más clara de los datos conocidos:
-Procedimientos para cálculo predefinido de indicadores que resumen datos de bases
de datos.
Llavero Mini Altavoz
Precio 14.95 €
Lo más visto
...valorado
...enviado
1. Alonso cobrará 25 millones de euros al año en Ferrari
2. Fernando Trueba, a por su segundo Oscar con 'El baile
de la Victoria'
3. Una firma sospechosa de financiar al PP de Camps
pagó a la red Gürtel en Madrid
4. Los presupuestos de 2010 recogen más gasto y
menos inversión
5. Muere una niña británica tras recibir la vacuna contra
el virus del papiloma
-Implementaciones de repositorios como son los Data-Warehouses y Data-Marts que
resumen información recopilada por las bases de datos operacionales.
6. Los Reyes y Zapatero, mañana en Copenhague
-Sistemas de visualización de datos o indicadores calculados a partir de los mismos
siguiendo relaciones previamente conocidas.
8. Nadie quiere dirigir el instituto
7. La Casa del Rey congela su presupuesto por primera
vez en la historia
9.
Boris Becker, solidario y cervecero
10. Intel busca desterrar el USB con fibra óptica
La implementación real de técnicas de Minería de Datos implica el conocimiento
profundo de conceptos y metodologías propias de la Inteligencia Artificial, siendo éste
uno de los mayores escollos para implementar estas técnicas en los repositorios. Un
proceso típico de Minería de Datos consta de los siguientes pasos generales:
Listado completo
1. Selección del conjunto de datos, referida tanto a las variables dependientes como a
las variables objetivo.
2. Análisis de las propiedades de los datos, en especial los histogramas, diagramas de
dispersión, presencia de valores atípicos y ausencia de datos (valores nulos).
3. Transformación del conjunto de datos de entrada en función del análisis previo, con
el objetivo de prepararlo para aplicar la mejor técnica de Minería de Datos.
4. Seleccionar y aplicar la técnica de Minería de Datos. Se construye el modelo
predictivo, de clasificación o segmentación.
5. Evaluar resultados contrastándolos con una serie de datos reservada para validar el
modelo.
29/09/2009 17:08
Separar la mena de la ganga · ELPAÍS.com
2 de 2
http://www.elpais.com/articulo/dinero/inversiones/Separar/mena/ganga...
Si el modelo no supera la evaluación el proceso se podría repetir en su totalidad o
desde uno de los pasos. Una vez validado, si resulta ser aceptable (proporciona salidas
adecuadas y/o con márgenes de error admisibles), éste ya está listo para su explotación.
Los modelos obtenidos se aplican incorporándolos en los sistemas de análisis de
información de las organizaciones, e incluso, en los sistemas transaccionales. Gustavo Pintado es socio director de Gamco.
Vota
Resultado
Imprimir
Estadística
Corregir
Derechos
1 votos
Compartir:
Enviar
Puedes utilizar el teclado:
¿Qué es esto?
Texto
Si te ha interesado esta información, te recomendamos:
Otras ediciones
Publicado en Edición Impresa en la sección de Negocios
Versión texto accesible
Edición de Bolsillo, edición para PDA/PSP ó Móvil
Edición Impresa en PDF
- 14-06-2009
Última hora
Lo último
Vídeos
Agencia EFE
Fotos
Gráficos
El Olympique aterriza en Madrid con
Morientes y Heinze - 16:05
16:55 México: La administración del miedo
16:51 Las lluvias torrenciales anegan La Plana
16:42 El catalán es la octava lengua más activa en los
blogs
16:38 Premios Casa de las Ciencias
El PP asegura que el gasto público
aumenta un 8'6% en los presupuestos
para 2010 - 15:58
16:37 Un grupo de senadores checos presenta un
recurso contra el Tratado de Lisboa
Ver más noticias
Salgado, sobre los Presupuestos: "No
tengo la impresión de que a los grupos
de izquierda les resulte difícil
aprobarlos" - 15:22
Otros vídeos
Ayuda
Contacto
Venta de fotos
Publicidad
Aviso legal
elpais.com en tu web
SiteIndex
© EDICIONES EL PAÍS, S.L. - Miguel Yuste 40 - 28037 Madrid (España)
Canal de la Sociedad
de la Información
29/09/2009 17:08