Monografias.com > Sin categoría
Descargar Imprimir Comentar Ver trabajos relacionados

Data mining – minería de datos (PPT) (página 2)



Partes: 1, 2

Monografias.com

(Gp:) X1, X2, …, X5
3, 5, …, 8
2, 4, …, 0
0, 1, …, 7
(Gp:) vs.
(Gp:) X1
(Gp:) X2
(Gp:) P(X1)
(Gp:) P(X2|X1)

fumar
cáncer
Ejemplo 2

Monografias.com

¿Para qué puede ser útil la Minería de Datos?
1 exabyte (1 millón de terabytes) se
genera anualmente en todo el mundo

Monografias.com

¿Para qué puede ser útil la Minería de Datos? (Cont.)
Las BD se usan para:
Guardar datos
Confirmar hipótesis previas
¿Probar hipótesis alternativas?

Monografias.com

¿Para qué puede ser útil la Minería de Datos? (Cont.)
Control
Diagnóstico
Predicción
Toma de decisiones
(Gp:) Conocimiento
(Gp:) Patrones

Monografias.com

Herramientas para la Minería de Datos
Métodos estadísticos
Reglas de asociación (si-entonces)
Árboles de decisión
Modelos Gráficos
Redes Neuronales
Algoritmos Genéticos
Lógica Difusa

Monografias.com

Ejemplo3: definir grupos diferenciados de empleados.
El departamento drecoursesos humanos de una gran empresa, desea categorizar a sus empleados en distintos grupos, con el objetivo de establecer una trato personalizado con ellos y definir las políticas sociales de la empresa. La organización dispone en sus bases de datos de información sobre sus empleados.

Monografias.com

Ejemplo3: definir grupos diferenciados de empleados.
ID Sueldo Casado Coche Hijos Alq/Prop Sindic. Bajas/Año Antigüedad Sexo
1 10000 Sí No 0 Alquiler No 7 15 H
2 20000 No Sí 1 Alquiler Sí 3 3 M
3 15000 Sí Sí 2 Propietario Sí 5 10 H
4 30000 Sí Sí 1 Alquiler No 15 7 M
5 10000 Sí Sí 0 Propietario Sí 1 6 H
6 40000 No Sí 0 Alquiler Sí 3 16 M
7 25000 No No 0 Alquiler Sí 0 8 H
8 20000 No Sí 0 Propietario Sí 2 6 M
9 20000 Sí Sí 3 Propietario No 7 5 H
10 30000 Sí Sí 2 Propietario No 1 20 H
11 50000 No No 0 Alquiler No 2 12 M
12 8000 Sí Sí 2 Propietario No 3 1 H
13 20000 No No 0 Alquiler No 27 5 M
14 10000 No Sí 0 Alquiler Sí 0 7 H
15 8000 No Sí 0 Alquiler No 3 2 H

Monografias.com

Ejemplo3: definir grupos diferenciados de empleados.
ID Sueldo Casado Coche Hijos Alq/Prop Sindic. Bajas/Año Antigüedad Sexo
1 10000 Sí No 0 Alquiler No 7 15 H
2 20000 No Sí 1 Alquiler Sí 3 3 M
3 15000 Sí Sí 2 Prop Sí 5 10 H
4 30000 Sí Sí 1 Alquiler No 15 7 M
5 10000 Sí Sí 0 Prop Sí 1 6 H
6 40000 No Sí 0 Alquiler Sí 3 16 M
7 25000 No No 0 Alquiler Sí 0 8 H
8 20000 No Sí 0 Prop Sí 2 6 M
9 20000 Sí Sí 3 Prop No 7 5 H
10 30000 Sí Sí 2 Prop No 1 20 H
11 50000 No No 0 Alquiler No 2 12 M
12 8000 Sí Sí 2 Prop No 3 1 H
13 20000 No No 0 Alquiler No 27 5 M
14 10000 No Sí 0 Alquiler Sí 0 7 H
15 8000 No Sí 0 Alquiler No 3 2 H
A partir de estos datos, las técnicas de DM podrían generar un modelo de los datos, consistente en un conjunto de grupos de empleados con características similares. Este modelo proporcionaría una descripción "mas significativa" de los datos disponibles.

Monografias.com

Ejemplo3: definir grupos diferenciados de empleados.
Grupo 1: 5 ejemplos
Sueldo : 22600
Casado : No -> 0.8
Sí -> 0.2
Coche : No -> 0.8
Sí -> 0.2
Hijos : 0
Alq/Prop : Alquiler -> 1.0
Sindic. : No -> 0.8
Sí -> 0.2
Bajas/Año : 8
Antigüedad : 8
Sexo : H -> 0.6
M -> 0.4
Grupo 2: 4 ejemplos
Sueldo : 22500
Casado : No -> 1.0
Coche : Sí -> 1.0
Hijos : 0
Alq/Prop : Alquiler -> 0.75
Prop -> 0.25
Sindic. : Sí -> 1.0
Bajas/Año : 2
Antigüedad : 8
Sexo : H -> 0.25
M -> 0.75
Grupo 3: 6 ejemplos
Sueldo : 18833
Casado : Sí -> 1.0
Coche : Sí -> 1.0
Hijos : 2
Alq/Prop : Alquiler -> 0.17
Prop -> 0.83
Sindic. : No -> 0.67
Sí -> 0.33
Bajas/Año : 5
Antigüedad : 8
Sexo : H -> 0.83
M -> 0.17
GRUPO 1: Solteros, sin hijos y de alquiler. Poco sindicados. Muchas bajas.
GRUPO 2: Solteros, sin hijos y de alquiler. Muy sindicados. Pocas bajas. Normalmente mujeres.
GRUPO 3: Casados, con hijos y propietarios. Poco sindicados. Normalmente hombres.

Monografias.com

Técnicas de Minería de Datos
Tareas de Minería de Datos.

Modelos de datos
Vista minable
Tarea de DM
Problema
Tipo de conocimiento
Técnica de DM

Técnica de DM
Algoritmo

Algoritmo
Modelo de los datos

Monografias.com

Tareas de Minería de Datos.

Modelos de datos
Vista minable
Tareas de DM
Predictivas
Descriptivas
Estimación de valores futuros o desconocidos de variables de interés (variable objetivo) a partir de otras variables independientes (predictivas).
Identificación de patrones en los datos que los explican o resumen.
Ejemplos: 1 y 3
Ejemplos: 2, 4 y 5
Técnicas de Minería de Datos

Monografias.com

Tareas de Minería de Datos.

Modelos de datos
Vista minable
Tareas de DM
Predictivas
Descriptivas
Clasificación
Regresión
Asociación
Agrupamiento (clustering)
Correlación
Técnicas de Minería de Datos

Monografias.com

Tareas de Minería de Datos.

Modelos de datos
Vista minable
Dominio de ejemplos: D
tipo_ejemplo = {A1:D1, A2:D2, …, An:Dn}
ejemplo e = {A1:v1, A2:v2, …, An:vn} / vi?Di
e = / vi?Di

D = {e: / vi?Di}

Técnicas de Minería de Datos

Monografias.com

Tareas de Minería de Datos.

Modelos de datos
Vista minable
Tareas de DM
Predictivas
Descriptivas
Clasificación
Regresión
Asociación
Agrupamiento (clustering)
Correlación
Técnicas de Minería de Datos

Monografias.com

Tareas de Minería de Datos.
Tareas de DM
Predictivas
Descriptivas
Clasificación
Regresión
Asociación
Agrupamiento (clustering)
Correlación
Técnicas de Minería de Datos
Clasificación
Clasificación suave
Estimación de probabilidad de clasificación
Categorización

Monografias.com

Tareas de Minería de Datos.

Modelos de datos
Vista minable
Tareas predictivas.
La clasificación:
A cada ejemplo del tipo de objeto a clasificar (registro de la base de datos) se le asigna una clase, representada por el valor de un atributo (atributo de clase). El dominio del atributo de clase es discreto, cada valor representa una clase de objeto.
Los restantes atributos que sean significativos para determinar la clase, son utilizadas por las técnicas de clasificación para generar funciones (reglas) que permiten determinar la clase de un ejemplo a partir de los valores de sus atributos significativos.
El objetivo de la tarea es poder predecir la clase de nuevos ejemplos a partir del valor de sus atributos significativos, utilizando las reglas generadas.
Técnicas de Minería de Datos

Monografias.com

Tareas de Minería de Datos.

Modelos de datos
Vista minable
Tareas predictivas.
La clasificación:
Entrada:
tipo_ejemplo = {A1:D1, A2:D2, …, An:Dn}
D = {e: / vi?Di}: dominio de ejemplos
E ? D: conjunto de ejemplos (muestra)
S = {c1, c2, …, cm}: m clases,
{: e?E, s?S}: conjunto de ejemplos etiquetado
Salida:
?: E ? S: función clasificador
Técnicas de Minería de Datos

Monografias.com

Conclusiones
Información segura y confiable
Se usa como una alternativa para la toma de decisiones en una organización
Permite tener de una manera organizada los datos con el fin de poder extraer informes específicos en determinados ciclos de tiempo
Brinda una estructura robusta en el almacenamiento de datos

Partes: 1, 2
 Página anterior Volver al principio del trabajoPágina siguiente 

Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.

Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

Categorias
Newsletter