Monografias.com > Epistemología
Descargar Imprimir Comentar Ver trabajos relacionados

El Problema de la Extracción Automática de Conocimiento




Enviado por Pablo Turmero



Partes: 1, 2


    Monografias.com

    1
    ¿Qué es aprendizaje?
    (visión genérica, Mitchell 1997) es mejorar el comportamiento a partir de la experiencia. Aprendizaje = Inteligencia.
    (visión más estática) es la identificación de patrones, de regularidades, existentes en la evidencia.
    (visión externa) es la predicción de observaciones futuras con plausibilidad.
    (visión teórico-informacional, Solomonoff 1966) es eliminación de redundancia = compresión de información.
    El Problema de la Extracción Automática de Conocimiento
    La minería de datos no es más que un caso especial de aprendizaje computacional inductivo.
    Aprendizaje Inductivo: razonamiento hipotético de casos particulares a casos generales.

    Monografias.com

    2
    ¿Cómo se validan/descartan las hipótesis para conformar el conocimiento adquirido?

    Principio (‘escándalo’) de la Inducción: las hipótesis pueden ser refutadas, pero nunca confirmadas.

    Y para las que todavía no han sido refutadas, ¿cuál elegimos?
    Necesidad de criterios de selección: simplicidad, refuerzo, …
    Existencia de métodos de validación: estadísticos, cross-validation, informacionales, …

    ¿Cuánto afecta a la plausibilidad el número de ejemplos?
    ¿Cómo afecta la presencia de ruido?
    El Problema de la Extracción Automática de Conocimiento

    Monografias.com

    3
    Taxonomía de Técnicas de DM
    Clasificación de las técnicas de aprendizaje:
    Interpolación: una función continua sobre varias dimensiones
    Predicción secuencial: las observaciones están ordenadas secuencialmente. Se predice el siguiente valor de la secuencia. Caso particular de interpol. con 2 dim., una discreta y regular.
    Aprendizaje supervisado: cada observación incluye un valor de la clase a la que corresponde. Se aprende un clasificador. Caso particular de interpolación: la clase (imag. función) es discreta.
    Aprendizaje no supervisado: el conjunto de observaciones no tienen clases asociadas. El objetivo es detectar regularidades en los datos de cualquier tipo: agrupaciones, contornos, asociaciones, valores anómalos.
    Abducción o Aprendizaje Analítico: El contexto B es muy importante. El objetivo es explicar la evidencia respecto a B.
    Predictivos
    Descriptivos
    Explicativos
    Inductivos
    Abductivos
    Cualquier problema de aprendizaje inductivo se puede presentar (más o menos directamente) de cualquiera de estas cuatro formas.

    Monografias.com

    4
    Ejemplos:
    Interpolación:

    Predicción secuencial: 1, 2, 3, 5, 7, 11, 13, 17, 19, … ?
    Aprendizaje supervisado:
    1 3 -> 4.
    3 5 -> 8. 4 2 -> ?
    7 2 -> 9.
    Segmentación (Aprendizaje no supervisado):

    ¿Cuántos grupos hay?
    ¿Qué grupos formo?

    Predictivos
    Descriptivos
    Taxonomía de Técnicas de DM
    f(2.2)=?
    ?
    Análisis Exploratorio: Correlaciones, Asociaciones y Dependencia

    Monografias.com

    5
    PREDICTIVO: Interpolación y Predicción Secuencial.
    Generalmente las mismas técnicas:
    Datos continuos (reales):
    Regresión Lineal:
    Regresión lineal global (clásica).
    Regresión lineal ponderada localmente.
    Regresión No Lineal: logarítmica, pick & mix, …
    Datos discretos:
    No hay técnicas específicas: se suelen utilizar técnicas de algoritmos genéticos o algoritmos de enumeración refinados.

    Taxonomía de Técnicas de DM

    Monografias.com

    6
    PREDICTIVO: Aprendizaje supervisado.
    Dependiendo de si se estima una función o una correspondencia:
    clasificación: se estima una función (las clases son disjuntas).
    categorización: se estima una correspondencia (las clases pueden solapar).

    Dependiendo del número y tipo de clases:
    clase discreta: se conoce como “clasificación”.
    Ejemplo: determinar el grupo sanguíneo a partir de los grupos sanguíneos de los padres.
    si sólo tiene dos valores (V y F) se conoce como “concept learning”. Ejemplo: Determinar si un compuesto químico es cancerígeno.

    clase continua o discreta ordenada: se conoce como “estimación” (o también “regresión”).
    Ejemplo: estimar el número de hijos de una familia a partir de otros ejemplos de familias.
    Taxonomía de Técnicas de DM

    Monografias.com

    7
    PREDICTIVO: Aprendizaje supervisado (Clasificación).

    Técnicas:
    k-NN (Nearest Neighbor).
    k-means (competitive learning).
    Perceptron Learning.
    Multilayer ANN methods (e.g. backpropagation).
    Radial Basis Functions.
    Decision Tree Learning (e.g. ID3, C4.5, CART).
    Bayes Classifiers.
    Center Splitting Methods.
    Rules (CN2)
    Pseudo-relational: Supercharging, Pick-and-Mix.
    Relational: ILP, IFLP, SCIL.
    Taxonomía de Técnicas de DM
    Similarity-Based
    Fence and Fill

    Monografias.com

    8
    DESCRIPTIVO: Análisis Exploratorio

    Técnicas:
    Estudios correlacionales
    Asociaciones.
    Dependencias.
    Detección datos anómalos.
    Análisis de dispersión.
    Técnicas de Aprendizaje Automático

    Monografias.com

    9
    DESCRIPTIVO: Segmentación (Aprendizaje no supervisado)

    Técnicas de clustering:
    Taxonomía de Técnicas de DM
    k-means (competitive learning).
    redes neuronales de Kohonen
    EM (Estimated Means) (Dempster et al. 1977).
    Cobweb (Fisher 1987).
    AUTOCLASS

    Monografias.com

    10
    Un concepto importante en el aprendizaje supervisado (clasificación) y no supervisado (segmentación) es el concepto de similitud:

    La razón de este uso es que, intuitivametne, datos similares tendrán clases/grupos similares. ¿Cómo se mide la similitud?

    DISTANCIA inversa a SIMILITUD.

    Los métodos de similitud (o de distancia) se basan en almacenar los ejemplos vistos, y calcular la similitud/distancia del nuevo caso con el resto de ejemplos.

    Similitud/Distancia

    Partes: 1, 2

    Página siguiente 

    Nota al lector: es posible que esta página no contenga todos los componentes del trabajo original (pies de página, avanzadas formulas matemáticas, esquemas o tablas complejas, etc.). Recuerde que para ver el trabajo en su versión original completa, puede descargarlo desde el menú superior.

    Todos los documentos disponibles en este sitio expresan los puntos de vista de sus respectivos autores y no de Monografias.com. El objetivo de Monografias.com es poner el conocimiento a disposición de toda su comunidad. Queda bajo la responsabilidad de cada lector el eventual uso que se le de a esta información. Asimismo, es obligatoria la cita del autor del contenido y de Monografias.com como fuentes de información.

    Categorias
    Newsletter