PMML (Predictive Model Markup Language) es un lenguaje estándar para representar modelos de analítica predictiva.

Los modelos de analítica predictiva utilizan el conocimiento adquirido para predecir la existencia de patrones conocidos en datos nuevos.

PMML permite compartir fácilmente modelos de analítica predictiva entre distintas aplicaciones, permitiendo capacitar un modelo en un sistema, expresarlo en PMML y moverlo hacia otro sistema donde pueda usarse para predecir, por ejemplo, la probabilidad de rotura de una máquina.

La mayoría de las herramientas de minería de datos de hoy en día pueden exportar o importar PMML.

La estructura de un fichero PMML incluye 8 procesos

:

· El Diccionario de Datos identifica y define qué campos de datos de entrada son útiles para resolver el problema a la mano.

· El Esquema de Minería define las estrategias para manejar valores atípicos.

· Las Transformaciones de Datos definen los cálculos requeridos para preprocesar los datos de entrada en bruto en campos derivados.

· La Definición de Modelo define la estructura y los parámetros utilizados para construir el modelo.

· Las Salidas definen las salidas de modelo esperadas. Para una tarea de clasificación,

· Los Objetivos definen los pasos de postproceso a ser aplicados a la salida de modelo.

· La Explicación del Modelo define las medidas de rendimiento obtenidas al pasar datos de prueba a través del modelo (en contraposición a los datos de capacitación).

· La Verificación del Modelo define un conjunto de muestra de registros de datos de entrada junto con salidas de modelo esperadas.

Leer más 

Anuncios