Data Mining es el proceso de extracción de conocimiento útil y comprensible, previamente desconocido desde grandes cantidades de datos almacenados en distintos formatos.

Aplicaciones de Data Mining

Customer Relationship Management (CRM)

Segmentación de clientes.
Predicción de compra.
Retención de clientes.
Predicción de fuga.

Detección de fraudes

Tarjetas de crédito.
Ingreso aduanero.
Telefonía móvil.
Licencias médicas.

Series de tiempo

Ventas en supermercados.
Evolución de acciones en la bolsa.

Data Mining vs Estadísticas

Estadística

Fuerte fundamento matemático
Herramientas clásicas
Volumen de datos bajo (muestreo)
Entendible sólo por estadísticos
VS

Data Mining

Orientación a lo práctico
Herramientas nuevas
Grandes volúmenes de datos
Entendible por cualquiera

¿Porqué no nos olvidamos de Data Mining y nos dedicamos a Big Data únicamente?

Porque no todo se puede hacer con Big Data los métodos de análisis están condicionados por la capacidad de distribuir las tareas.

La capacidad de proceso de los computadores condiciona este límite.