Es posible que hayas visto la herramienta de Clustering en la cinta de opciones Estadísticas | Transformación. Incluso, puede que hayas intentado ejecutarla en tus datos, pero no hayas tenido claro dónde están o qué significan los resultados. Este artículo te ayudará a ejecutar la herramienta y a utilizar los resultados de clustering para procesar tus datos de manera más efectiva.
Aquí es donde encontrarás la herramienta de Clustering:
Esta herramienta está diseñada para detectar e identificar diferentes clusters (agrupamientos) en tus datos. Esto es útil para cualquier proyecto de exploración, donde la perforación naturalmente produce clusters alrededor de las partes más valiosas del proyecto. En este ejemplo, analizamos algunos ensayos de barrenos centrados en valores de oro.
Quiero entender qué clusters estadísticos pueden estar ocultos en estos datos. Si abrimos la herramienta de Clustering, obtendremos un cuadro de diálogo como este:
La sección Entrada es bastante sencilla. Simplemente elige el archivo de datos en el que deseas ejecutar el clustering, y luego agrega los campos de datos que son importantes para analizar. Puedes ejecutar el clustering en campos individuales o en varios campos juntos.
La sección Parameteros requiere que especifiques el Método de Clustering y el Número de Clusters.
| Método | Descripción |
| K-Means | Se utiliza un algoritmo basado en distancias para dividir n puntos en k clusters. Cada punto pertenece al cluster con la media más cercana (centroide del cluster), que sirve como prototipo de ese cluster. |
| Gaussian Mixture | Una mezcla de distribuciones normales que representan la distribución de probabilidad general de los puntos de datos. |
| Self-Organising Map | Una red neuronal artificial (ANN) es entrenada para realizar una reducción de dimensionalidad para crear una representación discretizada (mapa de vecindad) de los datos de entrada. |
Para el Número de Clusters, puedes comenzar con un número arbitrario y luego revisar los resultados. Si notas que los clusters más recientes solo tienen unas pocas muestras, considera disminuir el número de clusters.
Para el Método de Transformación, tienes dos opciones, como se describe a continuación.
El método de Centered Log-Ratio te permite controlar cómo se calcularán los valores cero.
| Método | Descripción |
| Z-Score | Los datos se transforman restando el valor medio de cada campo de los valores en los datos composicionales y luego dividiendo por la desviación estándar de cada campo, resultando en datos con una media de cero y una desviación estándar de uno. |
| Centred Log-Ratio (CLR) | Se realiza una transformación de logaritmo centrado para eliminar los efectos de cierre en los datos composicionales. |
Para Sample Weight, puedes seleccionar el campo de datos deseado de tu entrada que contiene un valor de ponderación. Aquí podrías usar algo como la longitud de cada intervalo de ensayo.
La parte final de esta configuración es la sección Output. Te permite escribir los resultados de clustering en un archivo de salida completamente nuevo, o hacer que la herramienta cree una nueva columna en el archivo de datos de entrada llamada "CLUSTER_ID."
Cuando ejecutes la herramienta, puede parecer que hay muy pocos cambios. Abre el archivo de entrada/salida dependiendo de dónde elegiste almacenar los resultados, y encontrarás una columna llamada CLUSTER_ID que está poblada con los números de cluster calculados por la herramienta:
Ahora que tenemos estos datos, podemos ir más allá mostrándolos junto a nuestras trazas de barrenos. En esta imagen, los resultados de CLUSTER_ID están a la izquierda y los ensayos de oro a la derecha:
También podemos usar estos datos de cluster para refinar nuestros otros gráficos estadísticos. Por ejemplo, ahora puedes usar CLUSTER_ID como filtro y crear histogramas de oro para clusters individuales.
Hay muchas formas de aplicar los resultados de clustering a tus datos de entrada utilizando varios filtros y gráficos estadísticos. Ahora que conoces lo básico, puedes usar esta información para comprender mejor las distribuciones en tu proyecto.
Want to learn more?
Online Help Manuals - Click here for the latest version
Learning Management System - Click here to login or here to request access
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.