Clustering jerárquico en Machine Learning

¿Utilizas el clustering jerárquico para diversificar tu cartera?

Uno de los principios básicos en la diversificación de carteras consiste en la elección de activos que no estén correlacionados. Por eso, la matriz de covarianzas de los retornos de nuestro universo es un elemento de entrada para procesos de optimización de carteras, trading algorítmico y control de riesgos, entre otros.

Sin embargo, en ocasiones estas decisiones se complementan con una parte cualitativa que involucra un análisis exploratorio de los elementos de entrada. La dificultad surge cuando debido a un número relevante de activos, la matriz de covarianzas no es interpretable de forma sencilla.

Aquí mostraremos con un ejemplo práctico cómo utilizar dendogramas, una herramienta gráfica del clustering jerárquico, para facilitar esta tarea de análisis e interpretación.

Si tuviéramos que elegir un conjunto diversificado de acciones entre los componentes de un índice amplio de mercado, una selección manual de activos de diferentes sectores ya nos arrojaría una solución aceptable.

Ejemplo práctico:

Para hacer nuestro ejemplo más interesante, vamos a proponernos explorar las alternativas de diversificación dentro de un mismo sector, que a priori parece menos evidente.

Partimos del Stoxx Europe 600 Oil & Gas, cuyos componentes podemos encontrar fácilmente a partir de la cesta de algún ETF que replique físicamente este índice sectorial.

Este índice sectorial contiene las empresas del Stoxx 600 que pertenecen o están relacionadas con el sector del petróleo o el gas natural como se puede apreciar a continuación:

Matriz de correlaciones:

Una estrategia intermedia para facilitar la interpretación consiste en utilizar la matriz de correlaciones, que corresponde a una versión estandarizada de la matriz de covarianzas.

Su construcción es similar: a partir de la serie de precios, se calculan los rendimientos logarítmicos, y para cada par de series de rendimientos se calcula correlación que corresponde a una entrada en la matriz.

Con un rango de [-1, 1] podemos ver los activos más correlacionados con valores más próximos a 1, como muestra la siguiente tabla:

Construcción del dendograma:

El clustering jerárquico es una técnica de machine learning no supervisado que a partir de la similitud entre los elementos del conjunto de datos busca construir una jerarquía de grupos.

Intuitivamente para nuestro ejemplo, esto consiste en que dos acciones muy correlacionadas pasan a formar un grupo, que a su vez puede emparejarse con otros elementos o grupos pero a un nivel más alto de la jerarquía.

Un dendograma es la representación gráfica en forma de árbol invertido y donde elementos unidos más abajo indican mayor similitud y a medida que se enlazan más arriba indican menor semejanza.

Merece la pena aclarar que aunque (1 – correlación) puede utilizarse como medida de similitud, el algoritmo en realidad lo que hace es calcular la similitud a partir de la suma de las diferencias de cuadrados de las correlaciones con el resto de activos (esto es, el cálculo del cuadrado de la distancia euclídea por cada par de filas de la matriz de correlaciones).

En la figura vemos el dendograma correspondiente a nuestro ejemplo construido fácilmente con Python utilizando las librerías scipy y sklearn.

Interpretación:

Interpretándolo con la altura de los enlaces vemos que (0) Shell y BP tienen la mayor correlación, luego (1) Repsol y Galp, y después (2) Equinor y Akerbp. Sin embargo, todas ellas están completamente alejadas de Neste, que solo se relaciona con ellas en el nivel superior de la jerarquía.

Estas jerarquías nos permiten además determinar grupos separados de elementos. Si trazamos un corte horizontal imaginario entre las alturas 12 y 13 observamos que nos quedaríamos con 5 grupos de acciones que corresponden a los diferentes colores del diagrama.

Una selección manual que esté diversificada se puede hacer eligiendo un elemento de cada uno de estos grupos. Por otro lado, los grupos con enlaces a niveles más bajos están más cohesionados que otros grupos cuyos primeros enlaces aparecen a mayor altura.

Si te interesa profundizar en tus competencias sobre Machine Learning, aquí en Braindex tenemos un curso que presenta una visión general de las técnicas supervisadas y no supervisadas, y entre las no supervisadas vemos el clustering jerárquico de forma similar a como lo hemos discutido en este ejemplo.

Descubre el curso de Machine Learning con Tomás de la Rosa

Iníciate en nuestra categoría de Tecnología con el curso de Machine Learning, con el que te acercarás al Machine Learning con ejemplos del mundo financiero para que puedas entenderlo fácilmente.

Ver Curso

Machine Learning con Tomás de la Rosa en Braindex

Cookie	Tipo	Duración	Descripción
cookielawinfo-checbox-analytics	0	11 meses	Esta cookie está configurada por el complemento de consentimiento de cookies de GDPR. Las cookies se utilizan para almacenar el consentimiento del usuario para las cookies en la categoría "Analítica".
cookielawinfo-checbox-functional	0	11 meses	Esta cookie está configurada por el complemento de consentimiento de cookies de GDPR. Las cookies se utilizan para almacenar el consentimiento del usuario para las cookies en la categoría "Funcionales".
cookielawinfo-checkbox-advertisement	0	11 meses	Esta cookie está configurada por el complemento de consentimiento de cookies de GDPR. Las cookies se utilizan para almacenar el consentimiento del usuario para las cookies en la categoría "Marketing y Publicidad".
cookielawinfo-checkbox-necessary	persistent	11 meses	Esta cookie está configurada por el complemento de consentimiento de cookies de GDPR. Las cookies se utilizan para almacenar el consentimiento del usuario para las cookies en la categoría "Necesarias".
cookielawinfo-checkbox-non-necessary	persistent	11 meses	Esta cookie está configurada por el complemento de consentimiento de cookies de GDPR. Las cookies se utilizan para almacenar el consentimiento del usuario para las cookies en la categoría "No necesarias".
cookielawinfo-checkbox-performance	0	11 meses	Esta cookie está configurada por el complemento de consentimiento de cookies de GDPR. Las cookies se utilizan para almacenar el consentimiento del usuario para las cookies en la categoría "Rendimiento".
JSESSIONID	session	Sesión	Cookie de sesión de plataforma de propósito general que se utiliza para mantener el estado de los usuarios en las solicitudes de página.
lang	session	Sesión	Esta cookie se utiliza para almacenar las preferencias de idioma de un usuario para ofrecer contenido en ese idioma almacenado la próxima vez que el usuario visite el sitio web.
PHPSESSID	session	Sesión	La cookie se utiliza para almacenar e identificar la identificación de sesión única de un usuario con el fin de administrar la sesión del usuario en el sitio web. La cookie es una cookie de sesión y se elimina cuando se cierran todas las ventanas del navegador.
test_cookie	persistent	11 meses	Esta cookie está configurada por el complemento de consentimiento de cookies de GDPR. El propósito de la cookie es determinar si el navegador de los usuarios admite cookies.
viewed_cookie_policy	persistent	11 meses	La cookie está configurada por el complemento de consentimiento de cookies de GDPR y se utiliza para almacenar si el usuario ha dado su consentimiento o no para el uso de cookies. No almacena ningún dato personal.
woocommerce_cart_hash	session	Sesión	Ayuda a WooCommerce a determinar cuándo cambia el contenido / los datos del carrito. https://docs.woocommerce.com/document/woocommerce-cookies/
woocommerce_items_in_cart	session	Sesión	Ayuda a WooCommerce a determinar cuándo cambia el contenido / los datos del carrito. https://docs.woocommerce.com/document/woocommerce-cookies/
wordpress_logged_in_xxxxxxxxxxxx	session	Sesión	Indica cuándo ha iniciado sesión y quién es, para la mayoría de los usos de la interfaz.
wordpress_sec_xxxxxxxxxxxxx	session	Sesión	Para brindar protección contra piratas informáticos, almacena los detalles de la cuenta.
wp_woocommerce_session_xxxxxx	persistent	2 días	Contiene un código único para cada cliente para que sepa dónde encontrar los datos del carrito en la base de datos de cada cliente.
wp-settings-xxxxx	session	Sesión	Esta cookie se usa para personalizar su vista de la interfaz de administración y posiblemente también la interfaz del sitio principal. https://wordpress.org/support/article/cookies/
XSRF-TOKEN	session	Sesión	Esta cookie se utiliza con fines de seguridad del sitio web.

Cookie	Tipo	Duración	Descripción
_ga	persistent	2 años	Esta cookie es instalada por Google Analytics. La cookie se utiliza para calcular los datos de visitantes, sesiones, campañas y realizar un seguimiento del uso del sitio para el informe de análisis del sitio. Las cookies almacenan información de forma anónima y asignan un número generado aleatorio para identificar visitantes únicos.
_ga_xxxxxxxx	persistent	2 años	Cookie utilizada por Google Analytics para distinguir usuarios
_gat	session	1 minuto	Google Universal Analytics instala estas cookies para acelerar la tasa de solicitud y limitar la recopilación de datos en sitios de alto tráfico.
_gat_UA-XXXXXXXX-X	session	1 minuto	Esta es una cookie de tipo de patrón establecida por Google Analytics, donde el elemento de patrón en el nombre (XXXXXXX-X) contiene el número de identidad único de la cuenta o sitio web con el que se relaciona. Es una variación de la cookie _gat que se utiliza para limitar la cantidad de datos registrados por Google en sitios web de alto volumen de tráfico.
_gid	persistent	1 día	Esta cookie es instalada por Google Analytics. La cookie se utiliza para almacenar información sobre cómo los visitantes usan el sitio web y ayuda a crear un informe analítico de cómo está funcionando el sitio. Los datos recopilados, incluido el número de visitantes, la fuente de donde provienen y las páginas, se muestran de forma anónima.
vuid	persistent	2 años	Esta cookie creada por Vimeo se utiliza para asignar una identificación única de Vimeo Analytics. Para obtener más información, visita: https://vimeo.com/cookie_policy

Clustering jerárquico para explorar alternativas de diversificación

Un post de Tomás De la Rosa

¿Utilizas el clustering jerárquico para diversificar tu cartera?

Ejemplo práctico:

Matriz de correlaciones:

Construcción del dendograma:

Interpretación:

Descubre el curso de Machine Learning con Tomás de la Rosa

Busca tu curso en Braindex

¿Utilizas el clustering jerárquico para diversificar tu cartera?

Ejemplo práctico:

Matriz de correlaciones:

Construcción del dendograma:

Interpretación:

Descubre el curso de Machine Learning con Tomás de la Rosa

Comparte el post

Otros artículos que pueden interesarte

Busca tu curso en Braindex