Modelos hiperbólicos superan a GNN euclidianos en detección de entidades de Bitcoin

2h ago•

bullish:

bearish:

Un nuevo estudio académico sobre redes de transacciones de Bitcoin encontró que las redes neuronales de grafos en espacio hiperbólico superan de forma consistente a sus equivalentes euclidianos al clasificar entidades dentro de un grafo masivo. El trabajo también concluye que la profundidad del modelo y la selección conjunta de curvatura y tasa de aprendizaje son factores decisivos para estabilizar el entrenamiento y mejorar la detección de patrones complejos, incluidos casos vinculados con actividades ilícitas.
***

El estudio comparó modelos GCN, GraphSAGE y GAT en geometría euclidiana e hiperbólica sobre un grafo de Bitcoin con unos 252 millones de nodos y 785 millones de aristas.
Los mejores resultados llegaron con arquitecturas hiperbólicas profundas, especialmente Hyperbolic GraphSAGE, que alcanzó un macro-F1 de 0,81 en subgrafos de profundidad tres.
Los autores observaron mejoras en clases difíciles como Ponzi, Exchange, Mining y Ransomware, además de un papel clave de la curvatura a partir de c ≥ 1,0.

Las redes de transacciones de Bitcoin son mucho más que una lista de pagos entre direcciones. En la práctica, forman sistemas socio-técnicos de gran escala, donde los fondos pasan por múltiples saltos, se fragmentan y vuelven a agruparse. Esa estructura ha convertido a los grafos en una herramienta central para analizar actividad legítima e ilícita dentro del ecosistema.

En ese contexto, un nuevo trabajo de Ankit Ghimire, Saydul Akbar Murad y Nick Rahimi plantea una pregunta técnica con implicaciones directas para la analítica forense: ¿qué geometría representa mejor esos patrones, la euclidiana tradicional o la hiperbólica? Según los resultados del estudio, la segunda opción ofrece ventajas medibles cuando el modelo debe capturar vecindarios más profundos y ramificados.

El estudio, titulado A Depth-Aware Comparative Study of Euclidean and Hyperbolic Graph Neural Networks on Bitcoin Transaction Systems, realizó una comparación controlada entre redes neuronales de grafos euclidianas e hiperbólicas para clasificación de nodos en una gran red de Bitcoin. La idea fue mantener fija la arquitectura y la dimensionalidad, pero variar la profundidad del vecindario para medir cómo cambia el desempeño en ambos espacios geométricos.

La motivación es clara. Actividades como lavado de dinero, ransomware, esquemas Ponzi o uso de mezcladores rara vez se distinguen por una sola transacción. Más bien aparecen como cadenas coordinadas de varios pasos, con direcciones intermediarias y patrones de ramificación que, vistos desde un nodo de origen, se parecen a una expansión en árbol.

Para lectores menos familiarizados con el tema, las Graph Neural Networks o GNN son modelos de inteligencia artificial diseñados para aprender sobre datos conectados entre sí. En blockchain, pueden usarse para clasificar direcciones, detectar anomalías o estudiar relaciones entre entidades. La novedad aquí no es solo aplicar GNN a Bitcoin, sino probar de forma sistemática si el tipo de espacio matemático donde se incrustan los datos cambia el resultado.

Un grafo masivo de Bitcoin con siete clases de entidades

Los investigadores usaron la base de datos reconstruida por Schnoering y Vazirgiannis, un grafo de transacciones de Bitcoin con aproximadamente 252 millones de nodos y 785 millones de aristas. Dentro de ese universo, el análisis se concentró en 34.000 nodos etiquetados pertenecientes a siete clases: Exchange, Mining, Gambling, Ponzi, Individual, Ransomware y Bet.

Ese conjunto ofrece una taxonomía más rica que otros datasets populares, como Elliptic, que suele trabajar con clasificación binaria entre actividad lícita e ilícita. En este caso, el objetivo fue estudiar con mayor granularidad cómo responde cada geometría al intentar distinguir entidades con comportamientos transaccionales diferentes.

La partición de los datos se hizo con muestreo estratificado: 40% para entrenamiento, 30% para validación y 30% para prueba. Debido al fuerte desbalance entre clases, el sobre-muestreo aleatorio se aplicó solo al grupo de entrenamiento hasta llevar cada clase a 300 muestras, mientras que validación y prueba se mantuvieron sin cambios.

Dado el tamaño del grafo completo, los autores no entrenaron sobre toda la red simultáneamente. En su lugar, construyeron subgrafos egocéntricos alrededor de cada nodo etiquetado. Ese enfoque permite trabajar con contexto local de múltiples saltos sin perder control experimental sobre la comparación entre modelos.

Se evaluaron dos profundidades de muestreo. La primera fue profundidad dos, con fan-out de 5 vecinos en el primer salto y 10 en el segundo. La segunda fue profundidad tres, con fan-out de 5, 10 y 8 en cada salto respectivo. A diferencia de otros trabajos que generan múltiples muestras por nodo, aquí se construyó un solo subgrafo fijo por dirección para reducir la varianza del muestreo.

Qué modelos probaron y por qué importa la geometría

El experimento comparó tres arquitecturas conocidas: GCN, GraphSAGE y GAT. Cada una fue implementada en versión euclidiana y en versión hiperbólica sobre la bola de Poincaré. Además, todas se probaron con configuraciones de dos capas y tres capas, usando una dimensión de embedding fija de 256.

La hipótesis central del trabajo es que los vecindarios transaccionales de Bitcoin, cuando se expanden varios saltos, muestran patrones localmente jerárquicos o arborescentes. En un espacio euclidiano, el volumen crece de forma polinómica con el radio. En un espacio hiperbólico, crece de manera exponencial, lo que teóricamente permite representar mejor estructuras con mucha ramificación sin tanta distorsión.

En términos sencillos, los autores sostienen que si una dirección distribuye fondos a varias otras, y estas a su vez vuelven a fragmentarlos, el patrón resultante puede comprimirse mal en un espacio plano. La geometría hiperbólica, en cambio, tendría más capacidad para separar esas ramas dentro de un número fijo de dimensiones.

Los modelos hiperbólicos usados en el estudio siguen una formulación en espacio tangente. Esto significa que los nodos se proyectan temporalmente a un espacio euclidiano mediante mapas logarítmicos, se procesan allí con operaciones estándar, y luego se devuelven al espacio hiperbólico con mapas exponenciales. El objetivo de esa estrategia es retener beneficios de representación sin pagar todo el costo de una implementación hiperbólica pura.

Los autores también construyeron un pipeline de procesamiento de características basado en transacciones originales y variables derivadas. Entre ellas incluyeron montos promedio enviados y recibidos, razones entre in-degree y out-degree, composición de clústeres, edad del nodo y tasas de actividad normalizadas por la edad. Además, todos los valores monetarios fueron convertidos de satoshis a dólares estadounidenses usando tasas históricas BTC/USD para hacer comparables los montos en distintos periodos.

Los resultados: ventaja constante para los modelos hiperbólicos

En subgrafos de profundidad dos, los modelos de dos capas mostraron diferencias moderadas. El mejor resultado euclidiano vino de GraphSAGE con macro-F1 de 0,72, mientras que Hyperbolic GraphSAGE alcanzó 0,76. GAT obtuvo 0,71 en su versión euclidiana y 0,75 en la hiperbólica. GCN quedó más atrás, con 0,55 frente a 0,59 en su variante hiperbólica.

La diferencia se amplió cuando se añadió una tercera capa. En esa configuración y manteniendo profundidad dos en el subgrafo, Hyperbolic GraphSAGE logró un macro-F1 de 0,80, superior al 0,73 del mejor modelo euclidiano comparable. Hyperbolic GAT también aventajó a GAT, con 0,78 frente a 0,73.

Al aumentar el subgrafo a profundidad tres, la tendencia se mantuvo. En arquitecturas de dos capas, GraphSAGE y Hyperbolic GAT empataron con macro-F1 de 0,77, mientras Hyperbolic GraphSAGE quedó en 0,76. Pero con tres capas aparecieron los mejores resultados globales: Hyperbolic GraphSAGE y Hyperbolic GAT llegaron a 0,81, por encima del 0,78 de GraphSAGE y GAT en espacio euclidiano.

El trabajo concluye que la principal ventaja surge de combinar geometría hiperbólica con arquitecturas más profundas. Según los autores, no hace falta esperar vecindarios extremadamente grandes para observar esa mejora. Ya con profundidades moderadas, la representación hiperbólica muestra beneficios consistentes frente a la euclidiana.

También hubo un análisis por clase. En categorías muy frecuentes como Bet e Individual, todos los modelos ya partían de un nivel alto, con F1 superior a 0,91, por lo que había poco margen adicional de mejora. Sin embargo, en clases más difíciles aparecieron diferencias más relevantes.

El caso más notorio fue Ponzi. Allí, Hyperbolic GraphSAGE elevó la precisión de 0,74 a 0,84 y el F1 de 0,65 a 0,72 frente al mejor modelo euclidiano. En Exchange, Gambling y Mining también hubo mejoras. Para Ransomware, Hyperbolic GAT alcanzó precisión de 0,81 y F1 de 0,70, por encima de los valores euclidianos más fuertes reportados en la tabla comparativa.

Curvatura, aprendizaje y estabilidad del entrenamiento

Uno de los aportes prácticos del estudio fue el análisis conjunto entre curvatura y tasa de aprendizaje. En los modelos hiperbólicos, la curvatura c controla qué tan “negativo” es el espacio donde se representan los nodos. Los autores probaron valores entre 0,1 y 1,5, junto con varias tasas de aprendizaje, para observar la estabilidad del entrenamiento.

El hallazgo fue que la curvatura tuvo un efecto dominante. Con valores bajos, por debajo de c = 0,5, los modelos tendieron a converger a soluciones pobres sin importar demasiado la tasa de aprendizaje. En cambio, a partir de c ≥ 1,0, el desempeño se volvió más robusto y la sensibilidad frente a ese hiperparámetro cayó de forma marcada.

Los investigadores identificaron una zona de transición alrededor de c = 0,75 a 1,25. Debajo de ese rango, la optimización seguía siendo frágil. En uno de los ejemplos reportados para Hyperbolic GraphSAGE, con c = 1,25 la variación del F1 de validación a través de las tasas de aprendizaje probadas fue de apenas 0,07 puntos, entre 0,748 y 0,821. En cambio, con c = 0,10 la variación llegó a 0,59 puntos, entre 0,117 y 0,708.

Ese comportamiento sugiere que la curvatura no es un detalle menor, sino una decisión de diseño que afecta directamente la facilidad con la que el modelo aprende representaciones útiles. Para equipos que desarrollan herramientas de analítica blockchain, esto tiene implicaciones concretas en tiempo de entrenamiento, ajuste de hiperparámetros y uso eficiente de recursos.

En cuanto a complejidad, el estudio señala que las operaciones adicionales de los modelos hiperbólicos escalan como O(V · d), mientras que el costo principal del GCN sigue en O(E · d²) dentro de los subgrafos muestreados. En otras palabras, la formulación en espacio tangente conserva la misma complejidad asintótica que la línea base euclidiana, aunque con algo más de memoria y tiempo por las funciones trascendentales involucradas.

El entrenamiento y la evaluación se realizaron en un clúster de cuatro nodos, cada uno equipado con una GPU NVIDIA GeForce RTX 5070 Ti con 16 GB de memoria. La construcción de subgrafos se hizo como un paso offline sobre un clúster CPU con SLURM, usando 10 trabajadores por nodo y 64 GB de RAM, apoyado sobre un grafo almacenado en PostgreSQL.

Alcance, límites y por qué importa para el análisis forense

Los autores fueron claros al delimitar el alcance del trabajo. El estudio se enfocó en grafos estáticos de transacciones y en un esquema fijo de profundidad y fan-out para garantizar comparaciones reproducibles. Eso significa que no modeló dinámicas temporales, ni dependencias más allá del vecindario muestreado, ni tampoco curvaturas adaptativas por nodo o geometrías mixtas.

Aun con esas limitaciones, el aporte es relevante para la seguridad y la inteligencia de blockchain. La clasificación de direcciones y entidades es una tarea central para exchanges, firmas de compliance, equipos de riesgo y analistas forenses. Si una geometría hiperbólica logra separar mejor patrones ambiguos, entonces podría ayudar a detectar antes comportamientos asociados con lavado, fraude o ransomware.

El trabajo no afirma que los modelos euclidianos sean inútiles. De hecho, reconoce que siguen ofreciendo resultados adecuados en muchas aplicaciones de blockchain. Sin embargo, la comparación controlada sugiere que la geometría del embedding no debería tratarse como una decisión neutral, sobre todo cuando el problema exige capturar múltiples saltos transaccionales y ramificación estructural.

Como próxima etapa, los autores proponen explorar modelado temporal, métodos de muestreo alternativos y representaciones adaptativas o mixtas. También sugieren extender este tipo de evaluación a otros sistemas blockchain y a tareas forenses adicionales, como detección temprana de fraude y evaluación de riesgo.

En un momento en que la trazabilidad de fondos y la supervisión algorítmica ganan peso en la industria cripto, el estudio aporta una idea concreta: la forma del espacio matemático donde aprende la IA puede influir tanto como la arquitectura misma. Y en una red tan compleja como Bitcoin, esa diferencia puede ser la que permita distinguir mejor entre actividad normal y patrones sospechosos.

Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.

Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.

2h ago•

DiarioBitcoin

bullish:

bearish: