ACTUALIDAD

AWS aplica teoría matemática para mejorar la resiliencia de su nube

Redacción | Jueves 04 de junio de 2026

Amazon Web Services (AWS) ha logrado transformar una teoría matemática olvidada en una innovadora red de centros de datos más resiliente. Un equipo de ingenieros y académicos, liderado por Seshadhri Comandur y Ratul Mahajan, aplicó la teoría de grafos aleatorios para mejorar la eficiencia y fiabilidad del enrutamiento de datos. Este avance, que promete ahorrar miles de millones en hardware y reducir las emisiones de CO2, se basa en un nuevo protocolo llamado Spraypoint y un dispositivo denominado ShuffleBox. La implementación del nuevo diseño comenzará en 2025 en España y Alemania, con un despliegue global previsto para 2026. Para más detalles sobre esta innovadora solución tecnológica, visita el artículo completo en el enlace proporcionado.



Un mensaje en Slack, una teoría matemática olvidada y un grupo de ingenieros y científicos de Amazon Web Services (AWS) han sido el motor detrás de una solución innovadora que ha abordado un desafío persistente en la industria de los centros de datos. En 2023, Seshadhri Comandur, Amazon Scholar y profesor en la Universidad de California en Santa Cruz, respondió a un hilo que lo llevaría a participar en una misión crucial: resolver uno de los enigmas más complejos del sector.

El mensaje inicial provenía de Ratul Mahajan, también Amazon Scholar, quien se especializa en redes de centros de datos y es profesor en la Universidad de Washington. En su búsqueda por alguien con experiencia en teoría de grafos y enrutamiento, encontró a Comandur. A pesar de su falta de experiencia directa en centros de datos, Comandur se mostró dispuesto a colaborar: «Sí, algo sé de eso», contestó.

La unión hace la fuerza

Este encuentro marcó el inicio de una colaboración fructífera entre Comandur, Mahajan y Giacomo Bernardi, otro científico destacado de AWS. Juntos, se propusieron aplicar la teoría de grafos aleatorios a gran escala dentro del ámbito de las redes de centros de datos, una idea que había permanecido relegada a la academia durante décadas. El resultado fue un artículo científico titulado ‘Expanding into Reality: Random Graphs for Datacenter Networks’, que promete aumentar la fiabilidad y eficiencia para los clientes de AWS, así como reducir costos significativos en hardware y emisiones de CO2.

Pero ¿qué implica realmente la teoría de grafos aleatorios? Y más importante aún, ¿cómo logró este equipo resolver un problema que había desconcertado a toda una industria?

Redefiniendo conexiones

La historia comienza con Bernardi y su interés por los routers, dispositivos esenciales para dirigir el tráfico dentro de un centro de datos. Tradicionalmente organizados en jerarquías tipo árbol, estos routers pueden generar cuellos de botella donde los datos se congestionan. Convencido de que existía un método más eficiente, Bernardi propuso conectar los routers en una estructura plana pero ordenada para distribuir mejor la carga.

A pesar del entusiasmo inicial al intentar implementar esta idea inspirada en mosaicos geométricos conocidos como Penrose, Bernardi y Mahajan se encontraron estancados ante la magnitud del reto que representaba AWS. Sin rendirse, decidieron explorar otra alternativa: ¿y si conectaban los routers aleatoriamente?

Un estudio publicado en 2012 sobre este concepto sentó las bases teóricas necesarias, sugiriendo que las conexiones aleatorias podrían hacer más eficiente la transferencia de datos. Sin embargo, el desafío seguía siendo cómo llevar esta teoría a la práctica dentro del contexto físico real.

Afrontando los desafíos

Uno de los principales obstáculos era evitar crear una maraña incontrolable con millones de cables ópticos interconectando servidores y routers. La idea manualmente construir una red aleatoria resultaba impracticable; cada intento produciría configuraciones únicas e irrepetibles.

Para solucionar esto, el equipo diseñó ShuffleBox, un componente hardware capaz de contener aleatoriedad controlada y repetible dentro del sistema. Este diseño debía ser simple para facilitar su producción masiva y su instalación consistente por parte del personal técnico.

A medida que avanzaban con el proyecto, Comandur proporcionó una ecuación clave que permitió simular cómo organizar el cableado dentro del ShuffleBox. Este descubrimiento fue fundamental para estandarizar la conectividad aleatoria a nivel global.

Navegando por nuevas rutas

El siguiente reto consistió en redefinir cómo se enrutan los datos sin depender estrictamente de estructuras jerárquicas fijas. En lugar del enfoque tradicional donde los datos deben seguir capas específicas para llegar a su destino —similar a navegar por un organigrama corporativo— el nuevo sistema permite múltiples rutas simultáneas para mejorar la eficiencia general.

Bajo este paradigma emergió Spraypoint, un protocolo diseñado específicamente para redes aleatorias. A través del proceso llamado "dispersión", el router origen envía información a todos sus vecinos antes que estos dirijan los datos hacia su destino final. Esta metodología desafía las convenciones existentes al permitir que los datos viajen por múltiples caminos al mismo tiempo.

Ciencia detrás del diseño

El último desafío era validar matemáticamente si esta red funcionaría antes siquiera de construirla físicamente. Utilizando Amazon Elastic Compute Cloud (EC2), el equipo llevó a cabo simulaciones masivas que requirieron aproximadamente 530 años equivalentes de procesamiento computacional para evaluar cientos de miles escenarios potenciales.

Aunque las simulaciones mostraron resultados prometedores, necesitaban establecer fórmulas matemáticas sólidas para respaldar sus hallazgos experimentales. Con el apoyo decisivo de Comandur, lograron proporcionar no solo confirmación teórica sino también modelos precisos que permitieron avanzar hacia la construcción real del sistema.

Eficiencia garantizada

El objetivo final es crear una red tan eficiente que pase desapercibida para el usuario: «La encendemos y funciona», afirma Matt Rehder, vicepresidente de ingeniería en redes. Aunque revolucionario, el enfoque debía integrarse sin problemas con tecnologías existentes para minimizar interrupciones durante su implementación.

Los nuevos diseños han demostrado ser significativamente más eficientes al requerir menos dispositivos entre servidores comunicantes; esto no solo reduce costos operativos sino también puntos potenciales fallos dentro del sistema. En pruebas realizadas bajo condiciones reales, el nuevo diseño ha logrado mover datos aproximadamente un tercio más rápido comparado con las arquitecturas anteriores.

AWS planea desplegar este innovador diseño inicialmente en España y Alemania durante 2025 antes extenderlo globalmente en 2026. Para Comandur y su equipo es claro: esta historia demuestra cómo unir diferentes piezas puede resolver enigmas complejos que permanecen sin respuesta durante años.

La noticia en cifras

Cifra Descripción
530 años Tiempo total de procesamiento computacional utilizado para las simulaciones.
40% Reducción esperada en el consumo eléctrico con el nuevo diseño.
Un tercio más rápido Mejora en la velocidad del movimiento de datos respecto a las estructuras jerárquicas anteriores.