Aprendizaje automático en arquitecturas de centro de datos

Tendencia

La nueva generación de aplicaciones de datos

Al desarrollar el aprendizaje automático para un Centro de datos, todos los factores que afectan el rendimiento, la escalabilidad y resistencia deben tenerse en cuenta desde el principio.

Diseñar aplicaciones de ML de próxima generación

Tener la arquitectura adecuada puede ser crucial para agregar con éxito el aprendizaje automático a los Centros de datos. La infraestructura del centro de datos puede ser la clave para habilitar la funcionalidad de la arquitectura de TI, ya que la mayor parte de su contenido se transmite a través de la arquitectura de TI o se obtiene de ella.

Al desarrollar el aprendizaje automático para el Centro de datos, todos los factores que afectan el rendimiento, la escalabilidad y resiliencia de la instalación deben considerarse al principio, durante el periodo de planificación. Para lograr esto, los diseñadores de sistemas generalmente se centran en desarrollar una arquitectura flexible que pueda admitir nuevas aplicaciones rápidamente.

Si no se abordan estos aspectos durante la planificación, se pueden producir arquitecturas de datos ineficientes o inexactas que, en última instancia, pueden causar fallas totales del sistema y de la energía, lo que puede hacer que los operadores de Centros de datos pierdan volúmenes masivos de datos críticos.

Hay varios factores que pueden causar este tipo de falla, incluido el cálculo incorrecto de los requisitos de energía, la elección incorrecta del equipo de energía y el diseño incorrecto del mecanismo de transferencia automática. Para ayudar a optimizar las capacidades del aprendizaje automático en la arquitectura actual del Centro de datos, los diseñadores de sistemas deben considerar los problemas comunes que causan fallas en el sistema y los componentes que pueden abordar las causas de estos problemas.

Información del CTO sobre Cloud Computing

Video en inglés

La CTO y VP de TE, Erin Byrne, habla sobre sus perspectivas sobre Cloud Computing y las megatendencias relevantes que influyen en la arquitectura de diseño.

Información del CTO sobre Cloud Computing

Video en inglés

La CTO y VP de TE, Erin Byrne, habla sobre sus perspectivas sobre Cloud Computing y las megatendencias relevantes que influyen en la arquitectura de diseño.

Un problema en la industria actual de Centros de datos es que los términos inteligencia artificial (IA) y aprendizaje automático se usan comúnmente indistintamente, lo que podría generar confusión e imprecisiones. Lo que es clave recordar es que el aprendizaje automático es típicamente un subconjunto de la IA. Con la IA, la atención se centra en el desarrollo de máquinas que puedan “pensar”, mientras que el aprendizaje automático generalmente se trata de definir algoritmos para permitir que las máquinas “aprendan” a través de funciones repetitivas. Si bien el aprendizaje automático no es un concepto nuevo, uno de los cambios en los últimos años es el aumento de la potencia de procesamiento de la computadora con una disminución en el costo por bit. Esto puede permitir a los diseñadores encontrar oportunidades para hacer que el aprendizaje automático sea una parte más importante de nuestra vida cotidiana, desde motores de recomendación como Google y Netflix hasta aplicaciones integradas de redes sociales y reconocimiento facial y de huellas dactilares en teléfonos inteligentes.

Desde la aparición de las primeras aplicaciones de aprendizaje automático en las industrias aeroespacial y aérea, lo cual ha permitido a los diseñadores de aeronaves innovar en los diseños de alas, muchos diseñadores han evolucionado su pensamiento sobre los usos del aprendizaje automático hacia una comprensión integral de los potenciales de alineación y las compensaciones cuando se busca optimizar el diseño.

Este cambio está teniendo un impacto en el Centro de datos, donde ahora a menudo vemos el uso de la IA y el aprendizaje automático en transición de aplicaciones limitadas en computadoras estándar y cajas independientes a una gama de aplicaciones que son específicas del silicio. Esto puede ayudar a abrir la puerta para que la industria se centre en optimizar la red del Centro de datos, utilizando IA y aprendizaje automático en cada parte de estas redes para expandir la funcionalidad con el tiempo.

En los próximos cinco años, se espera que el uso del aprendizaje automático se aleje de las infraestructuras dedicadas a infraestructuras más flexibles que puedan proporcionar la capacidad de escalar, cambiar y diversificarse instantáneamente. Si bien una de las funciones principales de la recopilación de datos de aprendizaje automático se centra en las interacciones de persona a máquina, una oportunidad se está moviendo hacia las interacciones de máquina a máquina, que pueden no requerir la necesidad de datos o entradas humanas. Cuando las máquinas comiencen a crear rutas de comunicación, los sistemas podrían ayudar a procesar y transmitir datos de manera que nos brinden nuevos conocimientos sobre grandes volúmenes de datos.

El proceso de agregar aprendizaje automático a sistemas de datos, como servidores y racks de datos, a menudo puede variar, dependiendo de lo que el diseñador del sistema intente lograr, así como de la carga de trabajo del operador del Centro de datos para agregar aprendizaje automático al núcleo.

La adición de aprendizaje automático a Centros de datos nuevos o existentes se realiza comúnmente para resolver un problema conocido existente, como problemas en grandes cápsulas de aprendizaje o problemas de red debido a algoritmos que se desarrollaron a partir de datos recibidos. La mayoría de las soluciones actuales tienden a personalizarse para que coincidan con el tamaño del problema.

Algunos desafíos en el diseño de soluciones para clientes incluyen optimizar la distribución de energía, reducir los niveles térmicos y mejorar el rendimiento de alta velocidad o baja latencia en las interconexiones. Debido a que normalmente todo en el Centro de datos debe estar interconectado, los componentes del sistema deben ofrecer la flexibilidad de instalarse y trabajar en espacios pequeños y abordar los requisitos de velocidad esperados sin aumentar la salida térmica.

A menudo, los diseñadores deben tener en cuenta la proximidad del hardware al planificar la arquitectura. Lograr este equilibrio correcto puede requerir compensaciones en diseño, costo y en estructuras de energía y refrigeración. Normalmente, existe un techo para la cantidad de energía que se puede controlar y enfriar adecuadamente en los Centros de datos, lo que puede proporcionar a los diseñadores orientación sobre cómo hacer concesiones y les permite desarrollar aceleradores y diseños de sistemas más eficientes y adoptar térmicas avanzadas.

En TE, nos asociamos con nuestros clientes para ayudar a diseñar y fabricar los componentes que pueden abordar los requisitos de aprendizaje automático en Centros de datos que van desde la hiperescala y la colocación hasta los requisitos que pueden permitir la computación perimetral. Podemos ofrecer soluciones diseñadas para alta velocidad y eficiencia energética en arquitecturas de Centros de datos, incluida la conexión directa, conjuntos de cables de cobre externos, con interfaces, así como nuestra tecnología de enchufe de matriz extra grande (XLA), conectores laterales de tarjeta, conjuntos de cables de conector de placa base Strada Whisper y cables internos de cobre de alta velocidad. Estos productos a menudo se eligen para nuestros clientes basándose, más que nada, en el diseño del sistema en el que se van a utilizar. Nuestros diseños de energía incluyen conjuntos de cables de alimentación, barras colectoras, sistemas de distribución de energía y soluciones de administración térmica.

Al asociarse con TE, nuestro cliente puede esperar soluciones confiables, duraderas y de alto rendimiento mientras recibe orientación experta de ingenieros que pueden abordar los problemas de arquitectura que pueden necesitar resolver. A través de estas colaboraciones, nuestros clientes pueden desarrollar soluciones eficientes de próxima generación que pueden escalar rápidamente para integrar el aprendizaje automático en el núcleo de su sistema de datos. Nuestros ingenieros pueden ayudar a abordar los problemas de rendimiento, por lo que nuestro cliente puede centrarse en otras prioridades, como trabajar en el desarrollo de proyectos en el nivel de aplicación y resolver problemas abstractos relacionados con el software.

Autores de TE

Mike Tryson, vicepresidente y director de tecnología, datos y dispositivos
Erin Byrne, vicepresidenta y directora de tecnología, sensores
Dave Helster, miembro del área de ingeniería de TE, datos y dispositivos
Jonathan Lee, gerente sénior de ingeniería, cable a granel a nivel mundial, datos y dispositivos
Christopher Blackburn, Tecnólogo, arquitectura de sistemas, datos y dispositivos

Aprendizaje automático en arquitecturas de centro de datos

Tendencia

La nueva generación de aplicaciones de datos

Información del CTO sobre Cloud Computing

Video en inglés

Información del CTO sobre Cloud Computing

Video en inglés

Autores de TE

CHAT EN VIVO