Parece que demorou muito para chegar aqui, mas hoje a Intel está lançando oficialmente sua linha Xeon de 4ª geração construída em torno da plataforma Sapphire Rapids. Essa linha inclui não apenas os SKUs escaláveis típicos que vimos nas gerações anteriores, mas também uma novíssima série “Max”, sobre a qual a Intel falou pela primeira vez alguns meses atrás.
Com Sapphire Rapids, a Intel diz que o Xeon mais recente é o mais sustentável até o momento e que também possui o maior número de aceleradores integrados de qualquer processador de servidor até o momento. Ambas as partes são críveis, mas é a última que significa negócios, porque a Intel incluiu muitos recursos de aceleração nessas CPUs, algumas das quais exigirão que o software seja atualizado para aproveitar ao máximo os ganhos potenciais.
O grande número de SKUs de processador que a Intel oferece quase atinge os níveis de humor dos memes. É o mesmo na área de trabalho e no servidor. Quem não ama esta folha de SKU de servidor colorida atualizada?
A linha Xeon Scalable e Xeon Max de 4ª geração da Intel
Com tantas opções de Xeon, fica claro que a Intel está tentando capturar o máximo de o mercado de servidores como pode com suas ofertas mais recentes. Embora possa haver algumas áreas nas quais modelos adicionais possam ser inseridos, esta ainda parece uma lista exaustiva.
Embora a Intel ofereça Xeons para muitos propósitos diferentes, nenhum deles é desenvolvido sem um bom motivo. Você pode olhar para as duas opções de refrigeração líquida e se perguntar quem realmente as usa, mas a Intel se esforçou muito para destacar essas CPUs, trabalhando com parceiros do setor para desenvolver métodos melhores para chips de servidor com refrigeração líquida e aumentando o máximo melhor desempenho possível.
Vimos planilhas de SKU como a acima desde o lançamento original do Xeon Scalable, mas esta tem muitos detalhes extras que valem a pena mencionar. Para começar, a configuração principal será listada como XCC ou MCC. O XCC representa CPUs com vários “ladrilhos” internos, enquanto o MCC é um design monolítico e mais tradicional:
Configurações do pacote Intel Xeon de 4ª geração
Um design XCC é o que ajuda a Intel a atingir contagens tão altas de núcleos no topo de linha, com esta geração de Xeon chegando a 60 núcleos com o 8490H. Os designs MCC de geração atual atingem o máximo de 32 núcleos, como o 6448H otimizado para virtualização e o 6448Y com desempenho 2S.
A série Xeon Max representa o terceiro design, que é efetivamente igual ao XCC , mas com memória HBM2e colocada ao redor das matrizes. Colocamos a mão na massa com uma CPU máxima no mês passado:
O Xeon Max de 4ª geração da Intel é ótimo para tirar selfies
Embora os processadores Xeon Max ocupem apenas cinco posições na linha geral, eles são indiscutivelmente os mais interessante do grupo. Essas CPUs são equipadas com memória interna suficiente para permitir que um servidor seja executado sem nenhuma memória adicional. Imagine isso – um servidor inicializando, operando, com absolutamente nenhum dos slots de memória ocupados. Isso é deliciosamente nerd.
As CPUs Xeon Max colocam os chips HBM2e ao lado de cada bloco, oferecendo uma densidade total de 64 GB, até 1,14 GB por núcleo. A Intel tem como alvo esses Max SKUs diretamente no mercado de HPC e, embora muitas cargas de trabalho de HPC exijam muita memória, ainda há muitas que cabem facilmente em 64 GB. Claro, você pode construir em cima deste HBM2e com DDR5-4800, caso a densidade de 64 GB do HBM2e não seja suficiente.
Aqui está uma visão mais detalhada das especificações declaradas para cada configuração de CPU:
Especificações Intel Xeon de 4ª geração com base no pacote
O slide acima ajuda a destacar outro ângulo que vale a pena observar. Nas CPUs Max, muitos dos recursos dos outros SKUs desapareceram, como a tecnologia QuickAssist da Intel, o Dynamic Load Balancer e o In-Memory Analytics Accelerator. O Data Streaming Accelerator permanece, destacando um público-alvo focado em laser para CPUs Max.
Essas tecnologias não incorporadas ao Max nos levam a outra diferença nesta linha Xeon de última geração. Você deve ter notado uma nova entrada acima, “Intel On Demand Capable”; isso se refere a CPUs que podem ser compradas sem todos os recursos premium, mas habilitadas posteriormente por meio de parceiros de sistema e da própria Intel.
Em briefings no mês passado, o tópico On Demand pareceu confundir muitos, e até mesmo hoje, ficamos sem entender totalmente o mecânico. On Demand soa como um DLC para CPUs de servidor, mas deve permitir que alguns comprem CPUs a preços mais justos devido ao fato de as tecnologias não serem usadas, e os clientes ainda terão a opção de reverter o curso posteriormente.
Outro ângulo pode ser talvez algumas das tecnologias da Intel não sejam aproveitadas adequadamente em um ambiente de trabalho, mas se o suporte for criado, o On Demand poderá desbloquear o recurso de uma CPU. Pelo que entendemos, as CPUs Xeon com recursos bloqueados não terão esses recursos contribuindo para a carga geral de energia. Eles ficam efetivamente inativos até serem desbloqueados e ativados.
Se você consultar a folha de SKU compartilhada anteriormente, perceberá que esses recursos afetados pelo On Demand podem variar muito em número de dispositivos entre o quadro. Os SKUs otimizados para nuvem, por exemplo, têm poucos dispositivos DSA, QAT, DLB e IAA, enquanto o 8490H de ponta tem muitos. Dependendo da carga de trabalho que você procura, você pode se sentir pressionado em qualquer modelo que escolher.
Aqui está uma visão geral dos recursos do Sapphire Rapids (ahem, Xeon de 4ª geração), que ajuda a cobrir coisas que nós ainda não:
Recursos da plataforma Intel Xeon de 4ª geração
Esta plataforma Xeon de última geração suporta PCIe 5.0 e 4.0, bem como DDR5 com frequências de até 4800MHz. Como antes, esta plataforma possui um controlador de memória de 8 canais e suporta até 16 DIMMs por soquete.
Vale a pena notar que a Intel continua a oferecer suporte a seus sistemas de 4 e 8 soquetes, o que é interessante considerando seu principal concorrente, o AMD EPYC, atinge o pico com configurações de 2 soquetes. A Intel diz que ainda vê demanda para esses servidores com várias CPUs, especialmente para trabalho de inteligência de banco de dados em memória, armazenamento e visualização de dados, consolidação de DC e assim por diante.
Mecanismos aceleradores Xeon de 4ª geração da Intel
No início , mencionamos que os processadores Xeon de 4ª geração incluem aceleradores que podem (ou mais precisamente, provavelmente exigirão) atualizações para aproveitar ao máximo. Embora muitos processadores Xeon Scalable e Max de 4ª geração tenham níveis diferentes de suporte DSA/QAT/DLB/IAA, todos eles incluem o novíssimo acelerador de matriz AMX, o mais recente participante da ISA (arquitetura de conjunto de instruções) da Intel.
A Intel adora IA e, com relação às CPUs Xeon, já se fala nisso há um bom tempo. Mas em um momento em que as GPUs são tão rápidas em muitas cargas de trabalho de IA, o que faz a Intel querer implementar uma solução como o AMX aqui? Para iniciantes, onde a própria CPU também participa fortemente de uma carga de trabalho de IA, ter o AMX ao lado dos núcleos pode oferecer um ótimo desempenho – talvez o suficiente para nem precisar de GPUs discretas instaladas, dependendo da carga de trabalho geral.
Intel afirma que seu AMX é cerca de oito vezes mais rápido na computação de álgebra linear em comparação com seu mecanismo vetorial, e os clientes-alvo incluem sistemas de recomendação operacional, reconhecimento de imagem, processamento de linguagem natural e assim por diante.
Extensões Xeon AMX e vRAN de 4ª geração da Intel
O vRAN também foi infundido com algumas atualizações do AVX, com 42 novas instruções adicionadas que aproveitam os algoritmos escritos em FP16, com usos aqui direcionados ao processamento de sinal e mídia, formatação de front haul e mapeamento de camada.
Aceleração realmente parece ser o nome do jogo com Sapphire Rapids. Vários aceleradores foram implementados para reduzir a carga na própria CPU, fazendo mais no mesmo período de tempo.
Mecanismos aceleradores para cada geração Xeon Scalable
Felizmente, embora alguns recursos do acelerador estejam ausentes em alguns Xeon SKUs, AMX está se tornando um padrão de fato. Isso é importante, pois sabemos que muitos fornecedores de software precisarão atualizar seus bits para aproveitá-lo ao máximo.
O suporte para todos pode não chegar tão rápido quanto gostaríamos, mas como o AMX é um padrão, isso significa que os desenvolvedores podem se sentir seguros ao dedicar tempo ao desenvolvimento em torno dele. É mais difícil vender quando um novo recurso legal tem suporte limitado em toda a linha. Notavelmente, tanto o TensorFlow quanto o PyTorch têm suporte AMX integrado, então parece que começamos bem.
Além disso, todos esses mecanismos aceleradores compartilham um espaço de memória compartilhado e coerente entre os núcleos e os aceleradores , mais uma vez destacando os esforços da Intel para oferecer uma arquitetura tão eficiente quanto possível, com o mínimo de gargalos.
Falando em desempenho, o Intel Senior Fellow Ronak Singhal realmente falou conosco com sua apresentação, pois ele observou o quão importante é para comparar processadores com testes relevantes. Os benchmarks pré-criados e pré-ajustados têm seu propósito, mas, em última análise, o que importa para os clientes é como a nova plataforma afeta sua carga de trabalho específica.
Este slide diz tudo:
A Intel destaca a importância do mundo real testes de desempenho
O SPEC é um consórcio que envolve a maioria dos maiores players de semicondutores do setor, portanto, os benchmarks lançados tendem a ser aceitos por todos – não haverá viés inerente nos testes. Porém, esses testes são rígidos e seus resultados não refletem a maioria das cargas de trabalho. A própria Intel trabalhou com os clientes para avaliar como a maioria dos benchmarks estava desconectada dos cenários práticos e, assim, enfatizar a necessidade de testar com benchmarks relevantes.
Para esse fim, em mais testes do mundo real, o Sapphire Rapids executa bem em relação ao Xeon 8380 topo de linha da geração anterior:
Expectativas de desempenho do Intel Xeon de 4ª geração
As melhorias de desempenho observadas em todos os setores são ótimas de se ver, mas é claro que alguns desses resultados se destacam mais do que os outros. O RocksDB em particular é interessante, pois destaca os benefícios com o acelerador analítico in-memory atualizado da Intel. Mas mesmo os ganhos modestos permanecem impressionantes, como uma melhoria de ~50% no desempenho do WordPress ao usar o TLS.
Não podemos encontrar menção explícita a isso, mas temos que imaginar todas as cargas de trabalho de IA no lado direito desse slide, vimos aumentos gigantescos graças à introdução do AMX. Enquanto as quatro barras finais sobem para o topo, o resultado BF16 de inferência em tempo real, em torno de 10x, realmente se destaca.
Ferramentas otimizadas ajudam a aproveitar ao máximo os processadores Xeon Scalable e Max de 4ª geração da Intel
Porque As CPUs da Intel têm tanto hardware exclusivo que a empresa faz de tudo para garantir que todos tenham as ferramentas e informações certas para o trabalho. A oneAPI da Intel é continuamente atualizada, assim como muitas outras ferramentas, como oneDNN, QPL e DML. A documentação também é atualizada com frequência.
Da mesma forma, a Intel também sabe que, para que os clientes aproveitem ao máximo seus recursos de IA, exemplos devem ser fornecidos. É por isso que a empresa oferece dezenas de modelos de IA pré-treinados, que as pessoas podem integrar diretamente em seus projetos ou aprender com eles.
Durante uma apresentação, a Intel observou que apenas 53% dos projetos de IA são rejeitados. fora e acabam vendo a conclusão, que é uma taxa de falha bastante grande. Com soluções como o oneAPI, que pode extrair poder de processamento da CPU ou de aceleradores integrados, o objetivo é garantir que os usuários possam realizar seus cálculos da maneira mais eficaz possível. Com o tempo, esperamos ver esse número aumentar em 53%.
Pensamentos Finais
A Intel divulgou muitas informações sobre sua linha Xeon Scalable e Max de 4ª geração e, finalmente, nós Eu apenas arranhei a superfície aqui, apesar de tantas informações boas serem discutidas. Afastando-se dos briefings pessoais no mês passado, ficou claro que este lançamento é caro ao coração da Intel, e é por um bom motivo. Há muito aqui que é novo e intrigante.
Como sempre, a Intel oferece muitas opções – não importa o seu caso de uso, você certamente encontrará uma CPU que atenda às suas necessidades. Na parte inferior, há um 3408U de 8 núcleos para uso geral em uma plataforma de 1 soquete, e na parte superior está o gigantesco 8490H de 60 núcleos que pode ser usado em sistemas de 8 soquetes.
Vantagens de desempenho para Sapphire Rapids da Intel em relação à geração anterior
Reconhecidamente, é a série Xeon Max que mais nos intriga. Ter 64 GB de memória super-rápida embutida na CPU pode ser uma vantagem para certas cargas de trabalho e, especialmente, para cenários em que muita memória simplesmente não é necessária. O fato de que um servidor Xeon Max pode inicializar e operar normalmente sem um único DIMM instalado não é apenas impressionante, mas útil.
Como o Sapphire Rapids se compara à concorrência exigirá benchmarking exaustivo de outros para descobrir, e temos certeza de que muito desempenho está por vir. Dito isso, não temos certeza se o desempenho do lançamento vai pintar a imagem mais precisa, porque algumas características de design do Sapphire Rapids exigirão que atualizações de software sejam feitas. Já discutimos que o PyTorch e o TensorFlow oferecem suporte imediato ao AMX, mas há muito mais software direcionado à IA por aí.
Finalmente, estamos felizes em ver o lançamento do Sapphire Rapids , já que já faz muito tempo, e também estamos satisfeitos por haver tanto interesse para falar. Assim como acontece com todos os servidores, o lançamento de novos produtos no ecossistema será lento, por isso será interessante ver como as coisas estão no meio do caminho e no final do ano.
Apoie nossos esforços! Com a receita de anúncios mais baixa de todos os tempos para sites escritos, estamos contando mais do que nunca com o suporte do leitor para nos ajudar a continuar colocando tanto esforço nesse tipo de conteúdo. Você pode nos apoiar tornando-se um patrono ou usando nossos links de afiliados de compras da Amazon listados em nossos artigos. Obrigado pelo seu apoio!