Med den hurtige stigning i AI-applikationer, ledet af modeller som ChatGPT, er efterspørgslen efter computerkraft steget i vejret. For at imødekomme de stigende beregningsmæssige krav fra AI-æraen, afslørede H3C Group, under paraplyen af Tsinghua Unigroup, for nylig 11 nye produkter i H3C UniServer G6- og HPE Gen11-serien på NAVIGATE Leader Summit i 2023. Disse nye serverprodukter skaber en omfattende matrix for AI på tværs af forskellige scenarier, der giver en kraftfuld underliggende platform til håndtering af massive data- og modelalgoritmer og sikrer et rigeligt udbud af AI-computerressourcer.
Diverse produktmatrix til at imødekomme forskellige AI-computerbehov
Som førende inden for intelligent computing har H3C Group været dybt engageret i AI-området i mange år. I 2022 opnåede H3C den højeste vækstrate på det kinesiske accelererede computermarked og akkumulerede i alt 132 verdensførsteplaceringer i det internationalt anerkendte AI-benchmark MLPerf, hvilket viser sin stærke tekniske ekspertise og evner.
Ved at udnytte en avanceret computerarkitektur og intelligente computerkraftstyringskapaciteter bygget på grundlaget for intelligent computing, har H3C udviklet det intelligente computerflagskib H3C UniServer R5500 G6, specielt designet til modeltræning i stor skala. De har også introduceret H3C UniServer R5300 G6, en hybrid computermotor, der er velegnet til storskala inferens/træningsscenarier. Disse produkter opfylder yderligere de forskellige computerkrav i forskellige AI-scenarier, hvilket giver omfattende AI-computerdækning.
Intelligent computing-flagskib designet til modeltræning i stor skala
H3C UniServer R5500 G6 kombinerer styrke, lavt strømforbrug og intelligens. Sammenlignet med den forrige generation tilbyder den tre gange så stor beregningskraft, hvilket reducerer træningstiden med 70 % for GPT-4-modeller i stor skala. Det er anvendeligt til forskellige AI-forretningsscenarier, såsom træning i stor skala, talegenkendelse, billedklassificering og maskinoversættelse.
Styrke: R5500 G6 understøtter op til 96 CPU-kerner, hvilket giver en 150 % stigning i kerneydelsen. Den er udstyret med det nye NVIDIA HGX H800 8-GPU-modul, der giver 32 PFLOPS regnekraft, hvilket resulterer i en 9x forbedring af AI-træningshastigheden i stor skala og en 30x forbedring af AI-inferens i storskalamodeller. Derudover kan brugere med understøttelse af PCIe 5.0- og 400G-netværk implementere højtydende AI-computerklynger, hvilket accelererer adoptionen og anvendelsen af AI i virksomheder.
Intelligens: R5500 G6 understøtter to topologikonfigurationer, intelligent tilpasning til forskellige AI-applikationsscenarier og accelererer deep learning og videnskabelige computerapplikationer, hvilket i høj grad forbedrer GPU-ressourceudnyttelsen. Takket være multi-instans GPU-funktionen i H800-modulet kan en enkelt H800 opdeles i 7 GPU-instanser med mulighed for op til 56 GPU-instanser, der hver har uafhængige computer- og hukommelsesressourcer. Dette øger AI-ressourcernes fleksibilitet markant.
Low Carbon Footprint: R5500 G6 understøtter fuldt ud væskekøling, inklusive væskekøling til både CPU og GPU. Med en PUE (Power Usage Effectiveness) på under 1,1 muliggør det "cool computing" i varmen fra den beregningsmæssige bølge.
Det er værd at nævne, at R5500 G6 blev anerkendt som en af "Top 10 fremragende højtydende servere i 2023" i "2023 Power Ranking for Computational Performance" efter udgivelsen.
Hybrid Computing Engine til fleksibel afstemning af trænings- og slutningskrav
H3C UniServer R5300 G6 tilbyder som næste generations AI-server betydelige forbedringer i CPU- og GPU-specifikationer sammenlignet med sin forgænger. Den kan prale af enestående ydeevne, intelligent topologi og integrerede computer- og lagringskapaciteter, hvilket gør den velegnet til deep learning modeltræning, deep learning-inferens og andre AI-applikationsscenarier, der fleksibelt matcher trænings- og inferenscomputerbehov.
Enestående ydeevne: R5300 G6 er kompatibel med den seneste generation af NVIDIA enterprise-grade GPU'er, hvilket giver en 4,85x ydelsesforbedring sammenlignet med den forrige generation. Det understøtter forskellige typer AI-accelerationskort, såsom GPU'er, DPU'er og NPU'er, for at opfylde de heterogene krav til computerkraft for AI i forskellige scenarier, hvilket styrker intelligensens æra.
Intelligent topologi: R5300 G6 tilbyder fem GPU-topologiindstillinger, inklusive HPC, parallel AI, seriel AI, 4-korts direkte adgang og 8-korts direkte adgang. Denne hidtil usete fleksibilitet forbedrer i høj grad tilpasningsevnen til forskellige brugerapplikationsscenarier, tildeler intelligent ressourcer og driver effektiv computerkraftdrift.
Integreret databehandling og lagring: R5300 G6 rummer fleksibelt AI-accelerationskort og intelligente NIC'er, der kombinerer trænings- og slutningsevner. Den understøtter op til 10 dobbelt-bredde GPU'er og 24 LFF (Large Form Factor) harddiskslots, hvilket muliggør samtidig træning og inferens på en enkelt server og giver en omkostningseffektiv computermotor til udviklings- og testmiljøer. Med en lagerkapacitet på op til 400TB opfylder den fuldt ud lagerpladskravene til AI-data.
Med AI-bommen bølgende fremad, bliver computerkraften konstant omformet og udfordret. Frigivelsen af næste generations AI-servere markerer endnu en milepæl i H3C Groups forpligtelse til "inherent intelligence"-teknologi og dets kontinuerlige drivkraft for udviklingen af intelligent computing.
Med et blik på fremtiden, styret af "Cloud-Native Intelligence"-strategien, følger H3C Group konceptet om "omhyggelig pragmatisme, der forsyner æraen med intelligens." De vil fortsætte med at dyrke den frugtbare jord af intelligent databehandling, udforske AI-applikationsscenarier på dybt niveau og fremskynde ankomsten af en intelligent verden med fremtidsklar, tilpasningsdygtig computerkraft.
Indlægstid: Jul-04-2023