Kühllösungen für überlastete Rechenzentren

Erfahren Sie, wie Coherent die heißesten Herausforderungen bei KI-nutzenden Rechenzentren mithilfe von Kühlplattenkühlung löst.

 

10. Januar 2023 von Coherent

KI ist heiß. Aber sie ist nicht nur das heißeste Thema am Küchentisch, sie heizt auch Rechenzentren auf. Glücklicherweise bietet Coherent eine Reihe von innovativen Lösungen für das Wärmemanagement, damit Rechenzentren mit starker Arbeitsauslastung weiterhin effizient arbeiten können.

Andere Anwendungen wie Cloud Computing, Gaming-Grafikanforderungen, Kryptowährungsgewinnung oder anspruchsvolle Computing-Szenarien erhöhen ebenfalls schnell (und radikal) die Arbeitslastanforderungen und die Temperatur in Rechenzentren. Gleichermaßen werden Halbleiter mit der höheren Dichte an Transistoren immer kleiner, und in einem solch kompakten Bereich wird somit schnell Wärme erzeugt. 

Generell sind Server einer noch nie dagewesenen Rechenlast ausgesetzt, während dieser beispiellose Energiebedarf schnell das Risiko einer Überhitzung in Rechenzentren erhöht. Tatsächlich hat sich die Thermal Design Power (TDP) pro Server in den letzten 17 Jahren vervierfacht und wird in diesem Jahr voraussichtlich den Wert von 750 W überschreiten. Dieser kostspielige, kumulative Arbeitslastbedarf verringert nicht nur die Energieeffizienz globaler Rechenzentren, sondern wirkt sich auch negativ auf Leistung und Zuverlässigkeit aus. Bedenken hinsichtlich von durch übermäßige Hitze verursachten thermischen Schäden, können zu einer Verkürzung des Lebenszyklus oder zu Fehlfunktionen kritischer Serverkomponenten führen. Ganz zu schweigen von den Bedenken hinsichtlich der Sicherheit von Rechenzentren und sicherlich der Kosten, die mit der Aufrechterhaltung eines reibungslosen Betriebs eines Rechenzentrums verbunden sind.

 

Moderne Rechenzentren sind anspruchsvoller

GPU-Computing ist das Herzstück des Trainings großer KI-Modelle, was zum Teil auf potenziell Tausende zusätzlicher Prozessorkerne im Vergleich zum CPU-Computing zurückzuführen ist. Da die heutigen Rechenzentren mehr Leistung als herkömmliche CPU-Verarbeitung in der Vergangenheit benötigen, wechseln viele lokale Rechenzentren zur Unterstützung dieser Beschleunigung zu Rack-Lösungen mit hoher Dichte, die mehr Leistung benötigen und Wärme in einem Ausmaß abgeben, für das sie oft nicht gerüstet sind.

Um eine effiziente „KI-Abkühlung“ zu erreichen oder andere energieeffiziente Probleme in Rechenzentren zu lösen, ist ein strategisches Wärmemanagement erforderlich. Der Prozess zur Ableitung überschüssiger Wärme bzw. Wärmeableitung grundsätzlich war noch nie so wichtig für die Leistung und die Lebensdauer der Komponenten wie heutzutage.

 

Verhinderung thermischer Schäden in überhitzten Rechenzentren

Um thermische Schäden zu mindern und kostspielige Ausfallzeiten zu vermeiden, sind Planung und Management der Wärmeverteilung wichtiger denn je. Es bestehen typischerweise zwei Möglichkeiten, den Temperaturregler herunterzudrehen oder überschüssige Wärme in stark beanspruchten Rechenzentrumsumgebungen abzuleiten. 

1. Immersionskühlung (bzw. Luftkühlung): teuer, komplex und ökologisch anspruchsvoll 

Bei dieser Makrokühlungsmethode (nicht direkt am Chip) müssen Platten und Server-Rack-Komponenten durch Luft mit hoher Konvektion (obere Ebene) oder vollständiges Eintauchen in Flüssigkeit (untere Ebene) gekühlt werden. Dies führt zu einer kostspieligen Lösung.

2. Kühlplattenkühlung (direkt am Chip): maximiert effizient die Wärmeübertragung, korrosionsbeständig.

Coherent empfiehlt eine Mikrokühlungslösung aus Material mit hoher Wärmeleitfähigkeit mit Nutzung einer physikalischen Kühlplattentechnologie, um die Wärme direkt von Hochenergie-Chips wie GPUs (als Beispiel) abzuleiten.

 

Die Vorteile von Kühlplattenmaterialien 

In funktionaler Hinsicht tut die Kühlplattenkühlung — auch als Kühlung direkt am Chip oder einfach „Mikrokühlung“ bekannt — genau das, wonach es sich anhört: Sie nutzt eine Kühlplatte, um energiereichen Chips wie GPUs direkt Wärme zu entziehen.

Ähnlich wie ein Haushaltskühlschrank, der einen Kondensator zur Wärmeabfuhr verwendet, leitet die Kühlplattenkühlung die Wärmeaktivität von GPUs ab, indem sie Wärme von der Komponente auf das Kühlmittel überträgt. Die Kühlplatte selbst maximiert die Effizienz der Wärmeübertragung. 

 

blog-thermal-dissipation.jpg

Ein Techniker verwendet ein Infrarot-Bildgebungsverfahren, um den Aufbau von Wärme in einem Server-Stapel darzustellen.

 

Doch was macht die Kühlplattenkühlung erfolgreicher? Nun, letztendlich läuft es auf eine höhere Wärmeleitfähigkeit hinaus. Um dies in einen Kontext zu setzen: Ein Leiter wie Kupfer verfügt über eine Wärmeleitfähigkeit von ca. 400 Watt pro Meter Kelvin, während ein Material wie polykristalliner CVD-Diamant eine deutlich höhere Leistung in dieser Hinsicht aufweist —nahezu das Vierfache dieses Wertes. 

 

Material

Wärmeleitfähigkeit (W/mK)

Kupfer

~400

Coherent Keramik + Diamond (SiSiC/70% Diamant)

~670

Coherent Polykristalliner CVD-Diamant

~1500

Ein branchenübergreifendes thermisches Sicherheitsnetz

Bei Coherent widmen wir uns mit Leidenschaft der Lösung der Probleme durch die Aufheizung von Rechenzentren, insbesondere von solchen, die dank der Beliebtheit von KI überhitzen. Wir widmen uns ferner der Aufgabe, Herausforderungen des Wärmemanagements in einer Reihe anderer Anwendungen zu lösen – von Halbleitern über Elektrofahrzeuge bis hin zu Neurowissenschaften.

Auf der Hardwareebene nutzt das Wärmemanagement Tools und Technologien, um ein System effizient zu stabilisieren und innerhalb seines Betriebstemperaturbereichs zu halten. Die Wärmemanagementmaterialien und -systeme von Coherent reichen über die reine Mikroelektronik wie Halbleiterausrüstung hinaus und umfassen ein breites Spektrum an Märkten und Anwendungen wie die Materialbearbeitung, die Automobil-, Luft- und Raumfahrt- und Verteidigungsbranche, die Daten- und Telekommunikation sowie Biowissenschaften.

Es gibt keinen Mangel an Anwendungen für differenzierte technische Materialien und Geräte in verschiedenen Endmärkten:

 

thermal-dissipation-and-datacenters.jpg

 

Coherent ist ein weltweit führender Anbieter innovativer technischer Materialien und Subsysteme für das Wärmemanagement und bietet strategische, maßgeschneiderte Materiallösungen. 

Zu unserem breiten Spektrum an weltweit führenden, innovativen Wärmemanagement-Anwendungen gehören:

 

Reaktionsgebundenes Si/SiC

Coherent bietet mehrere reaktionsgebundene Si/SiC-Formulierungen an, um ein breites Spektrum an Designanforderungen und Produktanwendungen, einschließlich Anwendungen für das Wärmemanagement, zu erfüllen. Einige der reaktionsgebundenen Formulierungen, die wir für den Wärmemanagementmarkt anbieten, ermöglichen eine hohe Wärmeleitfähigkeit mit einem CTE, der auf AlN oder Si3N4 abgestimmt ist. Durch die Zugabe von Diamant zu Si/SiC-Materialien kann Coherent eine extrem hohe Wärmeleitfähigkeit für hitzekritische Anwendungen bieten.  

Darüber hinaus lassen sich die reaktionsgebundenen Si/SiC-Produkte durch nahe und endkonturnahe Fertigungsprozesse herstellen. Eine sehr komplexe Form ist durch konturiertes Formen, Grünbearbeitung und/oder Vorform-Fügen möglich. Die Formfähigkeit unterstützt ein breites Spektrum an Produktmerkmalen, einschließlich Lamellenelementen und internen Mikrokühlkanälen. So können wir anspruchsvollste Anwendungsanforderungen erfüllen.  

 

Metallmatrix-Komposite

Mit Siliziumkarbidpartikeln verstärkte MMCs aus Aluminium (Al/SiC) bieten deutliche Vorteile für Wärmemanagementanwendungen. Da Al und SiC eine geringe Dichte und eine hohe Wärmeleitfähigkeit aufweisen, bleiben bei einer Kombination der beiden Materialien diese wichtigen Materialeigenschaften erhalten. Gleichzeitig kann der WAK basierend auf dem Verhältnis von SiC (CTE von 3 ppm/K) zu Al (CTE von 23 ppm/K) im Verbundwerkstoff angepasst werden.  

MMC-Produkte lassen sich durch nahe und endkonturnahe Prozesse herstellen. Sie sind vollständig bearbeitbar, einschließlich einem direkten Gewindeschneiden. Diese Materialien sind auch mit Standardbeschichtungsprozessen kompatibel. Ihre mechanische und thermische Stabilität ist im Vergleich zu herkömmlichen Metallen deutlich erhöht. Und sie sind weniger zerbrechlich als Keramik. Darüber hinaus verfügt Coherent über patentgeschützte Herstellungsverfahren für MMC-Produkte, mit denen wir die spezifischen Anwendungsanforderungen unserer Kunden erfüllen können.

 

CVD-Diamant

Diamant bietet die höchste Wärmeleitfähigkeit aller Materialien, mindestens viermal höher als die von Kupfer, dem am häufigsten zur Wärmeübertragung verwendeten Metall. CVD-Diamant (wobei CVD für chemische Gasphasenabscheidung steht) kann Wärme effizient ableiten und eine Überhitzung elektronischer Geräte, wie z. B. integrierter Hochleistungsschaltkreise, verhindern. Dies verlängert die Lebensdauer der Geräte, verringert deren Platzbedarf und verbessert ihre Effizienz und Leistung. 

CVD-Diamant hat einen niedrigen Wärmeausdehnungskoeffizienten, was bedeutet, dass er sich beim Erhitzen oder Abkühlen nicht stark ausdehnt oder zusammenzieht. Da er einen breiten optischen Übertragungsbereich (UV bis hin zu langem IR), einen niedrigen Wärmeausdehnungskoeffizienten und eine hohe Thermoschockbeständigkeit unterstützt, eignet er sich ideal für Anwendungen wie Datenkommunikation, Telekommunikation, Halbleiterherstellung und Instrumente für die Biowissenschaft.

 

Einkristallines SiC: Hohe Leitfähigkeit, vielfältige Einsatzmöglichkeiten 

Zu den Hauptvorteilen der SiC-basierten Elektronik zählen geringere Schaltverluste, eine höhere Leistungsdichte, eine bessere Wärmeableitung und eine größere Bandbreitenkapazität. Und was die Wärmeleitfähigkeit betrifft, so hat einkristallines SiC eine Wärmeleitfähigkeit von etwa 490 W/mK; dies ist ein mehr als dreimal höherer Wert als der von Silizium (150 W/mK). Da SiC Wärme effizienter ableiten kann als Silizium, verringert dies den Gesamtbedarf an Kühlung und verbessert im Laufe der Zeit die Zuverlässigkeit und Leistung von Geräten. 

Dank einer hervorragenden chemischen Stabilität, einer hoch gesättigten Elektron-Driftgeschwindigkeit— sowie einer großen Wärmeleitfähigkeit — ist einkristallines SiC für ein breites Spektrum an Anwendungen ein hervorragendes Material, einschließlich u.a. Optoelektronik, Mikrowellengeräte, Datenkommunikation, Telekommunikation, Halbleiterherstellung, Elektrofahrzeuge, sowie Instrumente für die Biowissenschaft.

 

Warum Coherent: Leistung, Zuverlässigkeit, Zusammenarbeit 

Coherent bietet plattformübergreifende Lösungen, die sich durch hohe Leistung und Zuverlässigkeit auszeichnen. Sie profitieren von unseren patentgeschützten Verfahren und maßgeschneiderten Lösungen zur Wärmeableitung in Ihrem Rechenzentrum.

Coherent arbeitet mit Teams jeder Größe zusammen, um vertrauenswürdige, flexible, maßgeschneiderte Lösungen und Funktionen innerhalb von Rechenzentrumsumgebungen und darüber hinaus bereitzustellen. Effizientes, effektives Wärmemanagement sorgt für Kosteneinsparungen, reduziert Ausfallzeiten und maximiert die Lebenszyklen von Komponenten in vielen Branchenanwendungen. 

Erfahren Sie mehr über Lösungen von Coherent für das Wärmemanagement