Microsoft schlägt FPGA-unterstützten Servern vor, am Ende des Moore-Gesetzes Geschwindigkeit zu erreichen

Sebastian Grassl – Auftaktveranstaltung #DPK17 | Microsoft (April 2019).

Anonim

Microsoft schlägt FPGA-unterstützten Servern vor, am Ende des Moore-Gesetzes Geschwindigkeit zu erreichen


Microsoft verwendet programmierbare Chips, um eine beschleunigte Implementierung für eine Reihe von Algorithmen wie maschinelles Lernen, Mustererkennung und vieles mehr zu ermöglichen.

Doug Burger, ein Computerchipforscher bei Microsoft, ist der Mann, der als erster auf die Idee kam, Microsoft-Server mit FPGAs als Beschleuniger auszustatten. Er glaubte, dass in Zukunft riesige Internetunternehmen ihre Software und Hardware so gestalten müssen, dass sie die Anforderungen zukünftiger komplexer Algorithmen erfüllen. Und die Hardwarehersteller der Welt würden nicht bauen, was Microsoft brauchte.

ASIC, FPGA oder Software auf einem universellen Chip "// www.microsoft.com/en-us/research/project/project-catapult/" target = "_ blank"> Katapult, das die Geschwindigkeit und Flexibilität von FPGAs nutzt um die Effizienz von Microsoft Servern zu verbessern. Obwohl Microsoft seit mehr als 40 Jahren Software entwickelt, hatte es nicht die Ingenieure und Werkzeuge, um seine eigenen Server zu entwerfen. Das Projekt wurde zunächst nicht sehr begrüßt; Burger und Qi Lu, die Bing leiten, konnten ihren Boss schließlich davon überzeugen, mit Catapult zu arbeiten.

Project Catapult zur schnellen und effizienten Implementierung von AI-Algorithmen. Bild mit freundlicher Genehmigung von Microsoft.

Nachdem die Experimente bestätigten, dass die FPGA-basierten Datenzentren einen speziellen Algorithmus zum maschinellen Lernen um das 40-fache beschleunigen können, kündigte Microsoft an, Bing 2014 mit der Technologie auszustatten.

Die programmierbaren Chips werden derzeit von Bing verwendet, um einen Teil des Ranking-Algorithmus auf Hardware statt auf Software auszuführen. In naher Zukunft wird die Hardware Algorithmen für tiefe neuronale Netze implementieren, um den Suchprozess von Bing drastisch zu beschleunigen. Daher wird Bing schneller sein und gleichzeitig relevantere Ergebnisse liefern, indem eine breitere Palette von Quellen berücksichtigt wird.

Während die Kosten von Catapult weniger als 30% der gesamten in einem Server verwendeten Hardware ausmachen und weniger als 10% der Gesamtleistung verbrauchen, beschleunigt es die Datenverarbeitung um den Faktor zwei.

Alle Internetgiganten - Google, Amazon, Baidu usw. - verfolgen eine ähnliche Richtung: Sie fügen ihren Servern zusätzliche Chips hinzu, damit sie ihre Systeme an die sich schnell ändernden Algorithmen anpassen können.

Zum Beispiel greift Google auf die exorbitant teure Lösung von ASICs zurück, um eine höhere Geschwindigkeit anzubieten. Googles Chips, sogenannte Tensor Processing Units oder TPUs, opfern Flexibilität, um die Ausführungszeit neuronaler Netzwerkalgorithmen zu minimieren. An dem Tag, an dem Google ein neues neuronales Netzwerkmodell entwickelt, muss das Unternehmen einen neuen Chip herstellen.

Die neue Technologie mildert das Ende des Mooreschen Gesetzes

Wie Moores Gesetz beobachtet hat, erfreuen wir uns seit langem immer schnellerer und kostengünstiger Prozessoren. In den letzten zehn Jahren haben wir jedoch einen langsameren Anstieg der CPU-Leistung feststellen können. Dies war für viele Computerhersteller und Rechenzentrumsmanager frustrierend.

Um diesen Trend zu umgehen, waren Microsoft-Forscher nicht an inkrementellen Verbesserungen interessiert. Sie waren auf der Suche nach einer radikalen Veränderung. Sie beschlossen, einen Teil der Algorithmen auf FPGA zu entwickeln und einige Geschwindigkeitsverbesserungen gegenüber einer Mehrzweck-CPU zu erzielen. Mit anderen Worten, sie entluden einen Teil der Rechenlast der Algorithmen von der langsamen Universal-CPU zu den schnellen Spezial-FPGAs.

Da FPGAs nicht neu sind, unterschätzen die Menschen im Allgemeinen ihr Potenzial. Vor dem Projektkatapult hatte niemand ernsthaft daran gedacht, FPGAs im großen Stil für das Cloud Computing einzusetzen. Lu glaubt, dass die FPGA-basierte Technologie es Microsoft erlauben wird, seine Verarbeitungsleistung bis 2030 gut zu erweitern. Er stellt fest, dass nach 2030 sehr wahrscheinlich ultraschnelle Quantencomputer verfügbar sein werden.

FPGAs könnten anderen Microsoft-Diensten nützen

Nach der erfolgreichen Entwicklung von Bing im Jahr 2014 entschied sich Microsoft später, eine ähnliche Technologie in Azure, dem Cloud Computing-Dienst des Unternehmens, und Office 365 einzusetzen. Jeder dieser Dienste weist unterschiedliche Engpässe und Prioritäten auf. Bing setzt auf die Technologie, um neue KI-Algorithmen zu ermöglichen. Das akute Problem von Azure ist der Netzwerkverkehr, daher wurde eine modifizierte Version der Technologie vorgeschlagen, um die Daten zu routen. Office 365 verwendet das neue Schema zum Durchführen von Verschlüsselungs-, Entschlüsselungs- und maschinellen Lernalgorithmen.

Derek Chiou, Hardware-Manager für Microsoft-Partnerhardware, erklärt, dass die Verwendung von FPGAs vor der Haustür zu einem schnelleren und sichereren Netzwerk führen kann. Er stellt weiter klar, dass wenn wir zur Bank gehen, um etwas Geld abzuheben, wir zum Kassierer gehen, nicht zum Manager. In ähnlicher Weise entlädt das FPGA die unnötige Rechenlast von dem Hauptprozessor.

Es wird angenommen, dass in Zukunft jeder neue Microsoft-Server mit dieser Technologie ausgestattet wird.

Project Catapult-Teammitglieder, von links, Adrian Caulfield, Doug Burger, Andrew Putnam, Eric Chung und Sitaram Lanka. Bild mit freundlicher Genehmigung von Microsoft.

Die Technologie von Microsoft hat sich erheblich auf den FPGA-Markt ausgewirkt. Intel erwarb Altera im vergangenen Sommer für 16, 7 Milliarden Dollar. Das Unternehmen plant die Verwendung von Altera-FPGAs in vielen Anwendungen wie Autos, Robotern, Drohnen und mehr.

Diane Bryant, Intels Executive Vice President, stellt jedoch fest, dass die Veränderungen auf dem FPGA-Markt Intel davon überzeugten, Altera zu übernehmen. Sie glaubt, dass ein Drittel aller Server der Welt bald FPGAs als Beschleuniger verwenden wird.

Eine detaillierte Erläuterung zur Verwendung von FPGAs als Beschleuniger im Cloud Computing finden Sie in der Veröffentlichung, die vom Microsoft-Forschungsteam veröffentlicht wurde.