Im Jahr 2020 wird Intel zum Geschäft mit diskreter Grafik zurückkehren und voraussichtlich eine neue GPU für Gamer auf den Markt bringen. Wir können dies auf zwei Arten sehen: Intel-Grafiken werden zum Ziel der PC-Witze der nächsten Generation oder sie erreichen Wunder und dringen in einen Markt ein, der seit der Jahrtausendwende nur von zwei Spielern dominiert wird.

Hier ist eine kurze Zeitleiste, wie sich dieser bevorstehende Start in der Öffentlichkeit entwickelt:

12. Juni 2018: Intels ehemaliger CEO Brian Krzanich teilt Investoren bei einem privaten Treffen mit, dass Intel seit Jahren im Stillen eine diskrete GPU-Architektur „Arctic Sound“ entwickelt und 2020 auf den Markt bringen wird.

8. Januar 2019: Gregory Bryants VP, der während der CES Veteranen-Computing einsetzte, erklärt, dass die kommende GPU im 10-nm-Prozess von Intel hergestellt wird.

21. März 2019: Intel bietet für seine GPUs zwei Designs auf der Bühne an. Stilistisch ähneln sie Optane SSDs und in der Größe haben sie mittlere Kühlkapazitäten.




1. Mai 2019: Jim Jeffers, Chefingenieur und Manager des Rendering- und Visualisierungsteams, kündigte die Raytracing-Funktionen des Xe in FMX19 an. Darüber hinaus hat Intel weiterhin Talente von seinen Konkurrenten ferngehalten.



Zwischen diesen Terminen gab es viele Lecks und Gerüchte über den Technologieraum, und wir können riesige Mengen an Informationen sammeln, indem wir die Grundlagen der Intel-Architektur studieren. Das ist das Thema dieses Artikels.

Entwicklung

Da Intel kein Risiko eingehen wollte, entschied Intel, dass das gesamte Grafikteam aus Experten bestehen würde, die von AMD und Nvidia gestohlen wurden. Dies ist das erste Mal, dass wir erfahren, dass Intel diskrete GPUs herstellen wird: Sie stellten AMDs Leiter der Grafikarchitektur und des Grafikgeschäfts ein, Raja Koduriwurde 2017 Senior Vice President of Core and Visual Computing bei Intel.




Dann übernahm Jim Keller, der leitende Architekt der Zen-Architektur von AMD, die Rolle des Senior Vice President of Silicon Engineering. Anschließend ernannte Intel Chris Hook, Senior Director of Global Product Marketing bei AMD, zum Vermarkter diskreter GPUs. Dann Darren McPhee, ehemaliger AMD Product Marketing Director; Der ehemalige Tech-Journalist Damien Triolet wurde zum AMD-Vermarkter; Tom Peterson, technischer Marketingleiter von Nvidia und Chiparchitekt; und zuletzt Heather Lennon, AMDs Head of Graphics Marketing and Communications.



Natürlich nur zum größeren öffentlichen Verleih. Das Grafikteam von Intel ist 4.500 Mann stark. Und man kann nicht so viele Leute und so viele talentierte Leute haben, ohne etwas zumindest vage Interessantes zu tun.




Architektur

Zahl der Kerne

Obwohl Xe der Zukunft gehört, ist keine Technologie getrennt von den Produkten, die in der Vergangenheit entstanden sind und deren Entwicklung sie hervorgebracht haben - gut dokumentierte Generationen. Die erste Runde der Xe-Produkte wird eine Architektur verwenden, die aus der jetzt veröffentlichten "Gen11" entwickelt wurde, aber immer noch eng verwandt und von Intels Aussagen auf der CES inspiriert ist. So können wir interessante Informationen aus der Recherche zu Intels gewinnen. weißes Papier Gen11.

Wie Sie sich erinnern werden, unsere Navi vs. Turing-Vergleich, bestehen alle Grafikarchitekturen aus immer komplexer werdenden Teilen. 16 CUDA-Kerne für Nvidia sind gruppiert Blöckevier davon eins Streaming-Multiprozessor, ein Paar Textur-Rendering-Set (TPC) und einer von ihnen hat vier oder sechs Grafik-Rendering-Set (GPK). Jeder GPC enthält also 512 oder 768 CUDA-Kerne.




Wie in der Tabelle unten gezeigt, bestimmt die Anzahl der GPCs und TPCs pro GPC die Anzahl der Kerne für jeden Chip. Denken Sie daran, dass einige dieser Kerne möglicherweise deaktiviert sind. Eine RTX 2070 Super verwendet beispielsweise einen TU104-Die, wodurch 83% der Kerne auf 2560 CUDA-Kerne begrenzt werden können.

  6 Grafik-Rendering-Cluster 3 Grafik-Rendering-Cluster
768 CUDAs pro GPC (6 TPCs pro GPC) 768 x 6 = 4608 CUDA (TU102) 768 x 3 = 2304 CUDA (TU106)
512 CUDAs pro GPC (4 TPCs pro GPC) 512 x 6 = 3072 CUDA (TU104) 512 x 3 = 1536 CUDA (TU116)

Wenden wir das gleiche Konzept auf die Architektur von Intel an.

Intels Kerne ähneln nicht Nvidias CUDA, aber sie haben eine gewisse Ähnlichkeit mit AMDs Streaming-Prozessoren, also lassen Sie uns in Bezug darauf diskutieren. Jeder Stream-Prozessor Arithmetik-Logikeinheit kann eine Gleitkomma- oder Ganzzahloperation pro Stunde ausführen. Intels arithmetisch-logische Einheiten Da es vier Operationen pro Stunde ausführen kann, nennen wir sie das Äquivalent von vier Kernen.

Intel beginnt mit der Paarung von zwei arithmetisch-logische Einheiten für jemanden Exekutive Einheit (acht Kerne) gefolgt von a untere Scheibe (64 Kerne), dann noch acht davon Scheibe (512 Farben).

Die Prozessoren der nächsten Generation von Intel enthalten einen integrierten Slice, aber wie zu erwarten, wird das diskrete Xe-Array aus mehreren Slices aufgebaut. Im Grunde bedeutet dies, dass Intel wie Nvidia nur Chips mit Kernzahlen produzieren kann, die ein Vielfaches von 512 sind. Die Kernzahl eines Würfels ist die Anzahl der Scheiben multipliziert mit 512.

Anzahl der Scheiben 2 3 4 5 6 7 8
Zahl der Kerne 1024 1536 2048 2560 3072 3584 4096
An * iDG2HP128   iDG2HP256       iDG2HP512

Denken Sie daran, dass wir davon ausgehen, dass Intel die Core-Slice-Konfiguration von Gen11 beibehalten wird, da sie offensichtlich erst im nächsten Jahr Zeit haben, ihre Grafikgrafiken vollständig neu zu gestalten. Gen11 ist natürlich gut geeignet, um sowohl in das Design integriert als auch diskret zu sein, aber einige Elemente müssen geändert werden, wie zum Beispiel das Render-Backend, das ein Multi-Slice-Design verstopft, wenn es unverändert bleibt.

Mögliche Architektur mit 2048 Kernen (vier Slices) Xe

Beweise

Passenderweise hat Intel eine solide Reihe von Beweisen geliefert, um diese Hypothese zu stützen. einer Treiber fälschlicherweise die Namen verschiedener unveröffentlichter Produkte enthalten, die Ende Juli veröffentlicht wurden; „IDG2HP512“, „iDG2HP256“ und „iDG2HP128“; Wir interpretierten die Codes als „Intel diskrete Grafik [Modell] zwei hohe Leistung“, gefolgt von der Anzahl der Ausführungseinheiten.

Jede Ausführungseinheit besteht aus acht Kernen, wir erhalten also „512“ mit vier Slices und 4096 Kernen, „256“ mit zwei Slices und 2048 Kernen und „128“ mit zwei Slices und 1024 Kernen. Diese Konfigurationen unterstützen unsere Analyse perfekt.

Intel gab außerdem bekannt, dass sie nach Möglichkeiten suchen, Slices zu kombinieren. Anfang 2018 demonstrierte Intel einen Prototyp einer diskreten GPU mit zwei Gen9-Slices in einem einzigen Die und implementierte ihn mit der neuen integrierten Iris Plus Graphics 650, die zwei Gen9 kombiniert. Sie testen auch einen Chiplet-Ansatz unter Verwendung von EMIB (Embedded Multi-Die Link Bridge), der erstmals in Kaby Lake G verwendet wurde.

EMIB Architekturdesign

EMIB „kombiniert kostengünstig mehrere heterogene Muster in einem einzigen Paket“, indem es im Wesentlichen zwei oder mehr physische Muster zu einem virtuellen Muster kombiniert, was enorme Kosteneinsparungen und eine leichte Leistungseinbuße ermöglicht. 2017 als Nvidia Forschungsbericht denn „sehr große Formen haben aufgrund der Vielzahl irreparabler Herstellungsfehler sehr geringe Ausbeuten“.

Durch das Erstellen und Kombinieren vieler kleiner Chips reduziert Intel die Wahrscheinlichkeit von Fehlern bei deren Herstellung und macht ihre Reparatur kostengünstiger. Während die EMIB noch nicht vollständig für die Massenverteilung bereit ist, hat Intel im April genehmigt Anandtech freue mich darauf, da sie bald beabsichtigen, EMIB zur Unterstützung ihrer GPUs zu verwenden.

Taktraten

Grafik Zeit. Wir haben eine vernünftige Annäherung an die Basiszahlen gefunden, also schauen wir uns das im schlimmsten Fall an, um eine Basislinie zu erstellen. Das heißt, es passt die Kernzahlen an die Taktraten von Intels bester verfügbarer integrierter Grafik mit 1150 MHz an. Um Geschwindigkeit und Kernanzahl zu kombinieren, werden wir in TFLOPs grafisch darstellen, einem theoretischen Leistungsmaß, das auf diesen beiden Variablen basiert. Während TFLOPS ein hervorragender Leistungsindikator innerhalb einer GPU-Generation eines Herstellers ist, ist anzumerken, dass er für den Vergleich der beiden Hersteller weniger zuverlässig ist.

1,2 GHz TFLOPS

Während Intel bei der Anzahl der Kerne konkurrenzfähig ist, können sie bei 1150 MHz nicht mithalten. Glücklicherweise ist dies nicht die Situation, in der wir uns befinden. Zumindest wissen wir, dass sie die integrierten Geschwindigkeiten überschreiten können, da sie durch die Wärmeleistung der CPU begrenzt sind, was ohne CPU kein Problem darstellt. Zweitens werden Intels neue Xe-Chips schnellere und überlegene 10 nm verwenden.

Intels 10-nm-Prozess gilt bestenfalls als gleichwertig mit dem 7-nm-Prozess von TSMC, der beim Spielen auf einer gut gekühlten Radeon 5700XT mit 1800 MHz arbeiten kann. Intel hat eine lange Geschichte darin, seine Prozesse mit höheren Geschwindigkeiten zu komprimieren als seine Konkurrenten. Allerdings handelt es sich hierbei um Intels GPUs der ersten Generation seit langer, langer Zeit, daher bietet vorsichtiger Pessimismus mehr Genauigkeit: Sagen wir, Intel schafft mindestens 1700 MHz.

1,7 GHz TFLOPS

Bei diesen potenziell realistischeren Geschwindigkeiten sieht Intel an der TFLOPS-Front etwas konkurrenzfähig aus. Beachten Sie jedoch, dass diese Geschwindigkeitsschätzungen nicht zuverlässig sein sollen, insbesondere im Vergleich zu Kernzahlberechnungen.

Kurz gesagt: diskrete Xe-GPUs werden wahrscheinlich mit konkurrenzfähigen 1,7-GHz-Geschwindigkeiten erscheinen, zu ungefähr dem gleichen Preis pro Kern wie Nvidia auf der 512-Kern-Ebene.

Software

GPUs haben viel mehr zu bieten als nur Hardware. Nvidia stellt bekanntlich mehr Softwareingenieure als Hardwareingenieure ein. Jedes Spiel zu unterstützen ist eine kostspielige und zeitaufwändige Investition, was einer der Gründe dafür ist, dass neue Marktteilnehmer auf dem Markt für Gaming-GPUs fast ausgestorben sind. Abgesehen von Intel sind sie zwar neu im Bereich diskreter Hardware, aber sicherlich nicht neu in der Software. Betrachten Sie Treiber als Übersetzer zwischen Spielen und Hardware; nur Hardwareänderungen, daher ist die Konvertierung von vorhandenen integrierten Treibern zu diskreten Systemen ein einfacher Vorgang.

Diese Treiber sind nicht so gut geschützt und das wird von Intel schon lange kritisiert. Die durchschnittliche Zeit zwischen den letzten zehn Treiber-Releases betrug fünfundzwanzig Tage für Intel, achtzehn Tage für Nvidia und nur zehn Tage für AMD. Glücklicherweise besteht eine gute Chance, dass Intel für den Xe die Socken hochfährt, wenn man bedenkt, wie viel wichtiger Treiber für diskrete GPUs sind als für integrierte GPUs.

Aber es ist nicht alles schlecht. Intel hat letztes Jahr Fortschritte gemacht und den Weg für Nvidia und AMD mit seinem neuen Command Center geebnet, das eine weitaus bessere und schmerzfreiere Kontrolle über GPUs und Spiele bietet als Nvidias GeForce Experience. Was jede Einstellung bewirkt und wie sie sich auf die Leistung auswirkt, bietet ein schnelles Multi-Display-Setup mit Bildwiederholfrequenz und Rotationssynchronisierung, Bildschirmfarbgenauigkeit und Stilanpassungen sowie Spieloptimierung mit Treibersteuerung. Und ein kleines, aber nettes Detail, Intel unterstützt auch Async, sodass alle Xe-Produkte FreeSync-Monitore und -Ökosysteme unterstützen.

Markt

Bei unsicherer Marktposition der Produkte ist wenig wichtig über die Architektur oder das Ökosystem. Wir wissen sehr wenig darüber. Werden sie 100 oder 1.000 US-Dollar kosten? Ein Modell, zwei oder zehn? Auf die Frage, ob Xe seinen High-End-Markt anvisieren könnte, sagte Raja Koduri antwortete:

„Nicht jeder wird eine 500-600-Dollar-Karte kaufen, aber es gibt genug Leute, die sie auch kaufen – es ist ein großartiger Markt. Wir kümmern uns also nicht wirklich um die Strategie, die wir verfolgen, die Leistungsspanne, die Kostenspanne und alles, denn am Ende muss unsere Architektur, wie die Öffentlichkeit sagt, ab etwa 100 US-Dollar den Mainstream erreichen. Zu teuren Grafiken in Rechenzentrumsqualität mit HBM-Speichern und allem.

Wir müssen alles treffen; nur wo fängst du an Zuerst? Der zweite? Dritte? Und ungefähr die Strategie, die wir über einen bestimmten Zeitraum verfolgen - nennen wir es 2-3 Jahre, bis der volle Stapel erreicht ist. ”

Und hier ist es: Intel wird mehrere GPUs veröffentlichen. Es ist nicht gerade eine wertvolle Erkenntnis, aber es wird erwartet, dass Intel seine Karten nah an der Brust behalten möchte. Und da dies das einzige offizielle Wort zu diesem Thema ist, müssen wir uns jetzt einer alternativen Quelle zuwenden: dem durchgesickerten Treiber.

Bild: Intel Konzepterstellung Cristiano Siqueira

Bei den ersten Treibern als Intel-Treiber bezeichnet, verfügen die drei GPUs über 1024, 2048 und 4096 Kerne. Das würde sie zu einer wettbewerbsfähigen Leistung mit der RTX 1650, RTX 2060 und RTX 2080 Ti zu den Preisen von 150 US-Dollar, 350 US-Dollar bzw. über 1000 US-Dollar machen. Intel kann sich dafür entscheiden, Nvidia mit höheren Geschwindigkeiten oder einem niedrigeren Wert zu niedrigeren Preisen zu übertreffen, oder es einfach anzupassen und sich auf andere Funktionen zu verlassen, um sich zu differenzieren.

Der Treiber bietet mit zwei "Entwickler"-Karten auch eine längerfristige Perspektive. Die Gruppe, zusammen mit den anderen drei, ist eine „iDG1LPDEV“, die sich in eine „Intel Discrete Graphics [Modell] 1 Low-Power Developer“-Karte übersetzt, die darauf hinweisen könnte, dass Laptop-GPUs mit geringem Stromverbrauch getestet werden. Es gibt auch ein separates "iATSHPDEV"-Listing für die Architektur des Xe, das den Codenamen "Arctic Sound" zeigt, aber es kann nicht bestätigt werden, dass es sich um eine diskrete GPU handelt.

Wenn es eines zu bedenken gibt ... Was Intel veröffentlichen wird, ist unbekannt und Spekulationen sind nicht als Kaufberatung gedacht. Andererseits sind die Dinge vielversprechend. Es ist sehr vielversprechend.

Einkaufskürzel: