Im Jahr 2020 wird Intel wieder in das Geschäft mit diskreten Grafiken zurückkehren und voraussichtlich eine neue GPU für Gamer auf den Markt bringen. Wir können dies auf zwei Arten sehen: Intel-Grafiken werden oder auf wundersame Weise zum Hintern von PC-Witzen der nächsten Generation, und sie betreten einen Markt, der seit der Jahrtausendwende nur von zwei Spielern dominiert wird.

Hier ist eine kurze Zeitleiste, wie dieser jüngste Start in der Öffentlichkeit Gestalt angenommen hat:

12. Juni 2018: Brian Krzanich, ehemaliger CEO von Intel, sagte den Investoren bei einem Sondertreffen, dass Intel seit Jahren leise eine diskrete GPU-Architektur "Arctic Sound" entwickelt und im Jahr 2020 veröffentlicht wird.

8. Januar 2019: Gregory Bryant, Vizepräsident des erfahrenen Computerbenutzers während der CES, erklärt, dass die kommende GPU im 10-nm-Prozess von Intel hergestellt wird.

21. März 2019: Intel bietet zwei Designs für seine GPUs auf der Bühne an. Stilistisch ähneln sie Optane-SSDs und haben in ihrer Größe eine Kühlleistung im mittleren Bereich.




1. Mai 2019: Jim Jeffers, Chefingenieur und Manager des Rendering- und Visualisierungsteams, kündigte die Raytracing-Funktionen des Xe in FMX19 an. Darüber hinaus hielt Intel die Funktionen weiterhin von Wettbewerbern fern.




Zwischen diesen Daten gibt es viele Lecks und Flüstern über den technischen Bereich, und wir können titanische Mengen an Informationen sammeln, indem wir die Grundlagen der Intel-Architektur untersuchen. Dies ist das Thema dieses Artikels.

Entwicklung

Intel wollte kein Risiko eingehen und entschied, dass sein gesamtes Grafikteam Experten sein würde, die AMD und Nvidia gestohlen wurden. Wir haben zum ersten Mal erfahren, dass Intel diskrete GPUs herstellen wird: Sie haben AMDs Grafikarchitektur-Manager und Grafik-Business-Manager eingestellt. Raja KoduriAls Senior Vice President für Core und Visual Computing bei Intel im Jahr 2017.




Als nächstes übernahm Jim Keller, der leitende Architekt hinter AMDs Zen-Architektur, die Rolle des Senior Vice President für Siliziumtechnik. Intel machte später Chris Hook, Senior Director für globales Produktmarketing bei AMD, zu einem separaten GPU-Vermarkter. Als nächstes Darren McPhee, ehemaliger AMD-Produktmarketingdirektor; Der frühere Technologiejournalist Damien Triolet wurde AMD-Vermarkter. Tom Peterson, technischer Marketingleiter und Chiparchitekt bei Nvidia; und schließlich Heather Lennon, AMDs Grafikmarketing- und Kommunikationsmanagerin.




Natürlich nur die größere öffentliche Arbeit. Das Grafikteam von Intel ist 4.500 Mann stark. Und Sie würden nicht so viele Leute und solch talentierte Leute haben, ohne zumindest etwas vage Interessantes zu tun.




Architektonisch

Kernanzahl

Während Xe zur Zukunft gehört, ist keine Technologie von den Produkten, die in der Vergangenheit entstanden sind, und der Entwicklung, die dazu geführt hat, getrennt - gut dokumentierte Generationen. Die erste Runde der Xe-Produkte wird eine Architektur verwenden, die aus dem derzeit veröffentlichten "Gen11" entwickelt wurde, aber immer noch eng miteinander verwandt ist und auf Intels Aussagen auf der CES basiert. So können wir interessante Informationen aus der Erforschung von Intel sammeln. weißes Papier Gen11.

Wie Sie sich an unsere erinnern Navi vs Turing VergleichAlle grafischen Architekturen bestehen aus immer komplexeren Teilen. 16 CUDA-Kerne für Nvidia Blöckevier von ihnen eins Streaming-Multiprozessor, ein Paar Textur-Rendering-Set (TPC) und einer von ihnen hat vier oder sechs Grafik-Rendering-Set (GPC). Somit enthält jede GPC 512 oder 768 CUDA-Kerne.




Wie in der folgenden Tabelle gezeigt, bestimmt die Anzahl der GPC und TPC pro GPC die Anzahl der Kerne für jeden Chip. Denken Sie daran, dass bei GPUs zum Verkauf möglicherweise einige dieser Kerne deaktiviert sind. Beispielsweise verwendet ein RTX 2070 Super einen TU104-Chip, mit dem 83% der Kerne auf 2560 CUDA-Kerne begrenzt werden können.

  6 Grafikverarbeitungscluster 3 Grafikverarbeitungscluster
768 CUDA pro GPC (6 TPC pro GPC) 768 x 6 = 4608 CUDA (TU102) 768 x 3 = 2304 CUDA (TU106)
512 CUDA pro GPC (4 TPC pro GPC) 512 x 6 = 3072 CUDA (TU104) 512 x 3 = 1536 CUDA (TU116)

Wenden wir dasselbe Konzept auf die Intel-Architektur an.

Intels Kerne ähneln nicht der CUDA von Nvidia, aber sie ähneln den Stream-Prozessoren von AMD. Lassen Sie uns diesbezüglich diskutieren. Jeder Stream-Prozessor ist ein Arithmetik-Logikeinheit kann eine Gleitkomma- oder Ganzzahloperation pro Stunde ausführen. Intel arithmetische Logikeinheiten Nennen wir sie das Äquivalent von vier Kernen, da sie vier Operationen pro Stunde ausführen können.

Intel beginnt mit der Paarung der beiden arithmetische Logikeinheiten für jemanden Exekutiveinheit (acht Kerne) gefolgt von einem untere Scheibe (64 Kerne), dann sind acht von ihnen voller Scheibe (512 Farben).

Die Prozessoren der nächsten Generation von Intel enthalten ein integriertes Slice. Wie Sie sich vorstellen können, wird das diskrete Xe-Array aus mehreren Slices erstellt. Grundsätzlich bedeutet dies, dass Intel wie Nvidia nur Muster mit Kernzahlen in Vielfachen von 512 erzeugen kann. Die Kernzahl eines Würfels ist die Anzahl der Scheiben multipliziert mit 512.

Anzahl der Scheiben 2 3 4 5 6 7 8
Kernanzahl 1024 1536 2048 2560 3072 3584 4096
Zu * iDG2HP128   iDG2HP256       iDG2HP512

Denken Sie daran, wir gehen davon aus, dass Intel die Basis-Slice-Konfiguration des Gen11 beibehalten wird, da sie möglicherweise erst im nächsten Jahr Zeit haben, die Grafikgrafiken vollständig neu zu gestalten. Das Gen11 ist natürlich gut geeignet, um sowohl integriert als auch diskret in das Design integriert zu werden, aber einige Elemente sollten sich ändern, z. B. das Render-Backend, das, wenn es unverändert bleibt, ein Multi-Slice-Design verstopft.

Mögliche 2048-Kern-Architektur (vier Schichten) Xe

Beweise

Praktischerweise hat Intel ein leistungsfähiges Beweispaket bereitgestellt, um diese Hypothese zu unterstützen. einer Treiber es enthielt fälschlicherweise die Namen verschiedener nicht veröffentlichter Produkte, die Ende Juli veröffentlicht wurden; IDG2HP512, iDG2HP256 und iDG2HP128; Wir haben die Codes als "Intel diskrete Grafik [Modell] zwei Hochleistungs" interpretiert, gefolgt von der Anzahl der Ausführungseinheiten.

Jede Ausführungseinheit besteht aus acht Kernen, daher erhalten wir "512" mit vier Schichten und 4096 Kernen, "256" mit zwei Schichten und 2048 Kernen und "128" mit zwei Schichten und 1024 Kernen. Diese Konfigurationen unterstützen unsere Analyse perfekt.

Intel gab außerdem bekannt, dass sie nach Möglichkeiten suchen, Slices zu kombinieren. Anfang 2018 demonstrierte Intel einen Prototyp einer diskreten GPU mit zwei Gen9-Slices in einem einzigen Chip und implementierte ihn mit der neuen integrierten Iris Plus Graphics 650, bei der zwei Gen9.5-Slices in einem Chip kombiniert wurden. Sie experimentieren auch mit einem Chiplet-Ansatz unter Verwendung von EMIB (Embedded Multi-Die-Verbindungsbrücke), der erstmals in Kaby Lake G verwendet wurde.

EMIB Architectural Design

EMIB kombiniert im Wesentlichen zwei oder mehr physische Formen zu einer virtuellen Form, um massive Kosteneinsparungen und eine leichte Leistungsminderung zu erzielen, „indem mehrere heterogene Muster kostengünstig in einem Paket kombiniert werden“. Wie 2017 Nvidia Forschungsbericht weil „sehr große Formen aufgrund einer großen Anzahl irreparabler Herstellungsfehler einen sehr geringen Wirkungsgrad haben“.

Durch das Erstellen und Kombinieren einer großen Anzahl kleiner Muster verringert Intel die Wahrscheinlichkeit von Fehlern bei der Erstellung und macht es billiger, diese Fehler zu beseitigen. Obwohl EMIB nicht vollständig auf die Massenverteilung vorbereitet ist, hat Intel im April genehmigt Ich freue mich darauf, dass Anandtech diesbezüglich bald EMIB zur Unterstützung seiner GPU einsetzen möchte.

Taktraten

Diagrammzeit. Wir haben eine vernünftige Schätzung der Basiszahlen gefunden. Schauen wir uns dies im schlimmsten Fall an, um eine Grundlage zu schaffen. Das heißt, es passt die Kernanzahl an die Taktraten der besten integrierten Grafik von Intel an, die bei 1150 MHz verfügbar sind. Um Geschwindigkeit und Kernanzahl zu kombinieren, werden wir TFLOPs darstellen, ein theoretisches Maß für die Leistung, das auf diesen beiden Variablen basiert. Während TFLOPS ein ausgezeichneter Leistungsindikator in einer vom Hersteller hergestellten GPU-Generation ist, ist es erwähnenswert, dass der Vergleich der beiden Hersteller weniger zuverlässig ist.

1,2 GHz'de TFLOPS

Intel ist zwar in Bezug auf die Kernanzahl wettbewerbsfähig, kann jedoch nicht mit 1150 MHz konkurrieren. Glücklicherweise ist dies nicht der Fall, in dem wir uns befinden. Zumindest wissen wir, dass sie integrierte Geschwindigkeiten überschreiten können, da sie durch die Wärmeleistung der CPU begrenzt sind, was kein Problem ist, wenn keine CPU vorhanden ist. Zweitens werden die neuen Xe-Chips von Intel die schnelleren und überlegenen 10 nm verwenden.

Es wird angenommen, dass der 10-nm-Prozess von Intel bestenfalls 7-nm-TSMC entspricht, der beim Spielen auf einer gut gekühlten Radeon 5700XT bei 1800 MHz liegen kann. Intel hat eine lange Tradition darin, seine Prozesse mit höheren Geschwindigkeiten als seine Konkurrenten zu komprimieren. Dies sind jedoch Intels lange, langjährige GPUs der ersten Generation, sodass vorsichtiger Pessimismus mehr Genauigkeit bietet: Nehmen wir an, Intel kann mindestens 1700 MHz verwalten.

1,7 GHz'de TFLOPS

Bei diesen möglicherweise realistischeren Geschwindigkeiten scheint Intel an der TFLOPS-Front etwas wettbewerbsfähig zu sein. Beachten Sie jedoch, dass diese Geschwindigkeitsschätzungen nicht zuverlässig sein sollen, insbesondere im Vergleich zu Kernzählungsberechnungen.

Kurz gesagt: Xe-diskrete GPUs werden bei 512 Kernzeiten und wettbewerbsfähigen 1,7-GHz-Geschwindigkeiten wahrscheinlich zum gleichen Preis pro Kern wie Nvidia angeboten.

Software

GPUs bieten mehr als nur Hardware. Nvidia stellt bekanntlich mehr Software-Ingenieure als Hardware-Ingenieure ein. Die Unterstützung jedes Spiels ist eine kostspielige und zeitaufwändige Investition, die dazu beiträgt, dass neue Marktteilnehmer auf dem Gaming-GPU-Markt praktisch ausgestorben sind. Mit Ausnahme von Intel sind sie definitiv nicht neu in der Software, obwohl sie neu in dem separaten Hardware-Spiel sind. Stellen Sie sich einen Übersetzer zwischen Spielen und Hardware für Treiber vor. Da sich nur die Hardware ändert, ist die Konvertierung von vorhandenen integrierten Treibern in ein diskretes System ein einfacher Vorgang.

Diese Treiber sind nicht so gut geschützt, und dies wird von Intel seit langem kritisiert. Die durchschnittliche Zeit zwischen den letzten zehn Treiberversionen betrug 25 Tage für Intel, 18 Tage für Nvidia und nur 10 Tage für AMD. Glücklicherweise besteht eine gute Chance, dass Intel seine Socken für den Xe hochschiebt, wenn man bedenkt, wie viel wichtigere Treiber für diskrete GPUs für integrierte GPUs sind.

Aber es ist nicht alles schlecht. Intel macht im vergangenen Jahr Fortschritte und ebnet Nvidia und AMD mit seinem neuen Command Center den Weg, das eine viel bessere und schmerzlosere Kontrolle über GPUs und Spiele bietet als Nvidias GeForce Experience. Es bietet Spieloptimierung mit den jeweiligen Einstellungen und Auswirkungen auf die Leistung, schnelles Einrichten auf mehreren Bildschirmen mit Synchronisierung von Bildwiederholfrequenz und Rotation, Farbgenauigkeit und Stilanpassungen der Anzeige sowie Treibersteuerung. Intel ist ein triviales, aber nettes Detail und unterstützt auch asynchron, sodass alle Xe-Produkte FreeSync-Monitore und -Ökosysteme von Anfang an unterstützen.

Markt

Wenn die Marktposition der Produkte ungewiss ist, ist wenig über die Architektur oder das Ökosystem von Bedeutung. Wir wissen sehr wenig darüber. Werden sie 100 oder 1.000 Dollar kosten? Ein Modell, zwei oder zehn? Kürzlich gefragt, ob Xe auf den Top-Markt Raja Koduri abzielen könnte antwortete:

„Nicht jeder wird eine 500-600-Dollar-Karte kaufen, aber es gibt genug Leute, um diese auch zu kaufen - es ist ein großartiger Markt. Wir machen uns also keine Gedanken über die Strategie, die wir verfolgen, den Leistungsumfang, den Kostenbereich und alles, denn schließlich muss unsere Architektur ab etwa 100 US-Dollar den Mainstream erreichen, wie die Öffentlichkeit sagte. Zu teuren Grafiken der Rechenzentrumsklasse mit HBM-Speichern und allem.

Wir müssen alles treffen; Wo fängst du gerade an? Zuerst? Der zweite? Dritte? Und die Strategie, die wir in ungefähr einem bestimmten Zeitraum hatten - nennen wir es 2-3 Jahre, bis der volle Stapel erreicht ist. ""

Und hier ist es: Intel wird mehrere GPUs veröffentlichen. Es ist nicht gerade eine wertvolle Erkenntnis, aber es wird erwartet, dass Intel seine Karten nahe an der Brust halten möchte. Und da dies das einzige offizielle Wort zu diesem Thema ist, sollten wir uns jetzt einer alternativen Quelle zuwenden: dem durchgesickerten Treiber.

Bild: Intel Concept Building Cristiano Siqueira

Die drei GPUs, die als Intel-Treiber für die ersten Treiber bezeichnet werden, verfügen über 1024-, 2048- und 4096-Kerne. Dies macht sie wettbewerbsfähig mit dem RTX 1650, RTX 2060 und RTX 2080 Ti zu Preisen von 150 USD, 350 USD bzw. 1000 USD +. Intel kann sich dafür entscheiden, Nvidia mit höheren Geschwindigkeiten oder niedrigeren Werten zu niedrigeren Preisen zu übertreffen, oder sich einfach auf andere Funktionen verlassen, um diese anzupassen und zu differenzieren.

Der Treiber bietet auch eine längerfristige Perspektive mit zwei "Entwickler" -Karten. Die Gruppe ist zusammen mit den anderen drei eine "iDG1LPDEV", die sich zu einer "Intel Discrete Graphics [Modell] 1 Low Power Developer" -Karte entwickelt, die darauf hinweisen könnte, dass Notebook-GPUs mit geringem Stromverbrauch getestet werden. Es gibt auch eine separate Liste von "iATSHPDEV" mit dem Codenamen "Arctic Sound" für die Xe-Architektur, die jedoch nicht als diskrete GPU verifiziert werden kann.

Wenn es eine Sache gibt, an die man sich erinnern sollte ... was Intel veröffentlichen wird, ist unbekannt und Spekulationen implizieren keine Kaufberatung. Auf der anderen Seite sind die Dinge vielversprechend. Es ist sehr vielversprechend.

Einkaufsverknüpfungen: