Nvidia Geforce GTX 780 Ti im Test: Die “Titan Ultra” ist gelandet - für 649 Euro
Geforce GTX 780 Ti im Test: 2.880 aktive Shader-Einheiten, ein Boost auf bis zu 1.006 MHz sowie 3 GiByte des schnellsten GDDR5-Speichers: Nvidia bläst zum Angriff auf die Radeon R9 290X. Welche High-End-Grafikkarte die Kühlerhaube vorn hat, klären wir im Test der Geforce GTX 780 Ti.
Wer in den vergangenen Wochen eine Geforce GTX 780 (Non-Ti) kaufte, kann sich womöglich freuen: Nvidia liefert seit einiger Zeit B1-Chips aus, die “inkognito” auf GTX-780- und sogar Titan-Grafikkarten zum Einsatz kommen. Obwohl Nvidia angibt, dass die Änderungen nicht über einen Metal Spin hinausgehen, hat ein GK110B praktische Vorteile gegenüber dem “alten” GK110: Ersten Nutzermeldungen zufolge lassen sich die B-Modelle überdurchschnittlich gut übertakten respektive undervolten – das trifft übrigens auch auf die Geforce GTX 780 Ti zu. Doch dazu später mehr.
Nvidias Geforce GTX 780 Ti ist nach der GTX Titan (PCGH-Test) und Geforce GTX 780 (PCGH-Test) die dritte Desktop-Grafikkarte auf Basis des GK110-Prozessors. Jener Grafikchip feiert zwar bald seinen ersten Geburtstag – die auf ihm basierende Tesla K20(X) wurde am 12.11.2012 vorgestellt –, erfuhr jedoch eine Überarbeitung: Mit der Geforce GTX 780 Ti wird der GK110 in Revision B1 offiziell, die ersten GTX-Titan- und GTX-780-Grafikkarten nutzen noch A1-Silizium. Nvidia bestätigte uns auf Nachfrage, dass dieser Spin (Überarbeitung der GPU) keine Performance-Verbesserungen oder neue Features wie Direct X 11.1 oder 11.2 einführt, GK110-B1 sei lediglich in den Disziplinen Fertigungsausbeute (Yields) und Taktpotenzial verbessert worden. Kurz und knapp: Auch die Geforce GTX 780 Ti unterstützt lediglich das DirectX-Featurelevel 11_0 sowie dessen optionale Funktionen. Letztere werden unter anderem von DICE für Battlefield 4 genutzt, sodass auch Kepler-Grafikkarten unter Windows 8(.1) mit DX11.1 effizienter arbeiten als unter DX11.0.
Laut Nvidia handelt es sich bei der Geforce GTX 780 Ti “um die beste GPU für Spieler, die jemals gebaut wurde”. Die Kalifornier betonen, dass diese Grafikkarte speziell auf PC-Spiele zugeschnitten ist, denn entgegen anders lautender Gerüchte bleibt die Geforce GTX Titan wegen ihrer zwei Vorteile gegenüber der GTX 780 Ti einstweilen auf dem Markt: Neben 6 anstelle von 3 GiByte Grafikspeicher sprechen die Double-Precision-Leistung (DP) von mindestens 1,3 TFLOPS für die derzeit 840 Euro GTX Titan – sofern der Interessent diese Vorteile semiprofessionell zu nutzen weiß. Spieler können darüber hinwegsehen, dass Nvidia die Geforce GTX 780 Ti auf ein DP-SP-Verhältnis von 1:24 beschnitten hat (Titan: 1:3), der kleinere Grafikspeicher kann jedoch in extremen Auflösungen und beim Einsatz von Grafikmods nachteilig werden. Zur Einstimmung auf die Testwerte packen wir die Geforce GTX 780 Ti aus:
Geforce GTX 780 Ti: GK110 bleibt GK110
Die Kepler-GK110-Gene wirken auch in der Geforce GTX 780 Ti. So besteht der auch der volle B1-Chip (GK110-425-B1) aus 15 SMX, von denen jeder 192 Shader-Einheiten, 16 Textureinheiten, das 64 KiB große Registerfile und verschiedene Caches beinhaltet. Für Tesla- und Quadro-Karten lässt sich optional ein ECC-Speicherschutz aktivieren sowie die Einteilung der 64 KiB L1-Cache/Shared-Memory in 16 KiB-Blöcken verändern (16:48, 32:32 und 48:16 KiB). Für Spieler zwar irrelevant, aber dennoch die größte Neuerung sind die 4x 16 DP-Einheiten, welche laut Nvidia als physisch separate ALUs implementiert wurden. Die restlichen GK110-Goodies wie Hyper-Q, Dynamic Parallelism, erweiterte Virtualisierung und vor allem der neue “fast path”, um Speicherwerte über Zweckentfremdung des Texturcaches einzulesen, ihn also als Read-Only-L1-Cache zu missbrauchen, erfordern spezielle Programmierung und Optimierung auf den GK110-Chip. Zum Teil stehen sie auch nur unter CUDA zu Verfügung.
Die SMX sind in fünf Gruppen, die Graphics Processing Cluster (GPCs), organisiert. Diese beherbergen die Rasterizer, von denen jeder acht Pixel pro Takt schafft. Insgesamt 40 Pixel pro Takt, ergo 33,48 Gpix/s als GTX Titan und 34,7 GPix/s als GTX 780 (allerdings mit 5 GPCs!), kann der GK110 folglich an die ALUs weitergeben. Das ist nur wenig mehr als beispielsweise GTX 680 und HD 7970 erreichen und könnte sich als Flaschenhals des gigantischen Chips erweisen. Die kleineren Chips gleichen den geringeren Durchsatz (32 pixel per clock) mit höherem Takt jenseits von 1 GHz aus.
Der bei GK110 entweder 3 (GTX 780 & Ti) oder 6 GiByte (GTX Titan) große Speicher hängt an sechs 64 bit breiten Controllern mit je einer “Octo”-ROP-Partition. Hier gibt es die nächste für Spieler vielleicht interessante Änderung zum GK104: Anstelle von 128 entlasten nun 256 KiB lese-/schreibfähiger Level-2-Cache die GDDR5-Bausteine. Damit ist die Geforce GTX 780 Ti wie auch die GTX 780 und Titan etwas unabhängiger von der Speichertransferrate als beispielsweise die Geforce GTX 680/770. Das unterstreichen zahlreiche Praxis-Benchmarks von PC Games Hardware.
http://www.pcgameshardware.de/Geforce-GTX-780-Grafikkarte-257241/Tests/Geforce-GTX-780-Ti-Test-1096105/