Update vom 17. November: Ergebnisse für NVIDIAs GeForce RTX 4080 hinzugefügt.

Wir haben Blender-Performance-Artikel für jede Hauptversion seit Version 2.80 veröffentlicht, und natürlich einige Versionen haben sich substanzieller oder spezieller angefühlt als die anderen. 2.81 brachte zum Beispiel NVIDIA OptiX-Unterstützung, während 2.92 Geometry Nodes einführte und 3.0 eine Überarbeitung von Cycles debütierte. Was können wir über 3.3 sagen? Nun, es führt die Unterstützung für einen dritten Anbieter von Desktop-und Notebook-GPUs ein: Intel.

Regelmäßige Leser von”TNGD”haben zweifellos unsere Berichterstattung über Intel Arc-Ersteller inzwischen entdeckt. Wir haben die drei verfügbaren GPUs in Blender 3.3 bereits getestet, aber dieser Artikel enthält erneute Tests mit den neuesten Treibern und den ersten Auftritt von NVIDIAs neuester GeForce RTX 4090 der Spitzenklasse, basierend auf der Ada Lovelace-Architektur.

Es ist nicht nur Unterstützung für erweiterte Hardware, die Blender 3.3 bringt, obwohl es auch erwähnenswert ist, dass Vega-basierte Radeon-Karten jetzt wieder unterstützt werden, nachdem ihre Fähigkeiten in Version 3.0 mit der Einführung von AMDs HIP-API abgeschnitten wurden.

Wie wir bereits erwähnt haben In unserem Newsbeitrag zur Einführung von Blender 3.3 wurden eine Handvoll nützlicher neuer Funktionen bereitgestellt, wie z. fly:

Wie immer sind es nie nur eine Handvoll Funktionen und Verbesserungen, die den neuesten Blender treffen, also täten Sie gut daran, die Seite mit Versionshinweisen, um sich mit allen Änderungen vertraut zu machen.

AMD , Intel-und NVIDIA-GPU-Aufstellungen, unsere Testmethoden

Es ist immer noch ein wenig schwer zu glauben, aber dies ist der erste spezielle Blender-Performance-Artikel, in dem drei GPU-Anbieter vorgestellt werden. Hier ist eine Zusammenfassung der Current-Gen-Stacks der einzelnen Unternehmen:

AMD Radeon Creator & Gaming GPU Lineup Cores Boost MHz Peak FP32 Memory Bandwidth TDP Price RX 6950 XT 5.120 2.310 23,6 TFLOPS 16 GB 1.576 GB/s 335W 1.099 $ RX 6900 XT 5,120 2,250 23 TFLOPS 16 GB 1 512 GB/S 300 W $ 999 RX 6800 XT 4,608 2.250 20,7 TFLOPS 16 GB 1 512 GB/S 300W $ 649 RX 6800 3,840 2,105 16,2 TFLOPS 16 GB 1 512 GB/SB/250 2,105) 2,560 2,600 13.3 TFLOPS 12 GB 1 432 GB/s 250W $549 RX 6700 XT 2,560 2,581 13.2 TFLOPS 12 GB 1 384 GB/s 230W $479 RX 6650 XT 2,048 2,635 10.8 TFLOPS 8 GB 1 280 GB/s 180W $399 RX 6600 XT 2,048 2,589 10.6 TFLOPS 8 GB 1 256 GB/s 160W $379 RX 6600 1,792 2,491 8.9 TFLOPS 8 GB 1 224 GB/s 132W $329 RX 6500 XT 1,024 2,815 5.77 TFLOPS 4 GB 1 144 GB/s 107W $199 RX 6400 768 2,321 3.57 TFLOPS 4 GB 1 128 GB/s 53 W 159 $ Hinweise
Intels Arc Gaming & Creator GPU-Aufstellung Xe-Kerne Render-Slices GPU-Takt Speicherbandbreite TDP SRP Arc A770 32 8 2,1 GHz 16/8 GB 1 560/512 GB/s 225 W 329 $ Arc A750 28 7 2,05 GHz 8 GB 1 512 GB/s 225 W 289 $ Arc A580 24 4 1,70 GHz 8 GB 1 512 GB/s 175 W $??? Arc A380 8 2 2,0 GHz 6 GB 1 186 GB/s 75 W $139 Arc A310 6 2 2,0 GHz 4 GB 1 124 GB/s 75 W $??? Hinweise
GeForce Gaming & Creator GPU Lineup von NVIDIA Kerne Boost MHz Spitze FP32 Speicherbandbreite TDP SRP RTX 4090 16.384 2.520 82,6 TFLOPS 24 GB 1 1008 GB/s 450 W 1.599 $ RTX 4080 9.728 2.510 48,8 TFLOPS 16 GB/s 1 717 GB/s 320W $1,199 RTX 3090 Ti 10,752 1,860 40 TFLOPS 24GB 1 1008 GB/s 450W $1,999 RTX 3090 10,496 1,700 35.6 TFLOPS 24GB 1 936 GB/s 350W $1,499 RTX 3080 Ti 10,240 1,670 34.1 TFLOPS 12GB 1 912 GB/s 350W $1,199 RTX 3080 8,704 1,710 29.7 TFLOPS 10GB 1 760 GB/s 320W $699 RTX 3070 Ti 6,144 1,770 21.7 TFLOPS 8GB 1 608 GB/s 290W $599 RTX 3070 5,888 1,730 20.4 TFLOPS 8GB 2 448 GB/s 220W $499 RTX 3060 Ti 4,864 1,670 16.2 TFLOPS 8GB 2 448 GB/s 200 W 399 $ RTX 3060 3.584 1.780 12,7 TFLOPS 12 GB 2 360 GB/s 170 W 329 $ RTX 3050 2.560 1.780 9,0 TFLOPS 8 GB 2 224 GB/s 130 W 249 $ Hinweise

Eine unglückliche Realität für AMD und Intel NVIDIA ist in Blender wirklich schwer zu schlagen. Auch wenn eine Arc oder Radeon in einem Test mit GeForce mithalten kann, treiben NVIDIAs Stärken in anderen eher voran. Dies gilt insbesondere für das Rendering von Cycles, das viel beliebter ist als Eevee. Zumindest zum Vorteil von Radeon ist seine Eevee-Leistung stark, ebenso wie seine Viewport-Leistung.

Die Auswahl des besten „Knall-für-das-Buck“-Modells aus den obigen Aufstellungen ist schwierig, denn wenn wir ein ähnliches vergleichen Preisgünstigste GPU unter allen drei Anbietern, gibt es keinen Zweifel, dass NVIDIA die beste Gesamtleistung bieten wird. Die RTX 3070 mit ihrem empfohlenen Preis von 499 US-Dollar ist unserer Meinung nach das Modell, das dem besten Preis-Leistungs-Verhältnis am nächsten kommt, was unsere Testergebnisse unterstützen werden.

Eine andere Sache, die wir In den Testergebnissen wird sich zeigen, dass die Rendering-Leistung von Intels Cycles im Vergleich zur gleichpreisigen AMD-Konkurrenz großartig ist. Während Radeon in Eevee und dem Viewport gut genug abschneidet, schlägt Arc es in Cycles – aber auch das ist nur so wichtig, wenn NVIDIA ihnen beiden voraus ist.

Nichtsdestotrotz, hier ein kurzer Blick auf den Test Für unser Blender 3.3-Benchmarking verwendeter PC:

Alle für diesen Artikel durchgeführten Benchmarkings wurden mit einem aktuellen Windows 11 (22H2), dem neuesten AMD-Chipsatztreiber sowie dem neuesten ( zum Testzeitpunkt) Grafiktreiber. Es gibt jedoch eine Ausnahme: Auf NVIDIAs RTX 3060 Ti ~ RTX 3090 musste der 517.40-Treiber für die Cycles-Tests verwendet werden, da Studio 522.30 einen Fehler hat, der diese Renderings zum Absturz bringt.

Hier sind einige allgemeine Richtlinien, die wir befolgen:

Unterbrechende Dienste sind deaktiviert; zB: Suche, Cortana, Benutzerkontensteuerung, Defender etc. Overlays und/oder andere Extras werden nicht mit dem Grafiktreiber installiert. Vsync ist auf Treiberebene deaktiviert. Betriebssysteme werden niemals von einer Maschine auf eine andere übertragen. Wir validieren Systemkonfigurationen, bevor wir einen Testlauf starten. Das Testen beginnt erst, wenn der PC im Leerlauf ist (hält eine konstante Mindestleistung). Alle Tests werden wiederholt, bis ein hohes Maß an Vertrauen in die Ergebnisse besteht.

Dank des Inputs von Lesern haben wir einige Änderungen an dieser neuesten ausführlichen Einführung vorgenommen. Nachdem wir die BMW-und Classroom-Projekte seit der Veröffentlichung unseres Blender 2.80-Beta-Performance-Looks getestet haben, lassen wir sie ruhen und gehen zu moderneren Projekten über. Die Tests von Red Autumn Forest und Splash Fox Eevee bleiben gleich, da beide sich immer noch hervorragend zum Testen eignen.

In diesem Zusammenhang haben wir die Einstellungen bestimmter getesteter Projekte in der Vergangenheit optimiert, um dies zu erreichen Testlauf länger, aber das führte zu Verwirrung, als die Leser versuchten, ihre Leistung mit unserer zu vergleichen. In Zukunft werden wir Tests mit Testprojekten in ihrem Standardzustand durchführen, so wie sie von den Blender-Demodateien heruntergeladen werden Seite.

Verbesserungen des AMD Adrenalin-Treibers

Bevor wir uns auf die regulären Testergebnisse stürzen, wollten wir uns einen Moment Zeit nehmen, um über einige Radeon-Verbesserungen zu sprechen, die den Treiber umgehauen haben die letzten sechs Monate. Während unsere Ergebnisse die Tatsache unterstreichen werden, dass NVIDIA derzeit die stärkste Blender-Option ist, ist es dennoch entscheidend, dass AMD (und Intel) ihre Treiber für Blender weiter aufpolieren, und AMD hat dies in diesem Jahr mit Sicherheit getan.

Mit Hilfe der Radeon RX 6700 XT ist hier ein schneller Vergleich der Leistungsverbesserungen von Blender, die zwischen der Veröffentlichung der Treiber 22.5.1 im Mai und 22.10.2 im Oktober zu sehen waren:

AMD Adrenalin 22.5.1 vs. 22.10.2. 22.5.1 Material 4K 46 FPS 46 FPS Viewport Solid 4K 165 FPS 281 FPS Viewport Wireframe 4K 77 FPS 104 FPS Et cetera

Wir haben nicht alle unsere Vergleichsdaten oben gepostet, werden aber bemerken, dass einige der Viewport-Subtests zeigte eine leichte Verschlechterung (es hängt wirklich vom Projekt ab). Insgesamt bringt der neueste Radeon-Treiber in Blender aber einen enormen Leistungsschub – nicht nur beim Rendern, sondern auch beim Viewport. Noch besser: Sowohl Cycles als auch Eevee verzeichneten großartige Verbesserungen der Renderzeit.

AMD verdient Lob für seine Bemühungen zur Verbesserung der Blender-Leistung, und wir hoffen, dass es im Laufe der Zeit immer besser wird. Die RDNA3-GPUs der nächsten Generation des Unternehmens sind gleich um die Ecke, also sind wir auch gespannt, wie sich diese schlagen werden.

Zum Thema neuer GPUs ist dies der erste Einblick in Blender haben gepostet, Intel Arc-Grafikkarten sowie NVIDIAs Top-End GeForce RTX 4090 einzuschließen. Diese und 15 andere GPUs haben uns geholfen, viele Leistungsdaten zu generieren, also kommen wir dazu:

GPU-Zyklen: AMD HIP, Intel oneAPI & NVIDIA OptiX

Vielleicht das Offensichtlichste Was man diesen ersten Ergebnissen entnehmen kann, ist, dass NVIDIA das Rendering von Cycles dominiert. Seine OptiX-API nutzt die Raytracing-Kerne von RTX in hohem Maße aus, und das zeigt sich. Je nach Projekt sitzt AMDs Top-End-Radeon RX 6900 XT entweder hinter der GeForce RTX 3070 der Mittelklasse oder der RTX 3050 der Einstiegsklasse. AMD zeigte besondere Stärke im Projekt White Lands, obwohl es die günstigeren NVIDIA-Optionen bleiben immer noch einen Platz davor.

Es ist gut, dass AMD seine Blender-Leistung in den letzten Treibern verbessert hat, denn sonst würde es noch weiter zurückfallen und noch fragwürdiger gegenüber Intels brandneuem aussehen Arc-Wettbewerb. Selbst ohne beschleunigte Raytracing-Funktionen in Blender schneidet Intels Arc recht gut ab, wobei der A770 knapp hinter AMDs RX 6800 oder RX 6800 XT liegt – aber immer noch weit hinter NVIDIAs Hauptkonkurrenten. Sowohl im Secret Deer-als auch im Scanlands-Projekt dominiert NVIDIA die obere Hälfte der Charts.

Es ist auch erwähnenswert, dass die RTX 4090 wirklich schnell ist. Sein Gewinn gegenüber der RTX 3090 im Secret Deer-Test scheint bescheiden, aber er sprang in den anderen nach vorne – und halbierte fast die resultierende Renderzeit. Es sollte interessant sein zu sehen, wie sich all diese Skalierungen ändern, wenn mehr Ada Lovelace-basierte GeForces veröffentlicht werden.

Was die beste Karte mit dem besten Preis-Leistungs-Verhältnis betrifft, so scheint das immer noch die zu sein GeForce RTX 3070 mit 500 US-Dollar UVP. Die beim 3070 Ti beobachteten Gewinne skalieren nicht besonders gut mit der Preiserhöhung, daher bleibt RTX 3070 der Sweetspot.

Eevee-GPU: AMD, Intel und NVIDIA

Wie wir oben gesehen haben, ist NVIDIA schwer (nun, unmöglich) zu erreichen Rendering-Zyklen, aber zugunsten von AMD und Intel haben die beschleunigten Raytracing-Kerne des grünen Teams keinen Einfluss auf die Leistung von Eevee. Obwohl AMD hier insgesamt eine stark verbesserte Leistung zeigt, ist es klar, dass Intels Arc etwas Treiberpolitur gebrauchen könnte, um die Eevee-Leistung zu verbessern, da es hinter der gesamten Sammlung von AMD-und NVIDIA-Karten zurückbleibt.

Das ist es Es ist schön zu sehen, dass sich das höhere Leistungsniveau der RTX 4090 auf das Eevee-Rendering überträgt, wobei eine große Menge Zeit vom Red Autumn Forest-Projekt abgeschnitten wird. Die Splash Fox-Leistungsunterschiede zwischen dem 3090 und dem 4090 sind viel geringer, was durch die Tatsache erklärt werden kann, dass das Projekt die CPU zwischen den einzelnen Frames viel mehr beansprucht als Red Autumn Forest.

Abschließend-up this performance look, werfen wir einen Blick auf die Viewport-Performance:

Viewport: Material Preview, Solid & Wireframe

In den meisten Fällen geben uns diese Viewport-Ergebnisse die am meisten erwartete Skalierung des Bündels. Es gibt jedoch einige Ausnahmen, z. B. wie Intels Arc in der Wireframe-Leistung weit hinter den anderen zurückbleibt. Unterdessen ist es schön zu sehen, dass AMD zwar die Rendering-Leistung verbessern konnte, aber mit allen drei getesteten Viewport-Modi gut abschneidet und nahe an der relevantesten NVIDIA-Konkurrenz bleibt.

Natürlich sinkt die Leistung, wenn die Bildschirmauflösung abnimmt erhöht:

Diese Ergebnisse weitgehend Skalierung wie erwartet, obwohl es seltsam erscheint, dass die RTX 4090 die 4K-und 1440p-Tests dominiert, bei 1080p jedoch irgendwie hinter AMDs Top-End-Karten zurückfällt. Bei dieser Auflösung übertrifft die gesehene Leistung bei weitem das, was die meisten Leute brauchen, aber es ist trotzdem interessant.

Interessant ist auch, wie sich die Skalierung für Radeon-Karten in diesem speziellen Test verhält. Wenn Sie sich eine andere Version des 1080p-Diagramms ansehen, werden Sie feststellen, dass das Leistungsdelta zwischen der unteren und der oberen Hälfte des aktuellen Radeon-Stacks enorm ist. Wir haben keine Ahnung, warum dies der Fall ist, insbesondere da wir es in den folgenden Tests nicht sehen, aber leider ist es nur noch seltsamer, darüber zu sprechen.

Um zu sehen, wie sich die Skalierung in anderen Projekten ändern könnte haben wir auch den Materialvorschaumodus in Barbershop (Cycles) und PartyTug 6:00AM (Eevee) mit den drei Auflösungen getestet:

In beiden Tests konnte sich die RTX 4090 wirklich am häufigsten von den anderen abheben, mit besonderer Stärke bei 4K. Glücklicherweise bieten die meisten Karten hier ausreichend Leistung, aber wir empfehlen, auf Karten abzuzielen, die bei Ihrer Zielauflösung etwa 45 FPS erzielen.

Etwas, das die obigen Grafiken nicht hervorheben, ist, dass sich jeder Anbieter verhält anders beim Kompilieren von Shadern nach dem Aktivieren des Materialvorschaumodus. Unsere automatisierten Tests ergaben keine Ergebnisse für Arc mit dem Barbershop-Projekt, also haben wir nachgeforscht und festgestellt, dass Intels Kompilierung viel langsamer ist als die anderen:

AMD Intel NVIDIA First Load 59 s 340 s 190 s Second Load 35 s 130 s 7 s Et cetera

Es ist interessant, hier die Unterschiede zu sehen, denn jeder Anbieter könnte in einer anderen Hinsicht besser sein. NVIDIAs erster Start von Material Preview ist langsamer als der von AMD, aber die nachfolgenden Starts sind viel schneller. Unterdessen sind die nachfolgenden Markteinführungen von AMD immer noch langsam, aber nicht im Vergleich zu Intel, das entweder beim ersten oder zweiten Mal in bemerkenswertem Maße langsam ist. Hoffentlich werden zukünftige Treiber-Updates für alle drei Anbieter die langen Ladezeiten glätten.

Beachten Sie, dass das genaue GPU-Modell in diesen Tests keine Rolle spielt; die Architektur tut es. Eine Low-End-Karte sollte Shader genauso schnell kompilieren wie ein High-End-Modell der gleichen Generation.

Zusammenfassung

Wenn wir regelmäßige Blender-Performance-Deep-Dives produzieren, gibt es immer eine Sorge, dass die neueste Version genauso funktionieren wird wie die letzte, und sich daher die Veröffentlichung des neuesten Artikels möglicherweise nicht so zufriedenstellend anfühlt. Nun, mit der Einführung der Intel Arc-Unterstützung und ganz zu schweigen von der darin enthaltenen neuen NVIDIA GeForce RTX 4090 hatten wir definitiv Potenzial für interessante Ergebnisse in diesem Artikel – und das hatten wir auf jeden Fall.

Wir haben das Gefühl, dass wir hier ein totes Pferd schlagen, aber es ist wieder einmal schwer, die Dominanz von NVIDIA in Blender zu ignorieren. Das ist vor allem der effektiven Raytracing-Beschleunigung in Cycles zu verdanken. Wenn Sie sich also mehr auf Eevee konzentrieren, erhalten Sie relevantere Optionen zur Auswahl. Wie oben erwähnt, hat AMD in den letzten paar Monaten einige große Fortschritte bei der Leistung von Blender gemacht, was großartig zu sehen ist, und wir hoffen, dass es im Laufe der Zeit immer besser wird.

Auf der Seite von Intel, es schnitt im Cycles-Test recht gut ab, zumindest im Vergleich zu AMD. Die Tatsache, dass die Launch-Arc-Karten so gut gegen die Radeons abschneiden, unterstreicht die Tatsache, dass die Leistung von AMD mehr gelitten hat, als ideal war. Wenn ein neuer Anbieter auftaucht und die doppelte Rendering-Leistung bietet, ist das schwer zu ignorieren. In allen drei oben genannten Cycles-Tests platzierten sich die besten Arc-Karten direkt hinter den High-End-RDNA2-basierten Radeons von AMD.

Bei NVIDIA haben wir gesehen, dass es über die gesamte Bandbreite von wettbewerbsfähige Leistung bietet Blender-Tests, mit besonderer Dominanz in Cycles. Wir können es wirklich kaum erwarten, dass sowohl AMD als auch Intel die beschleunigte RT auf Blender treffen, da dies die Leistung von Cycles ein wenig erschüttern sollte. Wir sind uns immer noch nicht sicher, wann diese Ergänzungen kommen, aber sie können eindeutig nicht schnell genug hier sein.

Unterstützen Sie unsere Bemühungen! Mit Werbeeinnahmen zu jeder Zeit niedrig für geschriebene Websites, verlassen wir uns mehr denn je auf die Unterstützung der Leser, die uns dabei hilft, weiterhin so viel Mühe in diese Art von Inhalten zu stecken. Sie können uns unterstützen, indem Sie Patron werden oder unsere Amazon-Shopping-Affiliate-Links verwenden, die in unseren Artikeln aufgeführt sind. Vielen Dank für Ihre Unterstützung!

By Henry Taylor

Ich arbeite als Backend-Entwickler. Einige von Ihnen haben mich vielleicht auf der Entwicklerkonferenz gesehen. In letzter Zeit arbeite ich an einem Open-Source-Projekt.