Entwicklerblog | NXT - Gielinor in einem neuen Licht

23 Februar 2016 K�nftige Updates

Im Entwicklerblog dieser Woche schauen wir uns unsere tapferen Grafik-Architekten an, wie sie die Herausforderung gemeistert haben, 15 Jahre Inhalte von RuneScape auf einer noch nie dagewesenen Bandbreite an Ger�ten gut aussehen und laufen zu lassen, indem sie eine einzigartige Bandbreite an sowohl alten als auch neuen Rendering-Techniken einsetzen.

Wenn ihr angehende Grafikentwickler oder Technikfans seid, dann d�rfte euch dies ganz besonders interessieren!

Bisher haben unsere Entwicklerblogs kaum an der Oberfl�che der aufregenden Features gekratzt, die den neuen RuneScape-Client so au�ergew�hnlich machen. In diesem Blog sehen wir uns diese Features mal genauer an, wie sie umgesetzt werden und warum wir uns f�r sie entschieden haben.

Eine der gr��ten Herausforderungen bei der Entwicklung von NXT war es, die grafische Wiedergabe und Liestungsst�rke zu verbessern, w�hrend das Spiel immer noch so aussieht wie das RuneScape, das ihr alle so gerne spielt. Und so haben wir das geschafft.

Globale Beleuchtung

Mithilfe der globalen Beleuchtung geben Spiele und Filme indirektes Licht in einer Szene wieder (z.B. reflektiertes Licht). Ohne eine globale Beleuchtung w�re jedes Pixel im Schatten schwarz.

Keine globale Beleuchtung

Dies ist bei den interaktiven Raten extrem schwierig zu l�sen, sodass selbst heute noch die meisten Spiele offline einen Vorbearbeitungsalgorithmus benutzen, um globale Lichtergebnisse in Lightmaps zu integrieren, damit diese beim Laufen schnell nachgeguckt werden k�nnen.

Die klassische Technik bei �lteren Spielen war beispielsweise die sogenannte Pre-Baked Radiosity (z.B. bei Quake und Half-Life), aber in letzter Zeit wurden mehr Details der globalen Beleuchtung in die Lightmaps mit eingebaut, wie Kugelfunktionen (Spherical Harmonics) und Oberfl�chensichtbarkeit (Surface-To-Surface Visibility), was den zus�tzlichen Bonus hat, dass die globale Beleuchtung mit Normal Maps von sich bewegenden Lichtern funktioniert.

Als allerneueste Technik sind nun reine Echtzeit-L�sungen aufgetaucht (Light Propagation Volumes und Voxel Cone Tracing), aber diese Techniken sind noch nicht voll ausgereift und ben�tigen sehr gute Grafikprozessor-Technologien, um effektiv zu laufen.

Das ist etwas, was wir bei unserem neuen Client wirklich verbessern wollten, aber aufgrund der Einschr�nkungen unserer Tools und der schieren Gr��e von RuneScape war eine Offline-L�sung der globalen Beleuchtung einfach keine brauchbare Option. Zus�tzlich dazu wollten wir nat�rlich auch etwas entwickeln, das auf so vielen Computern wie m�glich laufen wird.

Also haben wir tief in unsere Grafiktoolbox gegriffen und uns f�r eine modernere Version von Hemisphre Lighting entschieden, bei der Irradiance Environment Maps durch Spherical Harmonics fusioniert werden.

Hemisphere Lighting verwendet eine manuell platzierte Sph�re in allen Umgebungen, um einen Farbverlauf von Himmels- bis zu den Bodenfarben zu definieren. Der Normalenvektor der Szenengeometrie wird dann verwendet, um eine Farbe von dieser Sph�re zu bestimmen. Wenn eine Oberfl�che also beispielsweise in den Himmel gerichtet ist, wird die Farbe oben auf der Sph�re ausgew�hlt und so weiter.

Wenn unsere Grafiker all diese Lichtsph�ren selber h�tten herstellen m�ssen, w�re das sehr zeitaufw�ndig gewesen und h�tte gr��ere Instandhaltungskosten bedeutet. Daher haben wir uns f�r eine Echtzeit-Programmierungsl�sung entschieden.

Hierbei wird, nachdem die Kartenbereiche geladen wurden, hoch in der Luft �ber mehrere Frames hinweg eine Lichtsonde gerendert (Global Environment Map), wodurch die Spherical Harmonics davon in Echtzeit integriert werden und wir eine h�chst komprimierte Irradiance Environment Map in Form von Koeffizienten aus Spherical Harmonics erhalten.

Diese Koeffizienten werden dann im Pixel Shader mit intelligenter Mathematik benutzt, um den Normalenvektor als Dateneingabe zu verwenden, damit wir die Beleuchtungsdichte bei diesem Pixel erfahren. Ultimativ erhalten wir dadurch eine einzelne indirekte Lichtreflexion vom Sonnenlicht (Irradiance Lighting) - oder, wie wir es gerne nennen, Hemisphere Lighting nach ner Steroiden�berdosis!

Zus�tzlich zum Irradiance Lighting haben wir unserem Lichtblender eine Umgebungsverdeckung (Ambient Occlusion) hinzugef�gt. Ambient Occlusion simuliert sanfte, kleinr�umige Schatten aus der Umgebungsbelichtung je nachdem, wie sichtbar eine Oberfl�che ist. Hierf�r haben wir uns f�r eine Screen-Space Ambient Occlusion (SSAO) namens Horizon-Based Ambient Occlusion entschieden, die gerade so ziemlich das Beste auf dem Markt ist.

Anders als bei den meisten Spielen, die die SSAO als Nachbearbeitung benutzen - was zu ziemlich schlechten und nicht �berzeugenden Resultaten f�hren kann - wird unsere Ambient Occlusion vorher beim Forward Lighting Pass nur f�r indirekte Umgebungsbeleuchtung verwendet. Dadurch weisen Pixel, die direkt beleuchtet werden, nicht zu viel Ambient Occlusion auf, was physisch korrekter ist. Unsere SSAO wird auch mit voller Aufl�sung durchgef�hrt, wodurch stabilere Resultate erzielt werden.

Die folgenden Screenshots zeigen euch unsere kombinierten L�sungen f�r die Irradiance und Ambient Occlusion. Hoffentlich stimmt ihr uns zu, dass die Resultate eine bedeutende Verbesserung im Vergleich zu den Ergebnissen des alten Java-Clients sind.

Globale Beleuchtung bei Java

Globale Beleuchtung bei NXT

Globale Beleuchtung bei Java

Globale Beleuchtung bei NXT

HDR, Gamma Correct Rendering und Tone Mapping

Ein weiterer Grund, warum der Java-Client so flach, matt und �bers�ttigt aussieht, ist, dass er die ganze Bandbreite an Farben und Lichtintensit�ten in der Szene nicht wiedergeben kann. Um diese Situation zu verbessern, mussten wir erst sicherstellen, dass die Grafikprozessoren alle Lichtkalkulationen in einem linearen Raum berechnen.

Alle Grafikprozessoren f�hren ihre Rechnungen mit Hochpr�zisions-Flie�kommamathematik aus, doch um g�nzlich hiervon profitieren zu k�nnen, m�ssen die Daten f�r die Lichtberechnungen w�hrend der Shaderausf�hrung ebenfalls in einem linearen Raum sein. Daher mussten wir sicherstellen, dass die Texturen aus dem Spiel - die aus Photoshop in einem sRGB-Raum gespeichert werden - in einen linearen Raum konvertiert werden, bevor sie von den Shadern genutzt werden.

Diesen Prozess wenden wir auch bei anderen durch unsere K�nstler definierte Daten an, wie Licht- und Nebelfarben. Die meisten Grafikprozessoren k�nnen diese Umwandlung vom sRGB- zum linearen Raum durchf�hren. Ist dies nicht der Fall, haben wir jedoch auch die M�glichkeit, dies manuell zu tun. Hierdurch stellen wir sicher, dass die hochdynamische Bandbreite des Lichts nicht durch nichtlineare Daten verdorben wird und dass die Belichtung in der Szene konsistent bleibt. Au�erdem verhindern wir so, dass Gegenden, die sehr gut beleuchtet sind, zu schnell 'vergl�hen', wodurch die Lichtdetails zerst�rt werden k�nnen.

Der n�chste Bestandteil, um eine volle HDR (hochdynamische Reichweite) beim Rendering zu erreichen, liegt darin, dass wir die Resultate der Lichtberechnungen des linearen Raums in Texturen au�erhalb der Bildfl�che speichern, die selber ihre Linearit�t beibehalten k�nnen, indem sie das Flie�komma-Format verwenden. Flie�komma-Texturen k�nnen jedoch teuer werden, daher versuchen wir immer ein gepacktes Flie�kommatexturformat zu verwenden, wenn es zur Verf�gung steht.

Das Sahneh�ubchen auf dem HDR-Kuchen ist das Tone Mapping, ein Prozess, der Farbbereiche miteinander kartografiert. In unserem Fall bedeutet das, dass lineare Lichtergebnisse der HDR in eine Bandbreite umgewandelt werden, mit der der Bildschirm klarkommt, da Bildschirme nur Werte im niedrigen Bereich (Low Dynamic Range) anzeigen k�nnen.

Ohne Tone Mapping w�rde eine direkte Umwandlung von einer hohen in eine niedrige dynamische Reichweite zu einem Verlust von Lichtinformationen und einem unsch�nen Aussehen f�hren. Daher mussten wir unerm�dlich mit den K�nstlern zusammenarbeiten, um viele verschiedene Tone-Mapping-Formeln auszurechen, um zu einem Ergebnis zu kommen, das dem bestehenden Aussehen von Runescape am meisten �hnelt und gleichzeitig eine gute dynamische Bandbreite an Farben und Lichtintensit�t bietet. Das haben wir in der Form vom sogenannten Filmic Tone Mapping erreicht.

Echtzeit-Schatten

Bei den meisten Spielen, die ihre globale Beleuchtung offline berechnen k�nnen, sind Schatten, die bei statischer Szenengeometrie durch dominante Lichtquellen ausgel�st werden (z.B. Sonnenlicht), meistens als Teil dieses Lichtintegrierungsprozesses mit inbegriffen (Schatten sind eigentlich Teil der globalen Beleuchtung, aber darauf werden wir in diesem Blog nicht n�her eingehen). Dies war erneut keine Option f�r uns, also haben wir uns f�r eine voll dynamische L�sung entschieden. Die Herausforderung bei einem voll dynamischen Echtzeit-Schattensystem ist es, sowohl eine gute Qualit�t als auch eine gute Leistungsf�higkeit zu erreichen. F�r Qualit�t und Leistungsf�higkeit liegt die beste Technik, um Echtzeit-Schatten mit modernen Grafikprozessoren zu rendern, im Shadow Mapping. Bei jedem Algorithmus f�r das Shadow Mapping gibt es jedoch zwei Hauptprobleme: Projective und Perspective Aliasing, haupts�chlich aufgrund fehlender Aufl�sung in der Shadow Map. Ohne eine ausreichende Aufl�sung k�nnen mehrere Shadow-Map-Texel zu einem einzigen Screen-Pixel kartiert werden, wodurch es zu schweren Aliasing-Bildfehlern kommen kann.

Wir haben uns f�r das Format der Parallel Split Cascaded Shadow Map entschieden, wo die sichtbare Szene in zwei Segmente unterteilt wird, wobei jedes Segment einer einzigen Shadow Cascade entspricht, wodurch ein besseres Verh�ltnis von Shadow Texel Map zu Screen Space Pixeln erreicht wird. Dadurch wird das Perspective Aliasing bedeutend verbessert, was ansonsten sichtbar w�re, wenn nur eine einzige Shadow Map f�r die ganze Szene verwendet werden w�rde. Der Nachteil dabei ist jedoch, dass die Szene f�r jede Shadow Map Cascade noch mal gerendert werden muss, wodurch die Anzahl an gezeichneten Objekten f�r jede Frame massiv erh�ht wird und die Leistungsst�rke des Clients extrem beeintr�chtigt werden kann.

Eine mehrgleisige Herangehensweise war also n�tig, um diese Explosion von Draw Calls abzuschw�chen. Es gibt verschiedene Stufen von Culling, die mit jedem Shadow Cascade Render Pass angewendet werden, inklusive dem View Frustum Culling, Distance-Based Culling, Shadow Map Area Culling und Shadow Caster Volume Culling. Zus�tzlich dazu k�nnen wir mehr Objekte bearbeiten, indem wir verschiedene Vermutungen �ber die Szene anstellen. Zum Beispiel rendern wir keine flachen Gebiete in der Shadow Map, da sie wahrscheinlich keine Schatten auf die Szene werfen und aktualisieren entfernte Cascades nur in abwechselnden Frames, um die Anzahl der Draw Calls zu verringern.

Um das Problem mit dem Shadow Map Aliasing weiter zu reduzieren, verwenden wir f�r die entfernten Cascades, die mehr von der sichtbaren Szene abdecken, einen Algorithmus, der allgemein als Unit Cube Clipping bekannt ist und die orthografische Projektion der Shadow Map den sichtbaren Werfern/Empf�ngern entsprechend anpasst. Dadurch kann die Verwendung der Shadow Map in vielen Szenen bedeutend verbessert werden.

Wir m�ssen daf�r sogen, dass jeder Draw Call f�r eine Shadow Map so g�nstig wie m�glich ist. Dazu verwenden wir eine Reihe an Tricks, wie etwa die Deaktivierung von Farbenaufzeichnungen, das angepasste Schneiden von Vertex Shadern, Null Pixel Shadern und Minimal-Vertexformaten. Dadurch wird die Nutzung des Grafikprozessor w�hrend des Generierens von Shadow Maps auf ein Minimum reduziert.

Das letzte St�ck der Qualit�t und Leistungsst�rke bei allen Techniken des Shadow Mappings liegt in der Filterung, um sanfte Schattenkanten zu erreichen. Wir nutzen die Vorteile des GPU PCF (Percentage Closer Filtering) Hardware Shadow Map Filtering g�nzlich aus, wodurch wir geschmeidig eingef�gte Muster der Shadow Map erhalten. Kombiniert mit Multifilter-Systemkernen und besonderen Textur-Nachschlagefunktionen, um die Nutzung des allgemeinen Registers zu reduzieren, erlaubt es uns, weiche Schatten mit einer hohen Leistungsrate zu erzielen.

Wenn ihr es bis hierher geschafft habt, dann ist euch mittlerweile bestimmt bewusst, wie sehr das Echtzeit-Rendering der Shadow Map einem wie Jedik�nste vorkommen k�nnen, aber die Resultate sind die Arbeit wirklich wert!

Light Indexed Deferred Lighting

Die Umgebungen in RuneScape verf�gen wirklich �ber sehr viel Licht. Der neue Client f�hrt alle Berechnungen f�r die Beleuchtung pro Pixel durch, ohne jegliche Offline-Lichtintegrierung, wodurch wir jegliches Licht als dynamisch ansehen m�ssen. Ein moderner Ansatz einer derart dynamisch beleuchteten Szene ist das Fully Deferred Shading. Diese Art der verz�gerten Schattierung hat jedoch ihre eigenen Nachteile und w�re keine brauchbare L�sung f�r uns, w�hrend wir immer noch die Ger�te mit niedriger Leistungsf�higkeit unterst�tzen wollen.

Daher wollten wir also bei unserer Vorw�rtsrendering-Technik beim Licht bleiben. Die Standardherangehensweise bei Licht mit 8-16 Lichtelementen pro Objekt war jedoch aufgrund der Gr��e von den Geometriepaketen einfach nicht ausreichend. Wir mussten also mal wieder etwas unkonventionell denken!

Wir haben uns f�r eine L�sung entschieden, die als Light-Indexed Deferred Lighting bekannt ist, was ungef�hr in der Mitte zwischen Fully Deferred Shading und Forward Lighting liegt. Dadurch k�nnen wir bis zu vier Lichter pro Pixel unterst�tzen und es passt perfekt in unseren Forward-Lighting-Renderingprozess. Das hat so ziemlich all unsere N-Licht-Probleme f�r gro�e statische Geometriepakete gel�st, w�hrend es immer noch die MSAA-Unterst�tzung und verschiedene Lichtformeln f�r zuk�nftige Materialvariationen zul�sst.

Viele Lichtpunkte

Atmosph�rische Lichtstreuung

Bei der gr��eren Sichtweite wussten wir, dass der Distanzen-Nebel von Java einfach nicht gut genug w�re. Wir haben damit angefangen, den distanzbasierten Nebel komplett zu entfernen und ihn mit einer physischbasierten, atmosph�rischen Lichtstreuungstechnik zu ersetzen, was gut aussah, uns jedoch nicht komplett erlaubte, die Grenzen der Welt zu verdecken. Also haben wir uns daf�r entschieden, den alten Distanzen-Nebel mit unserer neuen atmosph�rischen Lichtstreuung zu verbinden, um eine Hybridl�sung zu bekommen, die den alten Nebel verbessern kann. Das Endresultat hat uns einen viel nat�rlicher aussehenden Nebel f�r die Szene eingebracht - vor allem bei gr��erer Sichtweite - und uns auch geholfen, einen besseren Eindruck von Tiefe hervorzurufen.

Wasser-Rendering

Ein Schl�sselfeature des neuen Effektsystems ist definitiv der neue Wasser-Shader. Wie bei quasi allem anderen auch haben wir den Shader v�llig neu entwickelt, haben allerdings au�erdem noch die k�hne Entscheidung getroffen, auf das alte Java-Datenset zur�ckzugreifen, um verschiedene Probleme zu verbessern, die wir von HTML5 geerbt haben. Wir nutzen die Wasserdaten immer noch f�r Echtzeit-Ebenenreflexionen, aber die Wassergeometrie an sich wird nun wieder von dem Java-Datenset hergestellt, wodurch die K�nstler nicht mehr zur�ckgehen mussten, um alle Patches noch mal zu machen, was uns richtig viel Entwicklungszeit gespart hat.

Der Shader selbst basiert auf vielen Elementen, um den endg�ltigen Look zu erzielen. Die zwei Hauptkomponenten von allen Wasser-Renderingsystemen ist die Unterst�tzung von Echtzeit-Reflexionen und Lichtbrechungen, die waren also ein Muss. Zus�tzlich dazu stellen wir noch sicher, dass das Licht auf dem Wasser richtig mit unserem Schattensystem funktioniert, sodass direkte Spiegelungen nun korrekt abgedeckt werden, wo Schatten hinfallen. Der Welleneffekt wurde ebenfalls verbessert, indem ge�ndert wurde, wie die Water Normal Maps abgefragt werden, wo es keine oder kaum Verzerrungen gibt, was Bildfehler bedeutend reduziert, die man sonst oft bei Wassereffekten sieht. Und letztlich haben wir mit dem alten Datenset Zugang zu verbesserten Tiefeninformationen f�r Unterwassergebiete erhalten, wodurch wir verschiedene Komponenten wie Nebel und Wellenverzerrungen ausblenden konnten, wenn das Wasser auf Landmasse trifft.

Hoffentlich stimmt ihr uns zu, dass einem bei den Ergebnissen wirklich das Waser im Mund zusammenl�uft!

Zusammenwirkung von Schatten, Licht und Wasser

Reduzierungstechniken f�r Draw Calls

Obwohl es an sich kein Feature ist, w�re es nachl�ssig von mir, wenn ich einen der Hauptgr�nde nicht nennen w�rde, warum wir eine bessere Leistung als Java erreichen konnten, w�hrend wir dennoch so viel mehr rendern. Ich bin bereits kurz darauf eingegangen, wie wir die Draw Calls f�r unser Shadow Map Rendering bedeutend verringern konnten, aber noch wichtiger war es, die Draw Calls f�r das Forward Lighting und die Szenentiefe zu reduzieren.

Das wahrscheinlich teuerste Element einer Spielengine in Bezug auf Prozessor/Grafikprozessorzeiten ist es, eine Anfrage zu senden, Objekte direkt auf dem Bildschirm zu zeichnen. Die Kosten sind dabei zweif�ltig: Erstmal muss man die Kosten des Overhead-Grafiktreibers f�r Draw Calls beim Nutzen von Grafikprozessor-Befehlbuffern tragen und zweitens kommen noch die eigentlichen Grafikprozessor-Kosten bei der Verarbeitung von Eckpunkten und Pixeln auf einen zu.

Ich hatte bereits das standardm��ige View Frustum und Distance-Based Object Culling erw�hnt, aber durch die bedeutend h�heren Kosten bei den Forward Lighting Pass Draw Calls im Vergleich zu einfachen Shadow Pass Draw Calls mussten wir noch einen draufsetzen.

Die gr��te Kosteneinsparung f�r Draw Calls kommt von unserem dynamischen Geometrie-Batching-System. Wenn Objekte geladen werden, werden sie auch in Gruppen eingeteilt, die dasselbe Material teilen, und dann physisch zusammengef�gt, damit sie in einem einzigen Draw Call gerendert werden k�nnen. Dies hat jedoch auch einen Nachteil, da ein komplexes Texture-Atlas-System ben�tigt wird, damit auf alle Texturen von diesen gruppierten Objekten �ber eine einzelne Texturseite zugegriffen werden kann. Dies hat den Dominoeffekt, dass die Gr��e der Modeleckpunkte aufgrund der zus�ztlich ben�tigten Information, um die Texturen eines Objektes in diesen Atlas-Systemen abzurufen, aufgebl�ht wird, zusammen mit einer erh�hten Anzahl an Anweisungen f�r den Pixel Shader. Diese zus�tzlichen Kosten sind jedoch immer noch gering im Vergleich zum Nettogewinn f�r die Leistung aufgrund der massiven Reduzierung der Draw Calls durch die Pakete. Dasselbe Paketsystem wird auch bei allen anderen Renderinganfragen genutzt, um die Draw Calls noch mehr zu reduzieren.

Jede Farbe bedeutet einen einzelnen Draw Call Batch

Der letzte Bestandteil unserer Kostenreduzierung f�r Draw Calls liegt in unserem einzigartigen und innovativen Culling-System. Anders als bei den meisten L�sungen f�r Occlusion Culling, f�r die eine Offline-Szenenverarbeitung ben�tigt wird, um potenziell sichtbare S�tze an Orten in der Welt zu generieren, sowie handgemachte Occluder-Geometrie f�r Echtzeit-L�sungen ben�tigt unser Ansatz keines von beidem. Dies entstand haupts�chlich, da es nicht m�glich war, die gro�en Mengen an Umgebungen von RuneScape offline zu verarbeiten oder - aufgrund von geringen Kunstressourcen - Proxy Occluder Geometry f�r eine Onlinel�sung zu generieren. Daher haben wir eine Hybrid-Technik entwickelt, die einen Software Rasteriser zum Ausf�hren von Occlusion-Anfragen kombiniert. Anstatt jedoch die Tiefendaten der Szene auf Seiten des Prozessors zu generieren, transferieren wir die Buffer-Daten der Szenentiefe, die durch vorherige Frames generiert wurden, um unsere Anfragen zur Software Occlusion vom Prozessor zu versorgen. Der Tiefenbuffer-Read-Back vom Prozessor und die Anfragen zur Software Occlusion haben hohe Fixkosten, aber in Szenen mit hoher Tiefenkomplexit�t sind die Reduzierungen der Draw Calls hoch genug, dass wir betr�chtliche Nettogewinne bei der Leistung sehen, vor allem bei Ger�ten mit schlechteren Grafiktreibern.

Viel Spa�!

Ich hoffe, dieser Entwicklerblog war aufschlussreich und hat euch gezeigt, was f�r eine Herausforderung es war, euch einen neuen Client zu bieten, der mit 15 Jahren Inhalten besser l�uft und auch besser aussieht als der alte Java-Client.

Wir glauben, dass die Entscheidungen, die wir w�hrend dieses Projekts getroffen haben, ein starkes Fundament sind, auf dem RuneScape nun aufbauen kann, um euch in den kommenden Jahren eine noch bessere Grafik und Leistungsst�rke bieten zu k�nnen.

Mod Lordgit
Leitender Grafik-Programmierer

Zur�ck nach oben