W świecie gier komputerowych, gdzie niemal każda klatka obrazu podlega zaawansowanej obróbce w czasie rzeczywistym, trafna i miarodajna ocena jakości grafiki staje się coraz trudniejszym wyzwaniem. W odpowiedzi na nie Intel opracował przełomowe narzędzie: Computer Graphics Visual Quality Metric (CGVQM). To nowoczesny wskaźnik oceny jakości grafiki komputerowej oparty na sztucznej inteligencji.
W artykule znajdziesz:
Dotychczasowe podejścia, jak choćby klasyczny PSNR (Peak Signal-to-Noise Ratio) czy SSIM (Structural Similarity Index), dobrze sprawdzają się w analizie statycznych obrazów czy prostych artefaktów wynikających z kompresji stratnej. Problem w tym, że nowoczesny gaming generuje znacznie bardziej złożone zniekształcenia. Mowa tu o zjawiskach takich jak ghosting (efekt ducha), aliasing, migotanie detali (flickering), rozmycie krawędzi czy subtelne błędy interpolacji klatek. Wszystko to wpływa bezpośrednio na odbiór grafiki – niezależnie, czy używa gamingowego laptopa, czy gamingowego komputera stacjonarnego.
Intel dostrzegł lukę między subiektywnym doświadczeniem gracza a możliwościami klasycznych narzędzi. W efekcie postanowił zaprojektować rozwiązanie, które będzie w stanie analizować obraz w sposób zbliżony do percepcji ludzkiego oka, ale z obiektywną precyzją charakterystyczną dla maszyn.
W ramach swojego projektu badawczego Intel stworzył dwa główne komponenty:
Na czym to polega? Zespół badaczy – w jego skład weszli Akshay Jindal, Nabil Sadak, Manu Mathew Thomas, Anton Sochenov oraz Anton Kaplanyan – dokładnie przeanalizował różnorodne artefakty pojawiające się podczas korzystania z takich technologii jak upscaling, interpolacja, ray tracing, rekonstrukcja obrazu czy neuronowe odszumianie. Następnie, na podstawie rzeczywistych fragmentów wideo, wytrenowano sieć neuronową, której zadaniem było nauczyć się oceniać jakość obrazu tak, jak robiłby to człowiek.
Aby zapewnić wysoką wiarygodność wyników, Intel przeprowadził testy percepcyjne z udziałem ludzi. Uczestnicy oceniali jakość krótkich sekwencji z gier. Następnie wskazywali, które fragmenty uznają za bardziej poprawne wizualnie. Dane te posłużyły jako „złoty standard” do trenowania modelu AI.
Główna architektura oparta została na trójwymiarowej sieci konwolucyjnej (3D-CNN), wykorzystującej wariant ResNet-18. To popularny model znany z wysokiej skuteczności w analizie obrazów. Z kolei ten nazwany CGVQM-5 (bardziej złożony) oraz jego uproszczona wersja CGVQM-2 potrafią analizować zarówno informacje przestrzenne (piksele w 2D), jak i czasowe (zmiany między klatkami). To właśnie ten element – analiza temporalna – jest kluczowy w kontekście gier wideo, gdzie jakość obrazu zmienia się dynamicznie z każdą kolejną klatką niezależnie od wykorzystywanej karty graficznej.
W testach porównawczych CGVQM-5 osiągał wyniki niemal identyczne z ocenami ludzkich uczestników. Oznacza to, że model ten jest w stanie skutecznie zastępować subiektywne testy percepcyjne. CGVQM-2, choć uproszczony, nadal przewyższał inne znane metryki w precyzji detekcji artefaktów.
Choć obecne rozwiązanie już teraz oferuje znakomitą dokładność, zespół badawczy wskazuje kierunki dalszego rozwoju. Jednym z nich jest wykorzystanie architektur transformerowych, znanych z sukcesów w analizie sekwencji i dużych zbiorów danych wizualnych. Drugim – integracja informacji o przepływie optycznym, czyli analizie ruchu pikseli między kolejnymi klatkami. Takie podejście mogłoby jeszcze bardziej zwiększyć czułość metryki na niepożądane zniekształcenia dynamiczne.
Warto jednak zaznaczyć, że wybór architektury 3D-CNN w obecnej wersji był świadomy i podyktowany ograniczeniami sprzętowymi oraz chęcią zapewnienia łatwej replikowalności wyników.
Co istotne – Intel udostępnił CGVQM publicznie jako projekt open source. Aplikacja oparta na frameworku PyTorch jest już dostępna na GitHubie. W związku z tym deweloperzy na całym świecie mogą bez przeszkód testować ją we własnych produkcjach. Mowa tu zarówno o celach diagnostycznych, jak i do porównań jakościowych między różnymi technologiami renderingu.
CGVQM to nie tylko narzędzie technologiczne, lecz potencjalny punkt zwrotny w debacie o jakości obrazu w grach. W czasach, gdy gracze analizują klatkę po klatce, a twórcy prezentują rozbudowane materiały marketingowe promujące "krystalicznie czysty obraz", pojawia się potrzeba bezstronnego, niezależnego arbitra. CGVQM może wypełnić tę lukę.
Dla graczy oznacza to większą transparentność i pewność, że jakość wizualna nie została osiągnięta kosztem stabilności czy integralności obrazu. Dla deweloperów – możliwość szybszego wykrywania błędów wizualnych oraz precyzyjnego udowodnienia skuteczności własnych rozwiązań technologicznych.
Czy Computer Graphics Visual Quality Metric ma szansę stać się nowym standardem branżowym? Odpowiedź poznamy dopiero za jakiś czas. Wszystko wskazuje jednak na to, że Intel wykonał właśnie istotny krok w stronę bardziej obiektywnego, mierzalnego i rzetelnego podejścia do oceny grafiki komputerowej.