Dedykowane układy do RT, tak jak było z PhysX? Przecież PhysX to soft wykorzystujący CUDA, a CUDA to API zarzadzające procesorami strumieniowymi w układach Nvidii. Każda karta jest zbudowana z bloków procesorów strumieniowych, każdy z producentów podchodzi do tematu nieco inaczej, ale zasada jest ta sama, a PhysX to zwyczajne GPGPU. Jeśli RT ma działać tak jak PhysX na CUDA, to właśnie napisałeś to o czym ja pisałem - jednostki obliczeniowe GPU pracują na RT, nie ma tu żadnych dedykowanych jednostek. Z nowymi kartami RTX jest tak, że Nvidia wydzieliła osobny blok kilkuset procesorów strumieniujących, wyłącznie do obliczania RT. Coś jak w Cell'u, z tą różnicą, że SPU wykonywały rożne zadania, mimo że były jednostkami specjalistycznymi.
Piszesz też o offline renderingu z RT i mówisz, że wszystko trwa długo na aktualnym sprzęcie. Dlaczego trwa długo? A no nie dlatego, że ten sprzęt się nie nadaje, tylko dlatego, że raytracing w profesjonalnym renderingu jest bardzo dokładny. W realtime musiałbyś użyć znacznie bardziej ograniczonego RT, po czym wygładzić rezultaty za pomocą filtrów, i to właśnie robi Nvidia. Architektura bez wątpienia ma znaczenie, absolutnie niewykluczone jest, że ktoś kiedyś opracuje rozwiązanie, które pozwoli na ultra szybkie obliczanie raytracingu w czasie rzeczywistym. Ale jak nie patrzeć, myślę że w ostatecznym rozrachunku taka architektura i tak da ci zwyczajnie więcej teraflopów, bo koniec końców chodzi o operacje zmiennoprzecinkowe. Więc te cyferki nadal się liczą i nadal dają jakiś pogląd na osiągi.