Levi hat geschrieben: ↑31.07.2020 12:55
Die tensor-Cores sind zwar spezialisiert, aber in einem Gebiet, dass für sich gesehen, schon wieder sehr breit Fächert, mit den Fähigkeiten.
Ja kann gut sein, ich sag ja selbst, ich spekulier da im Wesentlichen nur. Steck da im Moment nicht so tief drin. Unterm Strich muss man sich wohl nur merken: Die Dinger können nicht alles, sind dafür aber in ihrem Gebiet deutlich effizienter.
FP8 und 4 sind natürlich spannend. In normalen Anwendungen kann man damit so ziemlich nix mehr anfangen. Was ich so bisher programmiert hab war fast alles im Bereich numerischer Mechanik, und da ist selbst single oft schon Teufelszeug. Aber klar, kann mir das schon vorstellen. Für so ein paar Gewichte der Neuronenverknüpfungen sind 65k verschiedene Werte vermutlich oft Overkill. Echte Neuronen arbeiten wahrscheinlich auch nicht so präzise.
Ach, nochmal studieren, das wär toll.
Efraim Långstrump hat geschrieben: ↑31.07.2020 13:10
Falls AMD an etwas arbeitet, wird das wohl nicht in den neuen Konsolen von MS und Sony zum tragen kommen? Das ist, als reine Softwarelösung, nicht machbar?
Wenn sie keine spezialisierten Einheiten für sowas in ihren RDNA2-Kernen haben, dann können sie das mit den Shadern probieren. Hat Nvidia bis DLSS 1.9 afaik auch. Wieviel ineffizienter das ist, siehst du aber in dem DF-Video oben. Trotzdem, sag niemals nie. Im Prinzip kriegst du auf den Shadern fast alles berechnet, nur nicht so schnell. Die CryEngine macht inzwischen sogar Raytracing in einfacher Form ohne Hardware dafür...
Edith sagt: Ei gugge mal was Google sagt:
https://www.golem.de/news/playstation-5 ... 49941.html
Sie arbeiten also dran. Ich glaub trotzdem nicht, dass sie die Effizienz von Nvidias Lösung erreichen werden, aber möglicherweise einen Teil davon. Hängt u.a. davon ab, wie gut sie die Beschleunigung von Berechnungen mit Zahlen geringer Präzision hinbekommen. Bei der PS4 Amateur gab es ein ähnliches Problem, die konnte zwar FP16 verwenden, das hat aber genauso lang gedauert wie FP32 und war damit reichlich sinnlos, während die Maxwells von Nvidia bei FP16 doppelt so schnell sind.