4k60Hz HEVC-Main10-Decoder: Nvidia GTX 1060 vs AMD RX 470?

Hast Du Probleme mit Hardware, die durch die anderen Foren nicht abgedeckt werden? Schau auch in den "Tipps und Tricks"-Bereich.
wanne
Moderator
Beiträge: 5875
Registriert: 24.05.2010 12:39:42

Re: 4k60Hz HEVC-Main10-Decoder: Nvidia GTX 1060 vs AMD RX 47

Beitrag von wanne » 10.08.2016 22:29:30

Lord_Carlos hat geschrieben:Gerade debian installieren. Geht unter Linux wohl noch nicht. Vdpauinfo gibt folgendes aus: https://openbenchmarking.org/system/160 ... /vdpauinfo

Code: Alles auswählen

H264_HIGH_444_PREDICTIVE       41 65536  4096  4096
HEVC_MAIN                      153 262144  8192  8192
HEVC_MAIN_10                   --- not supported ---
HEVC_MAIN_STILL                --- not supported ---
HEVC_MAIN_12                   --- not supported ---
HEVC_MAIN_444                  --- not supported ---
Was interessanter weise genau das ist, was in der Doku von nvidia steht.
rot: Moderator wanne spricht, default: User wanne spricht.

Benutzeravatar
Lord_Carlos
Beiträge: 4443
Registriert: 30.04.2006 17:58:52
Lizenz eigener Beiträge: GNU Free Documentation License
Wohnort: Dänemark

Re: 4k60Hz HEVC-Main10-Decoder: Nvidia GTX 1060 vs AMD RX 47

Beitrag von Lord_Carlos » 10.08.2016 22:44:46

Ich habe jetzt mpv aus den sourcen installieren.

mpv braucht ca. 200 - 300% cpu fuer den bunny film.
mit --hwdec='vdpau' kommt es zu grafikfehlern, aber nur noch ~15% auslastung.

Code: Alles auswählen

╔═╗┬ ┬┌─┐┌┬┐┌─┐┌┬┐╔╦╗
╚═╗└┬┘└─┐ │ ├┤ │││ ║║
╚═╝ ┴ └─┘ ┴ └─┘┴ ┴═╩╝ rockt das Forum!

Benutzeravatar
hikaru
Beiträge: 10447
Registriert: 09.04.2008 12:48:59

Re: 4k60Hz HEVC-Main10-Decoder: Nvidia GTX 1060 vs AMD RX 47

Beitrag von hikaru » 11.08.2016 00:40:26

guennid hat geschrieben:Schade, da fehlt mir irgendwie eine Erfahrung: Ich habe es noch nie fertiggebracht, hardware mit software einfach abzuschießen.
Oh, das geht teils sehr einfach. Als Student hatte ich mal irgendwo gelesen, dass man Tastaturen dadurch schrotten kann, dass man in sehr kurzen Abständen (deutlich unter einer Sekunde) die Status-LEDs ein- und ausschaltet. Ich war neugierig und hatte eine Tastatur über, also habe ich ein Programm geschrieben das genau das gemacht hat. Nach etwa einer Minute schaltete die LED nicht mehr und die Tastatur reagierte auch nicht mehr auf Eingaben, selbst nach einem Reboot und umstecken an einen anderen Rechner.

So weit, so schlecht ... könnte man meinen. Aber da ich damals schon Vorlesungen in Statistik hatte ahnte ich, dass das ein zufälliger Ausreißer sein könnte. Also führte ich den selben Test mit einer zweiten Tastatur durch, und kam zum selben Ergebnis. Hoch zufrieden ein statistisch signifikantes Ergebnis erzielt zu haben ging ich ins Bett, es wurde schließlich bald wieder hell.
Am nächsten Morgen fuhr ich nicht mehr ganz so zufrieden in die Stadt, denn ich hatte vor dem Experiment wirklich nur genau EINE Tastatur über.

wanne hat geschrieben:
hikaru hat geschrieben:Ich verstehe die Erklärung nicht. Was hat die Registerbreite mit der Anzahl der ALUs zu tun?
Eigentlich nichts. ist halt Marketing geblubber. Die Erklärung ist halt folgende: Mit SSEX.X kannst du zwei 64-Bit doubles in ein 128MMX-Reister stecken und die dann mit einer Operation beide gleichzeitig verarbeiten. Deswegen braucht man laut AMD nur halb so viele Einheiten. Auf der andren Seite muss der Prozessor halt auch die doppelte (bei AVX sogar die vierfache) Datenmeng fechten. Weshalb die gleiche Anzahl an Floatingpoint Einheiten halt das ganze Prozessordsighn vergrößert was die Prozessoren halt unverhätnismäßig teurer macht.
Der Aufhänger für mein Unverständnis ist, warum du jetzt überhaupt mit FLOPS argumentierst. Vorher [1] hast du die gute Performance deines AMD beim Decodieren von h265 damit begründet, dass er besonders gut im Integerbereich ist, während du an anderer Stelle [2] herausgestellt hast, dass AMD nicht sonderlich gut bei FP abschneidet.
wanne hat geschrieben:
hikaru hat geschrieben:Hab ich bei Consumer-Grafikkarten noch nicht als Ausgang gesehen
Die ganzen Mobilen wie die genannte von Intel haben das alle.
Die kann man aber nicht im Laden kaufen und nachträglich in seinen Desktop-Rechner stecken. Abgesehen davon habe ich auch bei noch keinem Laptop ein nach außen geführtes LVDS gesehen.
wanne hat geschrieben:Deswegen bin ich ja so verwundert, dass du da ganz und gar nicht ran kommst. Ich tippe, dass da irgend wo noch ein anderes Bottleneck sein muss.
Ich wüsste nicht was. Der PCI-Bus ist bei mir in Bezug auf das Szenario arbeitslos. Die GPU steckt in der CPU und macht außer der reinen Ausgabe nichts, die HDDs sind bei weitem nicht ausgelastet (außerdem hatte ich auch schon mal versucht ein Video aus dem RAM abzuspielen) und die 16GB RAM sind bei den Tests für gewöhnlich mindestens zur Hälfte leer während die CPU Däumchen drehen würde, wenn sie nicht Decodieren müsste.

Lord_Carlos hat geschrieben:Ich habe jetzt mpv aus den sourcen installieren.

mpv braucht ca. 200 - 300% cpu fuer den bunny film.
mit --hwdec='vdpau' kommt es zu grafikfehlern, aber nur noch ~15% auslastung.
Sehr schön! Das deutet zumindest darauf hin, dass h265-Decodierung priinzipiell funktioniert.

Ich habe mir einen Jessie-Backport für mpv aus den Stretch-Quellen gebaut und komme damit auf leicht bessere Ergebnisse als mit der selben mpv-Version unter Fedora. Ein Problem auf Softwareseite schließe ich also aus. Ich kann jetzt BBB in 4k bei 75% Geschwindigkeit und 200-350% CPU-Last abspielen. Wenn die Last über 400% steigt, dann kommt es zu Framedrops. Ich vermute, dass Hyperthreading beim Decodieren einfach nicht hilft.
Kannst du als Gegentest bitte mal bei Softwaredecodierung die Abspielgeschwindigkeit erhöhen (schließende eckige Klammer ] ), bis du über 600% kommst, also Hyperthreading nötig würde und auf die Framedrops achten?


[1] viewtopic.php?f=13&t=161817#p1100782
[2] viewtopic.php?f=28&t=161777#p1100222

wanne
Moderator
Beiträge: 5875
Registriert: 24.05.2010 12:39:42

Re: 4k60Hz HEVC-Main10-Decoder: Nvidia GTX 1060 vs AMD RX 47

Beitrag von wanne » 11.08.2016 02:32:39

hikaru hat geschrieben:Der Aufhänger für mein Unverständnis ist, warum du jetzt überhaupt mit FLOPS argumentierst. Vorher [1] hast du die gute Performance deines AMD beim Decodieren von h265 damit begründet, dass er besonders gut im Integerbereich ist, während du an anderer Stelle [2] herausgestellt hast, dass AMD nicht sonderlich gut bei FP abschneidet.
Da ging einiges durcheinander. Ich habe da eigentlich immer zitiert, auf welchen Betrag sich das Bezog.
Gunsätzlich gilt das
  1. Auf den AMDs von uns läuft das ganze. Bei deinen Intels nicht.
  2. Nun ist die Frage ob das an der schlechteren decodierleistung deiner Intels oder an irgend etwas anderem liegt.
  3. Benchmarks, die die Performance von AMDs und Intels vergleichen gibt es aber praktisch nur zu FP-Performance.
  4. Effizientere Codecs arbeiten aber mit Integer.
  5. Das Verhältnis zwischen Integer und Float Performance ist bei AMDs deutlich anders als bei Intels.
  6. Als Nebeninformation habe ich abgegeben, wie AMD begründet, dass sie ein so viel anderes Verhältnis zu den Intels wählen.
rot: Moderator wanne spricht, default: User wanne spricht.

Benutzeravatar
hikaru
Beiträge: 10447
Registriert: 09.04.2008 12:48:59

Re: 4k60Hz HEVC-Main10-Decoder: Nvidia GTX 1060 vs AMD RX 47

Beitrag von hikaru » 11.08.2016 08:02:36

wanne hat geschrieben:Auf den AMDs von uns läuft das ganze. Bei deinen Intels nicht.
Nun ist die Frage ob das an der schlechteren decodierleistung deiner Intels oder an irgend etwas anderem liegt.
Da Lord_Carlos unter Berücksichtigung seiner stärkeren CPU vergleichbare Ergebnisse erzielt wie ich, denke ich nicht, dass es an MEINEM Intel liegt.
wanne hat geschrieben:Benchmarks, die die Performance von AMDs und Intels vergleichen gibt es aber praktisch nur zu FP-Performance.
Zu beiden gibt es Dhrystone-Benchmarks mit der selben Software (SiSoft Sandra).
wanne hat geschrieben:Als Nebeninformation habe ich abgegeben, wie AMD begründet, dass sie ein so viel anderes Verhältnis zu den Intels wählen.
Hier hast du begründet, warum AMD meint, es reiche ein Modul mit einer FPU auszustatten:
wanne hat geschrieben:
hikaru hat geschrieben:Aber sind denn die zwei Integer-Kerne pro Modul wirklich vorhanden?
Klar. Die Begründung seitens AMD ist, dass Float ja dank SIMD-Register ja zwei mal 64Bit in einer Operation machen kann. Mit AVX sogar hat man ja sogar 256Bit. Intel kann aber eben sogar AVX-512. Und das bei vollen Float Einheiten pro Kern.
Das erklärt aber nicht, ob ein Modul wirklich zwei ALUs hat oder nur eine ALU die Hyperthreading kann, was ja meine Frage war.

Benutzeravatar
hikaru
Beiträge: 10447
Registriert: 09.04.2008 12:48:59

Re: 4k60Hz HEVC-Main10-Decoder: Nvidia GTX 1060 vs AMD RX 47

Beitrag von hikaru » 11.08.2016 15:02:25

Der offene Treiber für Polaris kann wohl noch keinen Ton über HDMI. [1] Mindestens bis Kernel 4.9 raus ist müsste ich also wohl den proprietären Treiber [2] verwenden, der zwar als Debian-Pakete verfügbar ist, aber nur für Ubuntu und SteamOS (das immerhin auf Jessie basiert).

[1] http://www.phoronix.com/scan.php?page=n ... -DAL-Audio
[2] http://support.amd.com/en-us/kb-article ... stall.aspx

wanne
Moderator
Beiträge: 5875
Registriert: 24.05.2010 12:39:42

Re: 4k60Hz HEVC-Main10-Decoder: Nvidia GTX 1060 vs AMD RX 47

Beitrag von wanne » 12.08.2016 02:53:49

hikaru hat geschrieben:Zu beiden gibt es Dhrystone-Benchmarks mit der selben Software (SiSoft Sandra).
Kannst du mal verlinken?
hikaru hat geschrieben:Das erklärt aber nicht, ob ein Modul wirklich zwei ALUs hat oder nur eine ALU die Hyperthreading kann, was ja meine Frage war.
Die habe ich zwei mal eindeutig beantwortet. Zwei ALUs pro Modul.
wanne hat geschrieben:
hikaru hat geschrieben:Aber sind denn die zwei Integer-Kerne pro Modul wirklich vorhanden?
Klar.
Außerdem ergibt sie sich auch aus der Antwort. Woher sollen sonst halb soviele FP einheiten kommen? Btw. ist wohl anzumerken, dass ich Intel da wohl etwas unrecht getan habe, als ich ihnen angehängehängt habe dass sie AMDs Mehrkernprozessoren als lediglich Hyperthreadded dargestellt haben. Zumindest die K9er (Opterons, Athlon64 X2) (Die sogar wirklich volle 2 Kerne mit 2 FP-Einheit hatten.) Hat AMD selbst als Einprozessorsysteme 2 fach Hyperthreaded bezeichnet. Intel hat die Marketingsteilvorlage natürlich dankend angenommen.
rot: Moderator wanne spricht, default: User wanne spricht.

Benutzeravatar
hikaru
Beiträge: 10447
Registriert: 09.04.2008 12:48:59

Re: 4k60Hz HEVC-Main10-Decoder: Nvidia GTX 1060 vs AMD RX 47

Beitrag von hikaru » 12.08.2016 08:53:27

wanne hat geschrieben:
hikaru hat geschrieben:Zu beiden gibt es Dhrystone-Benchmarks mit der selben Software (SiSoft Sandra).
Kannst du mal verlinken?
Für die beiden Intels von Lord_Carlos und mir hatte ich das in [1] schon getan. Für deinen FX-8350 gibt es unter [2] Dhrystone-Vergleiche zu diversen anderen CPUs, darunter ein i7-2600k, dessen Wert in Anbetracht des geringen Taktunterschiedes so gut zu meinem 2700k passt, das ich davon ausgehe, dass man den Werten bis auf 2 oder 3% vertrauen kann.
Werte zum von dir empfohlenen FX-9370 und drei anderen CPUs (darunter ein FX-9590) gibt es unter [3] (Scripte!). Hier habe ich keine Plausibilitätsprüfung gemacht.

Ich habe übrigens gestern Abend versucht einen Jessie-Backport für mesa aus Experimental zu bauen. Dazu brauche ich diverse andere Backports. Dabei ist mir über Nacht beim Bauen von llvm-toolchain-3.8 die virtuelle 20GB-Platte vollgelaufen. Ich habe den Umfang des Pakets einfach unterschätzt. Alle anderen Pakete davor waren Fragen von Minuten und wenigen 100MB. Momentan läuft ein zweiter Versuch mit größerer Platte.


[1] viewtopic.php?f=13&t=161817&start=30#p1101075
[2] http://www.guru3d.com/articles-pages/am ... ew,11.html
[3] http://www.overclockersclub.com/reviews ... 9370/6.htm

Benutzeravatar
hikaru
Beiträge: 10447
Registriert: 09.04.2008 12:48:59

Re: 4k60Hz HEVC-Main10-Decoder: Nvidia GTX 1060 vs AMD RX 47

Beitrag von hikaru » 14.08.2016 13:12:25

Mir wurden die Unwägbarkeiten bei den AMD-Karten zu viele (Kernel, Mesa, Backportorgie, aktuelle Fähigkeiten von amdgpu).
Nachdem ich nochmal die Dokumentation zu den Nvidia-Karten studiert habe, habe ich eine GTX 950 bestellt, denn die 2. Maxwell-Generation soll abgesehen von 8k die gleichen Decoder-Fähigkeiten haben wie Pascal.

wanne
Moderator
Beiträge: 5875
Registriert: 24.05.2010 12:39:42

Re: 4k60Hz HEVC-Main10-Decoder: Nvidia GTX 1060 vs AMD RX 47

Beitrag von wanne » 14.08.2016 13:15:37

Also die GTX 980 und GTX 960 können definitiv kein h.265.

Btw. der i7 war ein i7-5820K
rot: Moderator wanne spricht, default: User wanne spricht.

wanne
Moderator
Beiträge: 5875
Registriert: 24.05.2010 12:39:42

Re: 4k60Hz HEVC-Main10-Decoder: Nvidia GTX 1060 vs AMD RX 47

Beitrag von wanne » 14.08.2016 13:29:12

hikaru hat geschrieben:
wanne hat geschrieben:
hikaru hat geschrieben:Zu beiden gibt es Dhrystone-Benchmarks mit der selben Software (SiSoft Sandra).
Kannst du mal verlinken?
Für die beiden Intels von Lord_Carlos und mir hatte ich das in [1] schon getan. Für deinen FX-8350 gibt es unter [2] Dhrystone-Vergleiche zu diversen anderen CPUs, darunter ein i7-2600k, dessen Wert in Anbetracht des geringen Taktunterschiedes so gut zu meinem 2700k passt, das ich davon ausgehe, dass man den Werten bis auf 2 oder 3% vertrauen kann.
Werte zum von dir empfohlenen FX-9370 und drei anderen CPUs (darunter ein FX-9590) gibt es unter [3] (Scripte!). Hier habe ich keine Plausibilitätsprüfung gemacht.
Danke. Das ding ist, dass ich so binarys alla SiSoftware Sandra nicht über den weg traue. Die compilieren oft mit icc und das fragt explizit ab, was das für ein Intel ist, und läuft dann je nach Generation schneller. (Du kannst die jumps umdren und Die AMDs laufen schneller und die Intels langsamer.)
Auf der anderen Seite kommt er mit 114 GIPS exakt auf das, was ich hier mit boinc gebenchmarkt habe.
Das würde aber heißen, dass deiner eigentlich schneller sein sollte...
rot: Moderator wanne spricht, default: User wanne spricht.

Benutzeravatar
hikaru
Beiträge: 10447
Registriert: 09.04.2008 12:48:59

Re: 4k60Hz HEVC-Main10-Decoder: Nvidia GTX 1060 vs AMD RX 47

Beitrag von hikaru » 14.08.2016 14:17:04

wanne hat geschrieben:Also die GTX 980 und GTX 960 können definitiv kein h.265.
Nvidia [1][2] sagt was anderes. Die GTX 9xx sind Maxwell-2.0-Karten. Offen bleibt nur, ob das auch in 4k geht.
Wikipedia mag keine reputable Quelle sein, aber [3] legt zumindest nahe, dass die GTX 950 als Feature-Set-F-Karte 4k-Decodierung von h265 können müsste.

[1] https://developer.nvidia.com/nvidia-vid ... portMatrix
[2] https://developer.nvidia.com/nvdec-application-note
[3] https://en.wikipedia.org/wiki/Nvidia_Pu ... _SIP_block

wanne
Moderator
Beiträge: 5875
Registriert: 24.05.2010 12:39:42

Re: 4k60Hz HEVC-Main10-Decoder: Nvidia GTX 1060 vs AMD RX 47

Beitrag von wanne » 14.08.2016 14:53:34

Interessant. Die habe ich halt. Und da sagen die sowohl unter Windows wie auch unter Linux, dass sie kein h.265 kann.

GTX 960:

Code: Alles auswählen

Information string: NVIDIA VDPAU Driver Shared Library  361.45.11  Tue May 17 17:48:19 PDT 2016
[…]
Decoder capabilities:

name               level macbs width height
-------------------------------------------
MPEG1                 0 65536  4080  4080
MPEG2_SIMPLE          3 65536  4080  4080
MPEG2_MAIN            3 65536  4080  4080
H264_BASELINE        41 65536  4096  4096
H264_MAIN            41 65536  4096  4096
H264_HIGH            41 65536  4096  4096
VC1_SIMPLE            1  8190  2048  2048
VC1_MAIN              2  8190  2048  2048
VC1_ADVANCED          4  8190  2048  2048
MPEG4_PART2_SP        3  8192  2048  2048
MPEG4_PART2_ASP       5  8192  2048  2048
DIVX4_QMOBILE         0  8192  2048  2048
DIVX4_MOBILE          0  8192  2048  2048
DIVX4_HOME_THEATER    0  8192  2048  2048
DIVX4_HD_1080P        0  8192  2048  2048
DIVX5_QMOBILE         0  8192  2048  2048
DIVX5_MOBILE          0  8192  2048  2048
DIVX5_HOME_THEATER    0  8192  2048  2048
DIVX5_HD_1080P        0  8192  2048  2048
[…]
$ lspci | grep VGA
01:00.0 VGA compatible controller: NVIDIA Corporation Device 1401 (rev a1)

Btw. Ist wenn man die sternchen weiter verfolgt die GTX 980 ausgeschlossen. Lediglich die GTX 960+950 (GM206) sind drin.
rot: Moderator wanne spricht, default: User wanne spricht.

Benutzeravatar
hikaru
Beiträge: 10447
Registriert: 09.04.2008 12:48:59

Re: 4k60Hz HEVC-Main10-Decoder: Nvidia GTX 1060 vs AMD RX 47

Beitrag von hikaru » 14.08.2016 15:17:02

wanne hat geschrieben:Information string: NVIDIA VDPAU Driver Shared Library 361.45.11 Tue May 17 17:48:19 PDT 2016
Ich glaube du brauchst mindestens Treiber 364. Aktuell ist 367.
wanne hat geschrieben:Btw. Ist wenn man die sternchen weiter verfolgt die GTX 980 ausgeschlossen. Lediglich die GTX 960+950 (GM206) sind drin.
Ja, das war auch meine Interpretation.

Benutzeravatar
Lord_Carlos
Beiträge: 4443
Registriert: 30.04.2006 17:58:52
Lizenz eigener Beiträge: GNU Free Documentation License
Wohnort: Dänemark

Re: 4k60Hz HEVC-Main10-Decoder: Nvidia GTX 1060 vs AMD RX 47

Beitrag von Lord_Carlos » 14.08.2016 15:36:52

Warum keine 1060?

Code: Alles auswählen

╔═╗┬ ┬┌─┐┌┬┐┌─┐┌┬┐╔╦╗
╚═╗└┬┘└─┐ │ ├┤ │││ ║║
╚═╝ ┴ └─┘ ┴ └─┘┴ ┴═╩╝ rockt das Forum!

Antworten