ATI radeon R9 zone

Rank: 3 Rank: 3 Rank: 3

21^# 跳轉到 »

發表於 2026-5-10 18:59 | 只看該作者

以下屬業餘推測

ffplay基于ffmpeg，唔同其它players如vlc mplayer smplayer mpv，係會用到cpu的指令集加速 ...
MSI_R9_280_Gami 發表於 2026-5-10 06:01

open source video decoding多數基於libavcodec呢個library，上面提及嘅都會直接間接用到佢
https://en.wikipedia.org/wiki/Libavcodec#Libraries_that_depend_on_libavcodec

TOP

MSI_R9_280_Gami

中級會員

Rank: 2 Rank: 2

22^#

發表於 2026-5-10 20:37 | 只看該作者

本帖最後由 MSI_R9_280_Gami 於 2026-5-12 02:44 編輯

tested IVB E5-2667 v2 + RX 570 4GB，相比BDW E3-1285L v4少左AVX2

呢段片播得唔順，CPU usage 88%，而E3-1285L v4 + R9 270 2GB係好順，證明真係AVX2起作用。我就係記得之前RX480 8GB RX570 4GB播過段片好lag，冇理由R9 270 2GB播得咁順，係AVX2既功勞，同埋我之前用ffmpeg轉片，E3-1285L v4係快過E5-2667 v2 E5-2697 v2

$ffplay 이금주/KqQ0MxfJ_5M_HDR337-251.webm

E3-1285L v4 + R9 270 2GB播呢段片CPU usage 53%

270

FP32 (float)
2.368 TFLOPS

FP64 (double)
148.0 GFLOPS (1:16)

280

FP32 (float)
3.344 TFLOPS

FP64 (double)
836.0 GFLOPS (1:4)

280X

FP32 (float)
4.096 TFLOPS

FP64 (double)
1,024.0 GFLOPS (1:4)

290

FP32 (float)
4.849 TFLOPS

FP64 (double)
606.1 GFLOPS (1:8)

570

FP16 (half)
5.095 TFLOPS (1:1)

FP32 (float)
5.095 TFLOPS

FP64 (double)
318.5 GFLOPS (1:16)

7900XTX FP64比R9 280X高左一倍都冇

FP16 (half)
122.8 TFLOPS (2:1)

FP32 (float)
61.39 TFLOPS

FP64 (double)
1.918 TFLOPS (1:32)

AI 概览
FP64（双精度浮点数）是一种使用64位二进制（8字节）存储的数值数据类型，符合 IEEE 754 标准。它主要用于需要极高精度和数值范围的科学计算、物理仿真和HPC（高效能计算），可表示大约 15-17 位有效数字。

核心特点与应用：

●结构与范围：由 1 位符号位、11 位指数位和 52 位尾数位组成，数值范围约为 2.23 x10⁻³⁰⁸ 到 1.80 x10³⁰⁸。
●适用场景：对计算精度要求极高，通常不用于训练深度学习模型，因为其速度慢且内存占用大。
●硬件性能：在现代GPU架构（如 AMD CDNA、NVIDIA 数据中心卡）中，FP64 性能是衡量高性能计算（HPC）的核心指标。2026年，AMD Instinct MI430X 加速器通过其架构在HPC领域实现了突破性的FP64性能。
●对比：相比单精度 (FP32) 和半精度 (FP16/BF16)，FP64 精度最高，但功耗和计算资源需求也最高。

https://zhuanlan.zhihu.com/p/136099964

为什么会有扩展指令集

无论CPU有多快，X86指令也只能一次处理一个数据，这样效率就很低下，毕竟在很多应用中，数据都是成组出现的，比如一个点的坐标（XYZ）和颜色（RGB）、多声道音频等。为了提高CPU在某些方面的性能，就必须增加一些特殊的指令满足时代进步的需求，这些新增的指令就构成了扩展指令集。
扩展指令集的演变过程

●英特尔在1996年率先引入了MMX（Multi Media eXtensions）多媒体扩展指令集，也开创了SIMD（Single Instruction Multiple Data，单指令多数据）指令集之先河，即在一个周期内一个指令可以完成多个数据操作，MMX指令集的出现让当时的MMX Pentium处理器大出风头。

●SSE（Streaming SIMD Extensions，流式单指令多数据扩展）指令集是1999年英特尔在Pentium III处理器中率先推出的，并将矢量处理能力从64位扩展到了128位。

●在Willamette核心的Pentium 4中英特尔又将扩展指令集升级到SSE2（2000年），而SSE3指令集（2004年）是从Prescott核心的Pentium 4（第一次接触电脑时就是奔4）开始出现。

●SSE4（2007年）指令集是自SSE以来最大的一次指令集扩展，它实际上分成Penryn中出现的SSE4.1和Nehalem中出现的SSE4.2，其中SSE4.1占据了大部分的指令，共有47条，Nehalem中的SSE4指令集更新很少，只有7条指令，这样一共有54条指令，称为SSE4.2。

●2007年8月，通用CPU领域Intel友商AMD抢先宣布了SSE5指令集(SSE到SSE4均为英特尔出品)，英特尔当即表示不玩SSE了也不再支持SSE5。

AVX出现了

2008年3月Intel宣布Sandy Bridge微架构将引入全新的AVX指令集，同年4月公布AVX指令集规范，随后开始不断进行更新，业界普遍认为支持AVX指令集是Sandy Bridge最重要的进步，没有之一。

其中AVX全称是Advanced Vector Extension，高级矢量扩展，什么是矢量？学过矩阵论的也应该知道，学过线性代数的也应该知道，高中物理里面也会提到：方向+大小的三维或四维标量组合，一般常用N维矩阵表示，计算机编程中就是用数组来表示。

AVX指令集“借鉴”了一些AMD SSE5的设计思路，进行扩展和加强，形成一套新一代的完整SIMD（上文提到过，单指令多数据）指令集规范。

https://zhuanlan.zhihu.com/p/514966360

计算机架构有多种分类方法，其中最著名的是1966年由Flynn提出的分类法，称为Flynn分类法。Flynn分类法根据指令和数据进入CPU的方式，将计算机架构分为四种不同的类型

●单指令流单数据流(SISD, Single Instruction stream Single Data stream)
●单指令流多数据流(SIMD, Single Instruction stream Multiple Data stream)
●多指令流单数据流(MISD, Multiple Instruction stream Single Data stream)
●多指令流多数据流(MIMD, Multiple Instruction stream Multiple Data stream)

SISD指的是传统计算机：一种串行架构。在这种计算机上只有一个核心，在任何时间点上只有一个指令流在处理一个数据流。

SIMD是一种并行架构类型。在基于SIMD架构的计算机上有多个核心，在任意时间点上所有核心只有一个指令流处理不同的数据流，现在大多数计算机都采用了SIMD架构。SIMD本质上是采用一个控制器来控制多个处理器，同时对一组数据中的每一条分别执行相同的操作，从而实现空间上的并行性的技术。

而这种并行化执行实现的原因是因为CPU在物理设计时候，增加了一些专用的向量寄存器，这些寄存器的长度往往大于通用寄存器，比如SEE 的 XMM寄存器的长度为128位，AVX和AVX2的YMM寄存器为256位。因此，这些专用的向量寄存器可以同时放入多个数据。但需要注意，这里放入的多个数据需要保证数据类型是一致的。
Intel SIMD 指令集

●MMX 指令集，MMX（Multi Media eXtension，多媒体扩展指令集）指令集是Intel公司于1996年推出的一项多媒体指令增强技术。MMX指令集中包括有57条多媒体指令，通过这些指令可以一次处理多个数据，在处理结果超过实际处理能力的时候也能进行正常处理，这样在软件的配合下，就可以得到更高的性能。

●SSE/SSE2/SSE3/SSE4/SSE5 指令集，Intel在1999年推出SSE（Streaming SIMD eXtensions）指令集，是x86上对SIMD指令集的一个扩展，主要用于处理单精度浮点数。Intel陆续推出SSE2、SSE3、SSE4版本。其中，SSE主要处理单精度浮点数，SSE2引入了整数的处理，SSE指令集引入了8个128bit的寄存器，称为XMM0到XMM7，正因为这些寄存器存储了多个数据，使用一条指令处理，因此称这项功能为SIMD。

●AVX指令集，AVX在2008年3月提出，并在2011年 Sandy Bridge系列处理器中首次支持。AVX指令集在单指令多数据流计算性能增强的同时也沿用了的MMX/SSE指令集。不过和MMX/SSE的不同点在于增强的AVX指令，从指令的格式上就发生了很大的变化。x86(IA-32/Intel 64)架构的基础上增加了prefix(Prefix)，所以实现了新的命令，也使更加复杂的指令得以实现，从而提升了x86 CPU的性能。

TOP

MSI_R9_280_Gami

中級會員

Rank: 2 Rank: 2

23^#

發表於 2026-5-11 00:27 | 只看該作者

本帖最後由 MSI_R9_280_Gami 於 2026-5-11 05:05 編輯

而家啲Hardware咁貴,HKEPC啲Ching開始玩古董
alan216hk 發表於 2026-5-10 16:51

socket 2011 Xeon E5 SNB sandy bridge X79確實係講緊2011年

socket 2066 X299係6代 skylake ，2016年，都成10年前，所以X299賣得貴係好搵笨疾

Cascade Lake i9-10980XE 係2019年出（應該係9代然後表示性能勁前綴加1），呢類xeon / hedt workstation CPU support AVX512，不過都好舊

X79唔support usb3.0因為CPU到IVB先support，X79第一代SNB唔support usb3.0，底板同配套晶片組仲早過SNB研發

TOP

MSI_R9_280_Gami

中級會員

Rank: 2 Rank: 2

24^#

發表於 2026-5-11 15:19 | 只看該作者

好老實，完全唔覺快過我部Z97 E3-1285L v4同sabertooth X79 E5-2667 v2，仲要用緊unbuffered DDR3同SATA HDD

TOP

stepmic

進階會員

Rank: 3 Rank: 3 Rank: 3

25^#

發表於 2026-5-11 19:06 | 只看該作者

好老實，完全唔覺快過我部Z97 E3-1285L v4同sabertooth X79 E5-2667 v2，仲要用緊unbuffered DDR3同SATA HD ...
MSI_R9_280_Gami 發表於 2026-5-11 07:19

睇你用黎做咩架姐
上網聽歌梗係冇分別, 不過用電就好大分別

TOP

MSI_R9_280_Gami

中級會員

Rank: 2 Rank: 2

26^#

發表於 2026-5-11 19:23 | 只看該作者

本帖最後由 MSI_R9_280_Gami 於 2026-5-17 01:11 編輯

MSI R9 280X Gaming 3GB，120蚊天橋上邊屯門圖書館入手。有張MSI R9 280 Gaming 3GB（80蚊兆康入手）由于搽導熱膏太多太厚，燒左vcore

Sapphire Dual-X R9 280X 3GB，75蚊入手，燒左兩三分鐘76°C左右，風扇比較嘈，連機箱都有共振聲

mageia@localhost ~/Downloads> ffplay 이금주/KqQ0MxfJ_5M_HDR337-251.webm

播呢段片依然好順，唔係因為顯卡性能係因為BDW E3-1285L v4 有AVX AVX2 ISA

TOP

PowerShot

特級會員

Rank: 4 Rank: 4 Rank: 4 Rank: 4

27^#

發表於 2026-5-13 10:42 | 只看該作者

MSI R9 280X Gaming 3GB，120蚊天橋上邊屯門圖書館入手。有張MSI R9 280 Gaming 3GB（80蚊兆康入手）由于搽 ...
MSI_R9_280_Gami 發表於 2026-5-11 19:23

天橋上邊屯門圖書館入手

邊到有甘多卡買到既?

TOP

PowerShot

特級會員

Rank: 4 Rank: 4 Rank: 4 Rank: 4

28^#

發表於 2026-5-13 10:57 | 只看該作者

Sapphire藍寶應該冇出N卡，中低端A卡非常慳料，簡陋（典型DUAL-X 270 及280 280X），可能因為gigabyte msi ...
MSI_R9_280_Gami 發表於 2026-5-9 07:45

Sapphire TRI-X 290 呢張故障卡有興趣玩下

TOP

MSI_R9_280_Gami

中級會員

Rank: 2 Rank: 2

29^#

發表於 2026-5-13 16:19 | 只看該作者

本帖最後由 MSI_R9_280_Gami 於 2026-5-21 09:35 編輯

MSI 280X條友約我屯門站，佢話要120我同佢講價100，佢企硬我冇20蚊去銀行唱錢，遲左少少，佢話圖書館等我

citibank觀塘間分行執左，要走去牛頭角九龍灣間 One Bay East

One Bay East是位於香港牛頭角海濱道83號的寫字樓項目，與海濱匯、香港綠景NEO大廈及宏利廣場同期興建，分為東座（花旗大樓）及西座（宏利大樓）兩座，樓高21層，由會德豐地產 ...

PCB板背面，金手指對上有16粒野，甩左一粒，行到PCI-e gen 3 x8，行唔到 x16

Z87-C板第一條PCI-e 3.0 x16 lane unbootable，DRAM_LED / BOOT_DEVICE_LED紅燈，搞完一輪先醒起張卡係唔正常得PCI-e 3.0 x8，第二條得返PCIe Gen2x2 (current) / Gen3x16 (max)

https://i.ebayimg.com/images/g/AjAAAOSwRTVacqnU/s-l2400.jpg

https://www.techpowerup.com/img/13-05-16/Z87-DELUXE.jpg

估唔到sahara 12025唔知定速定PWM變速又幾ok

12025轉12038暴力扇

updated added another situation：

radeontop -cb1：bus 1|G290 x16 lane 1：PCIe Gen3x16 (current) / Gen3x16 (max)
radeontop -cb6：bus 6|Sapp Tri-X 290 x16 lane 2：PCIe Gen2x2 (current) / Gen3x16 (max)

奇怪E3-1271 v3 應該得Gen3.0 x16，拆做
1x16：3 x16
2x8：3 x8 + 3 x8
1x8/2x4：3 x8 + 3 x4 + 3 x4

HDMI頭隊 bus 6 x16 lane 2ʳᵈ開唔到機，鍵盤跑馬燈不亮

TOP

MSI_R9_280_Gami

中級會員

Rank: 2 Rank: 2

30^#

發表於 2026-5-13 18:27 | 只看該作者

4K VP9韓妹跳舞，CPU fan猛轉，用緊AVX2解碼

https://www.youtube.com/watch?v=39FNCGO7l3M
[4k] 260321 아이브 '소원을 말해봐' 직캠 (IVE GENIE fancam) - YouTube

https://pbs.twimg.com/amplify_video_thumb/2052752234904195072/img/CTE9qdqLA8ncMoRS.jpg
https://video.twimg.com/amplify_video/2052752234904195072/vid/avc1/2160x3840/EytooLfw5j0jPx_4.mp4

https://x.com/ggs_clips/status/2052848940777869460
* on X: "https://t.co/6PrUj4WqWT" / X

https://pbs.twimg.com/amplify_video_thumb/2052927102975193088/img/qAoPta7uqUle-2KD.jpg
https://video.twimg.com/amplify_video/2052927102975193088/vid/avc1/1080x1920/iaQMu_52j1OnuwvR.mp4

https://x.com/bbblue_89/status/2052927299629293855
파랑 on X: "260508 #카즈하 #르세라핌 https://t.co/se7MFNmZjX https://t.co/IDxau0as7j" / X
https://www.youtube.com/watch?v=Ek5yrH-69u8
발레로 다져진 카즈하의 탄탄한 몸매 라인 #카즈하 #KAZUHA #르세라핌 #LESSERAFIM - YouTube

TOP

[收藏此主題] [關注此主題的新回覆]

[通過 QQ、MSN 分享給朋友]