本帖最後由 Puff 於 2012-10-24 21:40 編輯
Steamroller 依然是 128-bit vector unit,2 Vector Integer ALUs + 2 FMAC hardware,只不過從 4-issue 降到 3-issue,FMA0 同 MAL0 共用 issue port 了。然後 synthesis logic 同 custom logic 依然有明顯分野,如果 Bulldozer 依然想 maintain high freq engine,就自然唔會玩全 synthesis logic. AMD 頂多係話過 SR 後代用 high-dense cell lib。另外,所有 256-bit AVX operation 唔係 microcode 就係 decode 做個 128-bit operation。而且 AVX2 支唔支援都未知。
AVX 唔係對 x264 幫助唔大,而係 x264 係 integer algorithm based,想有幫助就得要成個 x264 重寫一次。呢個只係單一例子,唔能夠証明什麼整數比浮點多。
-
port 0: FMAC, FCVT, VALU, IMAC
port 1: FMAC, XBAR
port 2: gone
port 3: VALU, FSTOR
sauce: GCC bdver3 enablement patch |