用左一晚, 寫左個local LLM arena, 双盲比較兩個LLM 再計分.

係openclaw + GLM 5.1, 有時又用gemini 3 pro (vscode) 幫下手.


最尾有少少做唔到,
係咁試 DS v4 pro, 小米 咁, 都唔得.

係要出到 claude sonnet 4.6 (free) 先做到.