本帖最後由 mo9394 於 2024-11-24 01:17 編輯
https://vocus.cc/article/64bcb7ebfd89780001121025
【ChatGPT 系列】ChatGPT 不準了?AI 準確度會隨著時間變化嗎?
以數學題為例,他們詢問 ChatGPT 一系列「某數是否為質數(prime)」的問題,並請 ChatGPT 一步一步邏輯推理出結果。他們發現,GPT-4 在三月的準確率從 97.6% 下降到六月的 2.4%,而 GPT-3.5 的準確率則從 7.4% 大幅提升至 86.8%,不過 GPT-4 的回答變得更加簡潔。
—來自何家慈 Chia Tzu Ho發佈於CT https://vocus.cc/article/64bcb7ebfd89780001121025
CHATGPT = 正確答案, 呢個可圈可點.
曾經出現過 "準確率 7.4%", 都真係....
數學問題 "某數是否為質數" 有絕對的答案, 唔係多人講, 少人講就等同正確
地球是圓的, 地球是方的. 套用去以前年代, 多人認為正確就是建議, 咁部份 GPT 模式train 左不同data, 可能答地球是方的
利用科技"輔助", 同意.
有左科技自己唔駛學習, 買左乜乜就唔駛擔心, 唔同意.
俾個建議你, 但你本身要有一定能力去決定採用定唔採用. 而呢"一定能力", 有部份係新牌仔無lor. 訓唔訓練? 難度高唔高? 睇自己目標LOR.
例如我老婆嗰D, 自問手腳不協調, 泊唔到, 就大不了搵我泊, 無問題架.
但有心練車學車, 唔去學, 就欠左D 基本野咁
更不要講, 360 主要協助有心泊車, 或者有心去入窄位, 主動去開 360 慢慢望住扭咁.
但往往, 停車場出入, 撞到HIGH 到, 唔係有心睇而睇唔到, 而係無諗過要去睇的情形. 呢D 情形 360 無乜用.
某牌子有先進的 auto pilot, 好多過線提示等等, 但平均意外率不見得有大幅度下跌, 反而名列前茅, 保費唔平. |