阿里推Qwen3升級版 性能超過Kimi-K2及DeepSeek-V3等
更新時間:10:11 2025-07-22 HKT
發佈時間:10:11 2025-07-22 HKT
發佈時間:10:11 2025-07-22 HKT

阿里巴巴(9988)旗下通義千問表示,推出Qwen3升級版模型「Qwen3-235B-A22B-Instruct-2507-FP8」,亦是非思考模式(Non-thinking)的更新版本。目前已在魔搭社區和HuggingFace上開源更新。
通用能力顯著提升
根據介紹,新Qwen3模型的通用能力顯著提升,包括指令遵循、邏輯推理、文本理解、數學、科學、編程及工具使用等方面,在GQPA(知識)、AIME25(數學)、LiveCodeBench(編程)、Arena-Hard(人類偏好對齊)及BFCL(Agent能力)等眾多測評中表現出色,超過Kimi-K2、DeepSeek-V3等頂級開源模型,以及Claude-Opus4-Non-thinking等領先閉源模型。
此外,該模型還增強了部份關鍵性能,包括在多語言的長尾知識覆蓋方面,模型取得顯著進步;在主觀及開放性任務中,模型顯著增強了對用戶偏好的契合能力,能夠提供更有用的回覆,生成更高質量的文本;以及長文本提升到256K,上下文理解能力進一步增強。
最Hit
老牌家族基金也出事|周顯
21小時前
上水直通巴長者優惠!$5直達深圳文錦渡口岸 星期一至日適用!鄰近超市/大型商場
2025-07-23 12:51 HKT
人氣放題大喜屋員工落場「臭腳」趕客?網民質疑成枱壽司唔要即走 負責人還原真相...
2025-07-23 17:22 HKT
50歲DJ泰山揭患前列腺癌4期 因小便1異樣求醫確診 拆解7大常見症狀
2025-07-23 12:31 HKT