腾讯推出自研深度思考模型混元T1

更新时间:15:53 2025-03-22 HKT
发布时间:15:53 2025-03-22 HKT

腾讯(700)宣布推出自研深度思考模型「混元T1」正式版,并已同步在腾讯云官网上线供用户使用。

据内媒报道,该模型以腾讯今年3月初发布的「混元Turbo S」为基座打造,是一款能秒回、吐字快、擅长超长文处理的强推理模型。通过大规模强化学习并结合专项优化,混元T1正式版进一步提升了推理能力,与此前已上线腾讯元宝的「混元T1-preview」模型相比,综合效果有明显提升。

技术层面上,混元T1正式版沿用了混元Turbo S的创新架构,采用Hybrid-Mamba-Transformer融合模式。据报这是业界首次将混合Mamba架构无损应用于超大型推理模型。

输入价为1元/每百万tokens

该架构有效降低了传统Transformer结构的计算复杂度,减少了KV-Cache(一种大模型推理性能优化技术)的内存占用,从而显著降低训练和推理成本,让混元T1实现首字秒出,吐字速度最快可达80tokens/s(Token为处理文本的最小单元)。

定价方面,混元T1目前已在腾讯云官网上线,输入价格为1元人民币/每百万tokens,输出价格为4元人民币/百万tokens。