主题:Qwen3.5系列模型包揽Hugging Face趋势榜TOP5其中4席
2月26日,据千问大模型消息,Qwen3.5系列模型上线短短时间,包揽Hugging Face趋势榜TOP5中的4席,其中Qwen3.5-35B-A3B在不到发布24小时内就成功登顶。
同时千问表示,在Hugging Face当前Top10开源模型中,还有3款模型是千问的衍生或量化版本模型。来源/千问大模型
据悉,2月16日,千问正式发布Qwen3.5,并推出Qwen3.5系列的第一款模型 Qwen3.5-397B-A17B 的开放权重版本。
该模型采用创新的混合架构,将线性注意力(Gated Delta Networks)与稀疏混合专家(MoE)相结合,实现出色的推理效率:总参数量达 3970 亿,每次前向传播仅激活 170 亿参数,在保持能力的同时优化速度与成本。
回帖(0):全部回帖(0)»