4月18日|谷歌发布突破性混合推理模型Gemini 2.5 Flash,该模型创新性地引入可调节“思考预算”功能,在保持高性能的同时显著降低使用成本。在闭源思考模式下,其成本仅为0.6美元/百万tokens,相比全功能思考模式(3.5美元/百万tokens)大幅降低600%。值得注意的是,即便在基础模式下运行,其性能依然超越前代Gemini 2.0 Flash。性能表现方面,Gemini 2.5 Flash在大模型排行榜中以1392分ELO评分高居第二,仅次于GPT-4.5-preview,与Grok-3表现相当。
新闻来源 (不包括新闻图片): 格隆汇