模型档案
Google: Gemini 2.5 Flash Lite
现 #11reasoninggoogle/gemini-2.5-flash-lite · 厂商 Google
Gemini 2.5 Flash-Lite 是 Gemini 2.5 系列中的轻量级推理模型,专为超低延迟和成本效率优化。与早期的 Flash 模型相比,它提供了更高的吞吐量、更快的 token 生成速度,并在常见基准测试中表现更佳。默认情况下,“思考”(即多轮推理)功能被禁用以优先保证速度,但开发者可以通过 [Reasoning API 参数](https://openrouter.ai/docs/use-cases/reasoning-tokens) 启用该功能,从而在成本与智能之间进行选择性权衡。
输入价 / M token
$0.10
输出价 / M token
$0.40
上下文窗口
1.0M
tokens
本周 tokens
475.16B
综合榜
能力
输入模态
text · image · file · audio · video
输出模态
text
知识截止
2025-01-31