模型档案

Google: Gemini 2.5 Flash Lite

现 #11reasoning

google/gemini-2.5-flash-lite · 厂商 Google

Gemini 2.5 Flash-Lite 是 Gemini 2.5 系列中的轻量级推理模型，专为超低延迟和成本效率优化。与早期的 Flash 模型相比，它提供了更高的吞吐量、更快的 token 生成速度，并在常见基准测试中表现更佳。默认情况下，“思考”（即多轮推理）功能被禁用以优先保证速度，但开发者可以通过 [Reasoning API 参数](https://openrouter.ai/docs/use-cases/reasoning-tokens) 启用该功能，从而在成本与智能之间进行选择性权衡。

输入价 / M token

$0.10

输出价 / M token

$0.40

上下文窗口

1.0M

tokens

本周 tokens

475.16B

综合榜

能力

输入模态

text · image · file · audio · video

输出模态

text

知识截止

2025-01-31

← 返回总榜