NVIDIA Nemotron Nano 9B V2（非推理版）发布，轻量级模型引领高效AI新趋势

新闻人工智能网络安全 DeFi 与区块链金融游戏初创企业科技行业研究资源文章指南案例研究白皮书 AI 模型排行榜 AI 工具新内容通讯订阅 + 更多

术语表对话栏目活动资讯关于关于我们联系我们免责声明法律与隐私政策合作邀请订阅

无结果查看全部结果

AI 科技网络安全金融 DeFi 与区块链初创企业游戏新闻

人工智能网络安全 DeFi 与区块链金融游戏初创企业科技行业研究资源文章指南案例研究白皮书 AI 模型排行榜 AI 工具新内容通讯订阅 + 更多

术语表对话栏目活动资讯关于关于我们联系我们免责声明法律与隐私政策合作邀请订阅

无结果查看全部结果

NVIDIA Nemotron Nano 9B V2（非推理版） ← AI 模型 NVIDIA 2025 年 8 月 18 日

NVIDIA 开源模型许可协议参数量：90 亿（9B）模态类型：多模态统一模型（支持文本等输入）智能指数：13.2（全球排名 #303/442）编码能力指数：7.5（#286/348）数学能力指数：62.3（#113/264）处理速度：135 tokens/秒首次响应时间（TTFT）：582.00 秒

定价： - 输入（in）：$0.05 / 每百万 tokens - 输出（out）：$195.00 / 每百万 tokens

NVIDIA Nemotron Nano 9B V2（非推理版）是 NVIDIA 从零开始训练的大型语言模型（LLM），专为兼顾推理与非推理任务而设计。该模型在响应用户查询或执行任务时，会先生成一段推理过程（reasoning trace），再给出最终结论。其推理能力可通过系统提示（system prompt）进行调控：若用户偏好跳过中间推理步骤、直接获得答案，则可将其配置为“非推理模式”；但此时对于需要复杂推理的高难度问题，准确率可能略有下降。相反，启用推理路径后，通常能更高质量地解决各类查询与任务。

作为 NVIDIA 最新推出的轻量化高效模型，NVIDIA Nemotron Nano 9B V2（非推理版）具备极高的吞吐效率——每秒可处理约 134.562 个 token，并以经济实惠的价格面向专业用户群体：输入端按 $0.05 / 百万 token 收费，输出端为 $195 / 百万 token。

[阅读更多 ▼]