NVIDIA于2025年8月18日开源发布轻量化多模态大模型Nemotron Nano 9B V2(非推理版),参数90亿,支持文本等输入。该模型具备高吞吐(135 tokens/秒)、低首次响应时间(582秒),智能、编码、数学能力指数分别达13.2、7.5、62.3(全球排名分别为#303、#286、#113)。定价为输入$0.05/百万tokens、输出$195/百万tokens,适用于高速
新闻 人工智能 网络安全 DeFi 与区块链 金融 游戏 初创企业 科技 行业 研究 资源 文章 指南 案例研究 白皮书 AI 模型排行榜 AI 工具 新内容 通讯订阅 + 更多
术语表 对话栏目 活动资讯 关于 关于我们 联系我们 免责声明 法律与隐私政策 合作邀请 订阅
无结果 查看全部结果
AI 科技 网络安全 金融 DeFi 与区块链 初创企业 游戏 新闻
人工智能 网络安全 DeFi 与区块链 金融 游戏 初创企业 科技 行业 研究 资源 文章 指南 案例研究 白皮书 AI 模型排行榜 AI 工具 新内容 通讯订阅 + 更多
术语表 对话栏目 活动资讯 关于 关于我们 联系我们 免责声明 法律与隐私政策 合作邀请 订阅
无结果 查看全部结果
无结果 查看全部结果
NVIDIA Nemotron Nano 9B V2(非推理版) ← AI 模型 NVIDIA 2025 年 8 月 18 日
NVIDIA 开源模型许可协议 参数量:90 亿(9B) 模态类型:多模态统一模型(支持文本等输入) 智能指数:13.2(全球排名 #303/442) 编码能力指数:7.5(#286/348) 数学能力指数:62.3(#113/264) 处理速度:135 tokens/秒 首次响应时间(TTFT):582.00 秒
定价: - 输入(in):$0.05 / 每百万 tokens - 输出(out):$195.00 / 每百万 tokens
NVIDIA Nemotron Nano 9B V2(非推理版)是 NVIDIA 从零开始训练的大型语言模型(LLM),专为兼顾推理与非推理任务而设计。该模型在响应用户查询或执行任务时,会先生成一段推理过程(reasoning trace),再给出最终结论。其推理能力可通过系统提示(system prompt)进行调控:若用户偏好跳过中间推理步骤、直接获得答案,则可将其配置为“非推理模式”;但此时对于需要复杂推理的高难度问题,准确率可能略有下降。相反,启用推理路径后,通常能更高质量地解决各类查询与任务。
作为 NVIDIA 最新推出的轻量化高效模型,NVIDIA Nemotron Nano 9B V2(非推理版)具备极高的吞吐效率——每秒可处理约 134.562 个 token,并以经济实惠的价格面向专业用户群体:输入端按 $0.05 / 百万 token 收费,输出端为 $195 / 百万 token。
[阅读更多 ▼]
来源:
