返回资讯列表
行业动态

微软推出新 AI:数小时音频瞬间转文字,企业将迎来福音

2026/05/06-201,028 阅读
🚀

微软发布多款内部自研 AI 模型,将通过 Microsoft Foundry 提供商业用途。核心包括:MAI-Transcribe-1,支持 25 种语言的高准确率语音转文本;MAI-Voice-1,具备超逼真语音生成及自定义音色功能;MAI-Image-2,文生图效果位居排行榜前三。此举标志着微软在依赖 OpenAI 之外,正构建自有 AI 阵营,旨在解决成本与速度问题,更好地满足企业用户需求。

不要错过这些

下一篇推荐阅读:

微软现已拥有一款能将数小时音频瞬间转为文本的 AI——企业用户必将青睐有加

新闻

作者: Kevin Okemwa 发布于: 2026 年 4 月 2 日

MAI-Transcribe-1 在全球使用最广泛的 25 种语言中均具备卓越的语音转文本准确率。

点击阅读下一篇文章

AI 首席执行官 Mustafa Suleyman 带领微软发布了一系列内部自研 AI 模型,这些模型将通过 Microsoft Foundry 提供。

(图片来源:Getty Images | Stephen Brashear)

复制链接

Facebook

X

Reddit

Pinterest

Flipboard

Bluesky

Threads

电子邮件

分享本文

0

参与讨论

关注我们

在 Google 上将我们添加为首选来源

通讯订阅

获取 Windows Central 通讯

面向 Windows 和 Xbox 忠实用户的所有最新新闻、评测和指南。

秒速成为会员

解锁独家会员功能的即时访问权限。

请通过其他 Future 品牌的新闻和优惠联系我

接收我们代表可信合作伙伴或赞助商发送的电子邮件

提交您的信息即表示您同意 条款与条件 和 隐私政策,且年满 16 岁。

您已订阅

您的通讯订阅成功

加入俱乐部

完全访问高级文章、独家功能及不断增长的会员奖励列表。

探索

此电子邮件地址已存在账户,请登录。

订阅我们的通讯

*

微软正在生成式 AI 领域加大投入力度,推出了包括"MAI-Transcribe-1"在内的新型内部自研 AI 模型。这是一款先进的转录模型,旨在为全球使用最广泛的 25 种语言提供顶尖的语音转文本准确率,使其成为会议记录、隐藏式字幕或其他形式语音听写的理想选择。

MAI-Transcribe-1 将与 MAI-Voice-1 和 MAI-Image-2 一同在 Microsoft Foundry 平台上提供:

“随着此次发布,MAI 模型将首次广泛适用于商业用途,使客户能够评估并利用转录、语音和图像生成模型进行构建,”微软表示。

微软表示,MAI-Voice-1 搭载了超逼真语音生成功能,可在长篇内容中保留说话者的身份特征及情感表现力。它还配备了一项新的语音提示功能,仅需一分钟音频即可创建自定义品牌音色。

*文章继续下方*

此外,MAI-Image-2 是微软新的文生图模型,擅长处理自然光照、准确肤色及清晰的图内文字。更重要的是,它在 Arena.ai 文生图排行榜 中排名前三。

那么,微软是在建立自己的 AI 阵营吗?

众所周知,微软严重依赖 OpenAI 的 AI 技术,并已将其深度集成到自身的技术栈中。然而,这家科技巨头曾公开批评 ChatGPT 制造商的 GPT-4 技术,称其过于昂贵且缓慢,无法满足消费者需求。

去年,微软开始开发 i

来源:

AI人工智能科技行业动态