关闭 x
算力网算力网

    OpenAI泄露消息透露,下一代GPT-BiDi-1语音模型可能正在开发中

    2026-06-25

    英伟达推出Halos for Robotics,弥合物理AI安全鸿沟

    2026-06-23
    • 官 网:www.suanliW.com
    • 算力租赁平台
    • 中国算力网
    • 全站索引
    • 行业报告网

    算力网官网 算力网官网

    算力云选购指南
    • 首页
    • 行业新闻
      • 数据中心
      • AI
      • 芯片
      • 网络通信
      • 产业综合
    • 市场报告
    • 算力百科
    • 算力版图
    • 算力投资
    • 算力经济
    算力网 算力网

    火山引擎豆包音频生成模型1.0来袭:一键生成完整音频,长音频音色始终如一

    2026-06-25 01:19 来源:算力网 类别: AI
    分享

    火山引擎近日推出了一款名为豆包音频生成模型1.0(Doubao-Seed-Audio 1.0)的创新产品,标志着音频创作领域迎来重大变革。这款模型突破传统音频制作模式,支持以文本或音频为输入,通过单一指令即可生成包含对白、音效和背景音乐的完整音频作品,彻底颠覆了人工多轨剪辑的繁琐流程。

    在传统音频制作中,创作者需要分别生成对白、音效和配乐,再通过手动对齐和多轨混音完成作品,这一过程不仅耗时耗力,还高度依赖专业后期技术。豆包音频生成模型1.0将这一复杂流程简化为一条指令:用户只需在提示词中定义角色台词、语气、情绪节奏,嵌入笑声、叹息等细节,模型即可同步生成背景音乐与环境音效,直接输出可上线的成品内容,如有声剧、播客节目或品牌音频。

    针对长音频创作中角色音色前后不一致的痛点,该模型通过文生音频与参考音频的深度联动技术,实现了单次2分钟音频创作及多次延长功能下的音色统一。这意味着在有声书、播客或长剧集等场景中,角色在第1分钟与第10分钟的音色将保持高度一致,创作者无需反复比对修音,显著提升了制作效率与作品质量。

    更值得一提的是,模型支持音色与风格的解耦控制,同一音色可适配不同情绪和语境,甚至实现“一声多角”的差异化表达。例如,同一个声音可在不同角色设定下呈现截然不同的语气特征,为角色配音和创意音频生产提供了更大灵活性。目前,火山方舟已开放API邀测,个人用户可在体验中心获得30分钟免费创作额度,该模型也将陆续接入剪映、即梦、番茄等平台。

    1 语音模型 火山引擎

    猜你喜欢

    1. OpenAI泄露消息透露,下一代GPT-BiDi-1语音模型可能正在开发中
    2. OpenAI泄露消息透露,下一代GPT-BiDi-1语音模型可能正在开发中
      OpenAI泄露消息透露,下一代GPT-BiDi-1语音模型可能正在开发中
    3. AI服务器推高PCB加工门槛,国产硬质涂层设备如何重塑良率与成本?
      AI服务器推高PCB加工门槛,国产硬质涂层设备如何重塑良率与成本?
    4. 英伟达推出Halos for Robotics,弥合物理AI安全鸿沟
      英伟达推出Halos for Robotics,弥合物理AI安全鸿沟
    热点关注

    千问发布Qwen-AgentWorld:AI智能体迈向多环境适配新征程

    2026-06-25

    大厂纷纷发力,面板级封装与玻璃基板市场竞赛激烈

    2026-06-25

    台积电先进制程可能涨价 5%至 10%

    2026-06-25

    云天畅想茅晓东:落地超上百个边缘算力节点,端到端时延实现毫秒级

    2026-06-22
    算力云租赁平台

    关于我们 商务合作 版权声明 隐私政策 算力租赁平台 算力指数

    友情链接: 中国算力网官网 算力云 中国闪存网 中国存储网 IT采购网 行业报告

    © 2026 算力网 版权所有 - www.suanliW.com ,Power by 中国算力网

    输入关键词,按 “回车键” 开始搜索,按 “ESC键” 取消。