首页 关于我们 成功案例 网站营销 电商设计 新闻中心 联系方式
QQ联系
电话联系
手机联系
QQ联系
电话联系
手机联系

AI语音生成提速40%!苹果公布PCG技术

发布时间:2026-02-04 00:00
发布者:冷炫風刃
浏览次数:

今日,据外媒9to5mac消息,苹果公司携手特拉维夫大学共同推出一项名为「原则性粗粒度」(pcg)的新型语音合成技术,目标直指ai文本转语音(tts)领域长期存在的推理速度瓶颈。

传统TTS系统普遍采用自回归建模方式,逐帧预测声学token,且严格要求与预设序列完全一致。这种“零容差”机制虽保障了理论精度,却极大拖慢生成节

奏——即便预测结果在听觉层面几无差别,仅因微小偏差也会被判定为失败。

为突破该限制,研究团队创新性地依据人类听觉感知特性,将语义等价或听感相近的声学token聚类整合,构建出多个「声学相似组」。验证逻辑由此发生根本转变:不再苛求token精准落点,而是判断其是否归属目标相似组内,即由“单点匹配”升级为“区间接纳”,大幅增强系统鲁棒性。

在工程实现上,PCG引入「投机解码」双模型协同范式:前端由轻量级小模型高速产出候选token序列,后端则交由大模型进行相似组归属判别。该设计既延续了小模型的低延迟优势,又依托大模型确保输出符合听觉保真标准。

实测数据显示,该方案可将端到端语音生成速率提升约40%,主观自然度评分为4.09(满分为5分)。

在极端扰动测试中,当高达91.4%的原始token被随机替换为同组内其他成员时,词错误率仅上升0.007,说话人身份相似度下降0.027,人耳几乎无法分辨变化。

值得注意的是,PCG属于纯推理层优化方案,无需对已有TTS模型进行任何重训练;仅需额外加载约37MB的相似组索引数据,即可完成部署,兼具高兼容性与极低落地门槛。


# 文本转语音  # 升级为  # 被判  # 可将  # 已有  # 多个  # 也会  # 的是  # 单点  # 特拉维夫  # 前端  # 语音生成  # Token  # 苹果公司  # 大模型  # ai  # mac  # 后端  # 苹果 


相关文章: 游戏主播斥资2500万日元打造类宝可梦游戏 轻松回本还将登陆PS5  苹果首款折叠屏iPhone Fold照搬OPPO铰链:向国产品牌学习  卡牌版文明 王国建造游戏《自动王国》正式推出  CCOO自在智慧卧室与第六空间深化生态战略合作共筑智慧家居新零售新生态  终于告别SMR叠瓦盘!希捷银河Exos 32TB硬盘图赏  拳盾双修!霰弹主 C 妮塔的暴力美学指南  噬晶者战术指南:精准破防,轻松通关!  瑟瑞斯双剑精通指南:灵动剑舞与雷霆之威  大华股份荣获两项教育部科学研究优秀成果一等奖  以AI为翼,吉冉BPA赋能业务流程管理与优化  华为Mate XTs马龙拜年祝福语音上线 唤醒小艺接好运  中国批准字节跳动、阿里巴巴、腾讯採购辉达H200晶片  水下火箭快车!三步打造灵魂沙气泡柱全攻略  OPPO Find N6 传最快农曆年后现身!官方影片公布买摺机顾虑因素、新作目标「填平」摺痕现象?  OPPO高管预热Find N6折叠屏 确认年后发布  Reincubate 起诉苹果侵犯 Camo 专利 称 Continuity Camera 涉嫌抄袭垄断  收纳控必玩!Steam极好评《背包乱斗》手机版双平台正式上线  昆仑天工发布音乐大模型 Mureka V8  外交部提醒:春节期间避免前往日本  健康生活新姿态!打卡14天,与沃莱科技x蚂蚁阿福共迎新起点,好礼同行  让家更懂你三星AI神系列家电重塑现代家庭智慧生活方式  双认证曝光!荣耀600 Lite新机支持eSIM+全功能NFC  火系战队燃爆全图!三大核心配队妙招一次看懂  内存、显卡暴涨被小偷盯上!实体店求生欲拉满:展示机被迫拆空  火焰女王姬子高效清场攻略:AOE 轰炸机养成手册  海信AI生活管家斩获家电智能体年度大奖 冰箱AI美食管家赋能场景智慧升级  10倍光变!OPPO Find X9 Ultra入网,影像堆料堪称 “机圈望远镜”  重掌生活品质主权!小熊小食光电蒸锅破解效率时代的营养悖论  姜维专属宝物全解析 七星金甲与继志铭实战搭配指南  松下首台CSP-L印刷机出货仪式圆满举行为中国电子制造业的发展注入新动力 


相关栏目: 【 科技资讯38001 】 【 网络动态13059 】 【 技术学堂11871 】 【 网络推广75774 】 【 品牌营销52040 】 【 AI推广53525 】 【 推荐站点126806