科大讯飞宣布进军音乐产业,推出讯飞音乐厂牌

科大讯飞宣布进军音乐产业,推出讯飞音乐厂牌

做啦 9 月 26 日消息今日科大讯飞举办了音乐新声发布会,正式发布“讯飞音乐”厂牌,同时多名已签约艺人亮相。科大讯飞高级副总裁、讯飞研究院院长、消费者事业群总裁胡国平,现场介绍了科大讯飞的语音技术,及其与音乐领域的交互应用。胡国平院长表示,语音技术融入音乐,势必对音乐行业有深刻影响,甚至帮助整个行业实现质的飞跃。相信未来科大讯飞在人工智能和智能语音领域将会持续开拓创新,碰撞出更多精彩的火花。发布会开场,科大讯飞 AI 虚拟主播“爱加”现身,并一展歌喉,演唱了讯飞音乐今年发行的歌曲《目及皆是你》...
语音识别大拿 Daniel Povey 发布新一代框架 Kaldi,有望年内应用于小米产品

语音识别大拿 Daniel Povey 发布新一代框架 Kaldi,有望年内应用于小米产品

8 月 31 日,Daniel Povey 以小米集团首席语音科学家的身份,正式推出了新一代 Kaldi。Daniel Povey 是语音识别领域的执牛耳者,他主要开发和维护的开源工具 Kaldi,是业界公认的语音识别框架的基石,他也被称为 Kaldi 之父。2019 年 Daniel 离任约翰霍普金斯大学语言和语音处理中心教职,在 Facebook、美团、滴滴、快手等一众互联网巨头抛来的橄榄枝中选择了小米,开始带领小米语音技术团队开发新一代 Kaldi。加入小米后,业界开发者对 Daniel ...
沈抖:百度 App 语音搜索识别准确率已达 98%

沈抖:百度 App 语音搜索识别准确率已达 98%

做啦 8 月 18 日消息在百度世界大会上,百度集团执行副总裁沈抖表示,目前,百度 App 语音搜索识别准确率已经达到 98%。据沈抖介绍,在 AI 技术的加持下,百度 App 的搜索功能有了更多的交互形式,从文字输入到语音、图片、人工问答,搜索的展现形式和应用场景正在不断扩大,能够提供的服务也更加全面和智能。同时能准确识别多轮对话、长句、中英文混杂、生僻字、方言等。做啦了解到,在本次百度世界大会上,百度发布了 Apollo“汽车机器人”,支持 L5 级自动驾驶,还发布了无人车出行服务平台“萝卜...
三星 Bixby 语音助手性能提升,响应速度提高 35%

三星 Bixby 语音助手性能提升,响应速度提高 35%

做啦 8 月 12 日消息三星昨晚举行了 Galaxy Unpacked 活动,主要介绍了 Galaxy Z Fold3 5G 和 Galaxy Z Flip3 5G 等新品硬件上。不过,三星也花了几秒钟时间提到了自家的语音助手 Bixby,特别是它的性能。三星官方表示:“Bixby 现在比以前快 35%,因为它可以在设备上检测和处理你的声音,而无需通过服务器。”这一改进听起来与谷歌、亚马逊等做法类似。随着 Pixel 4 和 4 XL 的发布,谷歌于 2019 年开始将一些语音处理转移到设备本...
京东语音打车专利获授权:当地址不唯一时,可引导乘客补充语音

京东语音打车专利获授权:当地址不唯一时,可引导乘客补充语音

做啦8 月 11 日消息 京东在昨日获得了“语音打车方法及系统”专利授权,公告号 CN109949800B,申请日期为 2017 年 12 月。企查查专利摘要显示,本发明公开了一种语音打车方法及系统,所述语音打车方法包括:获取乘客的语音信息;从语音信息中提取目的地信息;判断与目的地信息对应的地址信息是否唯一,若否,生成提示信息;提示信息用于提示再次获取乘客的语音补充信息;获取乘客的语音补充信息;从语音补充信息中提取目的地补充信息;根据目的地信息和目的地补充信息确定唯一对应的地址信息;根据唯一对应...
小米获“语音消息断点播放”专利授权

小米获“语音消息断点播放”专利授权

做啦8 月 9 日消息 小米公司在近日获得了一项“语音消息播放方法及装置”专利授权,公告号 CN109245997B,申请日期为 2018 年 9 月。据企查查显示,本公开关于一种语音消息播放方法及装置,属于计算机技术领域。所述方法包括:在播放即时通讯应用中的语音消息的过程中,响应于接收到的第一触发信号,暂停播放所述语音消息,并为所述语音消息设置断点;接收第二触发信号;响应于所述第二触发信号,从所述断点处开始播放所述语音消息。本公开实施例避免了从头开始播放语音消息时,重新播放已经播放过的语音消息...
华为公开语音消息预览专利,可转换文字并显示于特定位置

华为公开语音消息预览专利,可转换文字并显示于特定位置

做啦 8 月 6 日消息 今日,华为技术有限公司公开了“一种语音消息预览方法及电子设备”专利,公告号为 CN113220258A。企查查专利摘要显示,语音消息预览方法属于消息预览领域,该方法包括:电子设备全屏显示第一应用窗口;在接收的第二应用的语音消息为重要语音消息时,将该语音消息进行语音消息预览;在接收的第二应用的语音消息为非重要语音消息时,存储并在第一应用窗口的当前界面为非重要界面时,将该语音消息进行语音消息预览。将该语音消息进行语音消息预览包括:将该语音消息转换为文字消息后,将该语音消息与...
世界最大的多语言语音数据集现已开源:超 40 万小时,共 23 种语言

世界最大的多语言语音数据集现已开源:超 40 万小时,共 23 种语言

最近,Facebook 开源了目前世界上最大的多语言语音数据集,VoxPopuli:这一数据集共涵盖了 23 种语言,时长超过 40 万小时。其中,每种语言都有 9000 到 18000 小时的无标签语音数据。此外,还包括了共 1800 小时,16 种语言的转录语音数据,以及 17300 小时,15 种目标语言的口译语音数据。国外网友很快为这一行为点赞:显然,如果数据集已经存在,那么它应该被利用,并以一种道德的方式来改善人类社会。这一数据集庞大的无标签数据量和广泛的语言覆盖率,对改进自监督模型有...
谷歌、大众加持的出门问问:多家线下店关闭,IPO 一拖再拖

谷歌、大众加持的出门问问:多家线下店关闭,IPO 一拖再拖

头顶着谷歌和大众汽车光环的 AI 语音独角兽出门问问,已有四年多的时间没有看到公开融资的消息。从语音搜索服务起步,到布局消费级硬件,出门问问的商业化尝试可谓艰难。曾具有先发优势的智能音箱领域已经被放弃,智能耳机不温不火,智能手表已然成为 C 端重点,但还未占到一席之地,更面临苹果、华为、三星等强敌。搜狐科技通过查询及走访还发现,出门问问的多家线下门店早已歇业关闭,曾经雄心勃勃的新零售计划基本宣告破产,渠道成为这家公司 C 端业务的一大掣肘。与此同时,出门问问也在布局 TOB,尤其是在车载领域,与...
高德地图「于谦哪儿都熟」相声导航语音包正式上线

高德地图「于谦哪儿都熟」相声导航语音包正式上线

做啦 7 月 15 日消息7 月 15 日,高德地图在北京召开品牌升级发布会,宣布向“出门好生活开放服务平台”升级,并推出全新品牌主张“高德地图,哪儿都熟”。高德地图表示,将打造出门好生活开放服务平台,目前除了大众熟知的地图导航、高德打车之外,高德地图上已经聚合了吃喝玩乐行等多种基于位置的出门服务。高德地图今天宣布,哪儿都熟相声语音包上线,该语音导航使用了相声演员于谦的配音版本。高德地图中搜索“于谦”即可下载。今天上线的于谦版本导航语音,是与德云社相声演员于谦合作,用户下载使用后将可以在导航中听...
东联 Yandex 西合 Mail,曝小米将向俄罗斯市场推出智能音箱

东联 Yandex 西合 Mail,曝小米将向俄罗斯市场推出智能音箱

做啦 7 月 12 日消息俄罗斯《生意人报》援引消息人士的话披露称,中国小米公司计划在一个月内在俄市场推出智能音箱,这款产品将预装俄 Mail.ru 的“玛鲁夏”(Marusya)语音助手。据称,小米正在与俄罗斯另外一家网络巨头 Yandex 公司及其语音助手“阿利萨”(Alisa)紧密合作,可操控自 2019 年起的小米智能家居设备。值得一提的是,小米驻俄罗斯代表处发言人表示,该公司无意放弃与 Yandex 的合作。Yandex 方面则回应称,与小米的伙伴关系正在向前发展,已经有逾 50 万台...
山东移动实现全国首个 5G 商用网络 VoNR 入网验证

山东移动实现全国首个 5G 商用网络 VoNR 入网验证

做啦 7 月 1 日消息近日,山东移动携手华为,完成现网 IMS 设备升级,在济南成功打通 5G 商用网络的 VoNR(Voice over NR)Firstcall,标志着中国移动 5G VoNR 商用成熟度又向前迈出了关键一步。5G 初期,业界主要通过话音回落 LTE 的方式,通过 VoLTE 技术提供语音服务。VoNR 是 5G 网络的终极语音解决方案,接通更快,语音更清晰,视频更流畅。在 2021 年一季度,中国移动集团发布的《5G 手机产品白皮书》中明确要求在当年 10 月份后,所有的...