字节跳动开源最新 GAN 压缩算法,算力消耗可减少至 1/46

字节跳动开源最新 GAN 压缩算法,算力消耗可减少至 1/46

8 月 27 日消息,字节跳动近期开源了一项代号为 OMGD 的压缩技术。这是字节自研的 GAN(生成对抗网络)压缩算法,在保证生成效果不变的前提下,算力消耗最低可以减少到原来的 1/46,相比之前业界的最佳压缩效果提升一倍多。据悉,这项技术的论文已入选国际计算机视觉会议 ICCV 2021。据悉,GAN 是人工智能领域重要的深度学习模型,在图像生成、音乐生成和视频生成等方面应用广泛,还可以提高图像质量,实现图像风格化、图像着色等任务。漫画特效等人们常用的短视频道具,就是通过 GAN 实现的。由...
华为获亲属识别专利授权,可挖掘人脸图像的遗传特征

华为获亲属识别专利授权,可挖掘人脸图像的遗传特征

做啦 8 月 20 日消息 今日,华为技术有限公司获得“亲属识别网络模型的训练方法及装置”专利授权,公开号为 CN109993026B,申请日期为 2017 年 12 月。做啦了解到,该申请属于图像识别技术领域。所述方法包括:获取人脸识别网络模型;将多个预设人脸图像集包括的预设人脸图像输入人脸识别网络模型;通过指定三重损失函数根据第一特征距离与第二特征距离之间的差异值,对人脸识别网络模型中的参数进行调整,指定三重损失函数为光滑的凸函数,第一特征距离为具有亲属关系的预设人脸图像的人脸图像特征之间的...
抖音宣布支持 2K 视频播放

抖音宣布支持 2K 视频播放

做啦 8 月 20 日消息8 月 19 日,抖音宣布支持 2K 超清视频播放,公开信息显示,抖音是国内首家支持 2K 播放的短视频平台。此前,抖音已实现对 HDR 高动态范围和 60 帧高帧率的支持。▲ 不同画质图像对比做啦了解到,2K 指的是视频的长边分辨率约有 2000 个像素。一般来说,分辨率的数值越大,图像细节越多,画面就越精细。如今一些中长视频的制作端和播放端可以达到 4K 甚至更高画质,西瓜视频也已免费开放 4K 画质。但短视频平台普遍将分辨率上限设定在 1080P,即使创作者上传的...
《Pokémon Go》开发公司 Ninantic 入局“元宇宙”

《Pokémon Go》开发公司 Ninantic 入局“元宇宙”

元宇宙是起源于科幻小说中共享数字世界的概念,这个概念在疫情后期的热度越来越高。许多大型科技和游戏公司包括 Facebook、Roblox 和 Epic Games 想要实现这一概念。而 《Pokémon Go》 的开发公司 Ninantic 也加入了这一行列。8 月 10 日,Niantic 表示自己收购了一款名为 Scaniverse 的 3D 扫描应用程序,它会从游戏玩家的智能手机相机中收集图像。将这些图像转化成一张地图,使 Niantic 将数字对象锚定到现实世界中。元宇宙被众多小说家描述...
要求苹果“停止部署照片扫描技术”的公开信已获得近 6000 个签名

要求苹果“停止部署照片扫描技术”的公开信已获得近 6000 个签名

做啦 8 月 9 日消息苹果上周刚刚公布了新的“儿童安全”功能,旨在扩大对儿童的保护。作为儿童保护计划的一部分,苹果将iPhone和其他设备上对用户的图像进行上传和扫描,以此识别用户是否保存了与美国国家失踪和受虐儿童中心 (NCMEC) 数据库中匹配的图像。如果确认,苹果将通知 NCMEC 并禁用其帐户。做啦此前报道,此举遭到包括 4000 多家组织以及安全与隐私专家、密码学家、研究人员、教授、法律专家和苹果消费者的公开反对。该公开信表示,虽然苹果的举动是善意的,因为虐待儿童确实是一个严重的问题...
Facebook 发布 VR 头显新样机,可进行眼神“交流”

Facebook 发布 VR 头显新样机,可进行眼神“交流”

8 月 4 日消息,据外媒 Road to VR 报道,Facebook 现实实验室(Reality Labs)当地时间周一推出了一款头显原型机。人们可以透过头显“看到”佩戴者的眼睛,实现双方之间的眼神交流,避免沟通时无眼神交流会产生的尴尬。不过实际上,观察者看到的并非佩戴者的眼睛的真实图像,而是基于眼球追踪数据应用于佩戴者脸部 3D 模型后显示在头显外侧的图像,主要是依托头显上的光场显示器完成这种显示。该研究题目为《反向透视 VR(Reverse Pass-Through VR)》,当地时间 ...
JPEG XL 图像格式将迎来新改进:免费开源,支持高位深 / HDR

JPEG XL 图像格式将迎来新改进:免费开源,支持高位深 / HDR

做啦 7 月 17 日消息根据外媒 DPReview 消息,JPEG 图像压缩格式的变种 ——JPEG XL 格式将在年底前迎来升级。该格式的发明者表示,JPEG XL 将免费开源提供,更高的压缩效率有助于使全球带宽成本显著降低。最初的 JPEG 格式于上世纪 80 年代由 ISO 组织发明,目前是使用最广泛的图像压缩格式。然而由于该格式压缩效率偏低,随着互联网内容的迅速增长,对于网络带宽以及设备存储空间的压力逐步显现出来。为了应对这一挑战,目前主要流行的格式包括谷歌的 webp,以及 HEIF...
高糊视频秒变 4K,速度比 TecoGAN 快了 9 倍,东南大学提出新的视频超分辨率系统

高糊视频秒变 4K,速度比 TecoGAN 快了 9 倍,东南大学提出新的视频超分辨率系统

把高糊视频变清晰,对于 AI 而言算不上新鲜事。但如果是实时处理,而且速度比主流方法还快了 9 倍呢?而且计算量降低了,重建图像的质量却还非常能打:这种图像质量和速度性能之间的平衡到底是怎么做到的?今天就来看看东南大学的研究者们带来的最新研究:4K 视频实时超分辨率系统 EGVSR。GAN 保证重建质量为了使模型具有良好的感知质量,生成对抗网络 GAN 成为了超分辨率研究中广泛使用的一种方法。比如,要处理 VSR 任务中大规模的分辨率退化,就常常依靠 GAN 的深度特征学习能力。于是参考 Tec...
顺丰公开“物品违规抛扔检测”相关专利,可通过监控视频判断你的快递是否被“虐待”

顺丰公开“物品违规抛扔检测”相关专利,可通过监控视频判断你的快递是否被“虐待”

做啦 7 月 14 日消息快递服务,即又快又好地把货物从一端送到另一端。目前为止,大多数快递公司都在如何更快地运送上下功夫,不断优化流程与算法。现在,顺丰打算从“质量”出发,在力求快的同时,给用户一个完整的快递。企查查 App 显示,近日,顺丰科技有限公司公开“物品违规抛扔检测方法、装置、服务器及存储介质”专利,公开号为 CN113065378A。做啦了解到,专利摘要显示,本发明通过对监控视频中的帧监控图像进行语义分割处理,能够准确的得到包含有物品和人的抛扔图像,以确定物品的抛扔方向和抛扔区域。...