作者 | Clara Deng
编辑 | Clara Deng
武媚娘装、小学生照、军装照……自 2014 年上线以来,由腾讯打造的天天 P 图数次登上中国大陆及港澳台地区的 AppStore 总榜第一,红遍了马来西亚和越南等国家,开启了亚太地区全民“换装”热潮。
天天 P 图用到了哪些黑科技?技术团队遇到过哪些技术难点?他们如何用最小成本快速验证创意?接下来,我们将为你一一揭晓。
天天 P 图用到了非常多最新的 AI 技术,比如人脸识别,五官定位,体态识别,手势识别,背景语义分割等,这些基于深度学习的技术很好地提升了 P 图的玩法体验,让用户可以用摄像头体验丰富的 AR 玩法。
以实时美妆为例,第一步是人脸检测,通过摄像头采集图像,在图像中找到人脸的位置。第二步是利用基于深度神经网络的五官定位技术进行人脸配准,第三步则是人脸识别,再用不同的算法对不同的面部区域进行处理。
在这个过程中,如何实现精确的人脸识别的动态追踪是一个技术点。当然,这里涉及到大量的技术细节,大体说是根据特定场景问题设计算法模型并构建训练样本,充分利用设备的算力,由粗到精,逐层次优化计算结果。
换装换脸是天天 P 图最火的一个玩法,这里有一个问题,就是人脸融合后的真实度。人脸融合,本身是基于五官定位技术,先对两个图片进行五官定位,之后基于定位点构成的面片进行融合,需要融合时候尽量让用户的图像和五官比例发挥更大的作用,另外模特的脸型五官比例也非常重要,一般我们会采用一些和平均脸五官比例比较接近的模型,避免模特的特征带歪效果。
在实现各个功能的过程中,我们遇到过不少难点,像面部遮挡这一类的问题还比较容易解决,可以在训练时建设一些遮挡样本来取得比较好的结果,神经网络在这个问题上的兼容性还不错。比较难的还是下面这些,比如移动端的运算能力很多时候仍然跑不了最新的神经网络,就需要对神经网络进行裁剪瘦身,从而在效果和性能上做一些折中。我们这里也有专业的工程优化团队,对框架进行工程加速。另外,在人脸追踪效果上,检测和识别也不一定能做到每一帧都很准确,这里也需要业务逻辑进行一些优化。
目前图像领域友商的竞争一直都是很激烈的,同类型的产品很多,为保持技术优势,我们一直实时跟进最新研究成果和市场动态,并且和腾讯内部的 AI 研究团队紧密结合,并成立独立的前沿图像技术团队,不断对已有技术进行优化升级。
AI 会极大提升我们编辑视频图像的效率,现在只是一个初级阶段,目前一些头部公司公布的成果已经可以用最新的生成对抗网络 GAN 直接生成可以以假乱真的人像,比如假脸王 DeepFake 和 StyleGan,它们都用到了 GAN。GAN 这里生成人脸和改变人脸特征的效果非常惊艳,能够帮助我们对一些复杂场景进行编辑,但目前来看编辑的结果有一定的不确定性,有时候 bad case 看起来也非常奇怪,训练时间一般也比较冗长。我们更看重这里对特征理解层面的价值,也在探究这里神经网络具体特征层和用户特定特征的关系。
我相信未来让 AI 直接对图片进行编辑并不是梦,当然这块推进会需要若干年的时间,因为目前我们对图像语义理解和编辑还没有到一个比较精细化的程度。
AR 和 VR 也会跟 AI 图像有不少的结合点。在近期的一些时间,随着人脸建模,体态识别等技术的快速发展,用手机摄像头能够非常快得生成拍摄用户对应的实时卡通形象(不止是头部)。这块是一个很好的 AR 应用场景。VR 中我更看好的是 AI 辅助自动生产大量的场景,可以无限丰富 VR 的内容。
创意有很多,可以成型上线的却很少,爆款的诞生其实也有迹可循。如果你问我,要怎么验证创意,而且要同时满足低成本和快速这两个条件,那我们的方法很简单粗暴,朋友,PS 了解一下。
要验证成功的产品其实并不一定需要产品完善之后才进行测试,我们一般建议有创意可以用 PS 先实现一个,分享朋友圈后看看结果,未必需要真实实现一个算法或者效果。按照之前的经验,一些会火爆的玩法和大众不感兴趣的玩法在分享反馈上有天壤之别。
每一个产品,从创意诞生到上线,每一个关卡都会遇到大大小小的挑战。既然是爆款,必定会面临大量数据的涌入,维护产品的稳定性也是我们关注的重点。依赖腾讯云我们搭建了可以快速动态扩容的图像服务架构,也搭建了基于 GPU 的处理集群,使得系统的容量可以快速扩容,和高效响应。在人民日报军装照活动中我们在一天之内,协调了 3000 台机器上线,来承载亿级 / 日的图片处理服务。在算法层面我们也做了深度优化,让单机可以承载更多任务。
受访嘉宾:
傅斌,腾讯社交平台部技术总监,腾讯 T4 技术专家,天天 P 图项目技术负责人。主导研发孵化多款千万级日活跃移动端产品,产品多次冲击 AppStore 榜首,AI 应用图像领域资深专家。提供公司级图像算法 AI 组件及图像算法云,支持微信,QQ 等核心业务。设计超大规模图像算法类运营云服务,提供 1 亿 / 日级别图片运营能力。
在即将到来的 QCon 北京 2019 中,他担任“人工智能技术”专题的出品人。该专题特地邀请来自 Facebook、阿里巴巴、百度、腾讯、DeepMap、爱奇艺和顺丰等公司的人工智能场景落地专家,多维度为大家呈现 AI 对行业改造,AI 升级带来的产业硕果。
更多精彩内容请点击 「 阅读原文 」或识别二维码查看。大会报名最后一周,团购可享折扣优惠!报名通道即将关闭,想参会的要抓紧时间了!有任何问题就联系票务小姐姐 Ring 吧!电话:13269076283 微信:qcon-0410
1、头条易读遵循行业规范,任何转载的稿件都会明确标注作者和来源;
2、本文内容来自“InfoQ”微信公众号,文章版权归InfoQ公众号所有。