返回栏目
首页电商 • 正文

访谈 | 从学界到业界,贾佳亚聊了聊加入腾讯优图的初衷与目标

发布时间:  

2017 年 6 月 21 日,在深圳召开的第二届云+未来峰会上,腾讯云发布了战略新品「智能云」,希望借此推动「人工智能即服务」的发展,像获取水和电一样便捷地使用人工智能。此次峰会以「连接·智能·未来」为主题,围绕备受关注的 AI 技术热点,海内外人工智能领域专家以及各行业领军人物在会上共同探讨了云计算与人工智能浪潮下的产业发展趋势。

在峰会上,腾讯优图实验室杰出科学家贾佳亚发表了主旨为《视觉 AI 技术以及其社会价值》的演讲,他在分享中提到:「AI 是一种工具,在于怎么使用」,并进一步强调「正确地运用 AI 技术来促进社会发展,创造社会价值,给人类的生活带来更多的便利。」通过图像分割、人脸匹配、图像问答、电脑作画等大量应用实例和优图实验室公益项目等,贾佳亚不仅让我们知道在视觉 AI 技术方面「我们到哪儿了」,还展示了该技术所产生的社会价值。

贾佳亚于 2017 年 5 月 15 日正式加入腾讯优图实验室。优图成立于 2012 年,已有 5 年的发展历史,优图很强的技术主要包括人脸识别、 图像分类、鉴黄、OCR 等。现阶段,其实验室在语义分割、自然语言和视觉联合系统、人像深度处理和几何深度理解等领域均取得重要成果。优图在这些方向上能做到产品在各个移动和云平台落地。目前,腾讯优图的核心技术通过腾讯云对外开放,为企业、政府及广大开发者提供连接智能未来的新思路。

贾佳亚表示希望在优图内部建立系统化工程,把新技术开放出来,把第一线研究创新的基因在腾讯平台上强化和扩大,在优图团队里提供给尖端视觉科学家和一流研究人员所需的研发环境,产生论文和专利,让更多人知道其创造的技术。腾讯优图今后会侧重新技术与工程人员、商业人员的配合,推动自研 AI 技术系统化,并应用到具体产品中,增强用户体验。

演讲之后,机器之心对贾佳亚进行了采访,以下为访谈内容:

机器之心:对您而言,优图实验室最吸引您的是什么?相比在学校或其他创业公司,腾讯的资源优势是不是更加明显?

贾佳亚:现在做 AI 的创业公司绝大部分是做 B2B 业务,因为 AI 技术出身的公司想做 2C 业务会面临巨大挑战,你需要有产品经理,你要了解用户喜好,这与技术是完全不同的事情。所以很多的 AI 创业公司做 2B 业务,而且把 2B 业务做大是他们的基本目标。

优图不同之处在于,我们反而更希望通过腾讯这样一个有巨大网络社交平台的优势发展 2C 业务,就是看我们能不能在技术上真正找到用户的痛点,然后把技术直接连接到个人用户上,让每个人可以通过图象、相册、视频等产品体验到这些技术的价值。腾讯是一个很好的平台,让我们去探索如何把技术直接推动到一个终端用户的眼前,这是跟大部分技术公司不一样的地方,也决定了优图和其它技术型 AI 创业公司的侧重点有所不同。你可以想象当我们有了腾讯云,直接把所有技能放到云上的时候,可以立刻排布到各个政府系统新的城市构建上面,甚至是公安、教育、医疗方面,这些都是用户看到、能使用的技术应用场景。

和学校相比,腾讯有大量非常强大的工程人员,他们把一些想法优化到手机端,单机能跑可能只需要一两个星期,对我而言这是很大的优势。而加入其他公司,要同时兼顾产品、算法和长期研究,我觉得个人精力是跟不上的。

机器之心:您到优图以后,感觉业界与学界有什么不同吗?

贾佳亚:区别很大,学校里大部分是做长期研究,但在公司里必须有一个取舍,做中长期目标的同时,必须兼顾短期目标,把一些问题做到产品里去。这种区别会促使我现在做很多工作(甚至招聘)时都会考虑两者的兼顾。我们会长期作为后端对整个深度学习网络做训练或者改进,同时我们前端也有很强大的工程人员迅速把一些短期的工程做到产品里去。

机器之心:您在优图有哪些想做的事情?

贾佳亚:我在优图想做的事情大概有三件。我们有很多很酷的想法,但是实际上并没有能力进行落实。我来工业界最重要的目标是希望能改变以往这种尴尬的局面。很酷的想法不会有人帮你实现,除非算法层面做到演示版本,演示版本落到手机端要大量的精力,从落地、维护、收取费用、bug 修理到最后的新版本滚动需要三个月,三个月发一个新版本在学校做不了。我觉得这是我自己的痛点,研究了这么有趣的东西,却不能付诸实施;我来到工业界,加入腾讯,最有兴趣做这样的事情。这是第一件。

把研究和产品结合起来,这是第二件事情。腾讯的产品偏重于做工程,即把用户体验做好,所以腾讯产品经理很了不起,他们把用户体验做得非常强。我想能不能把 AI 的技术放到产品里面去,不仅是在界面上或者用户体验习惯上帮助用户,甚至还可以自动学习用户的习惯。

最后一件事情是我希望能够做一条新路出来。在整个业界,在美国或者谷歌或者 Facebook,其实并没有一套关于如何在企业内做研究的非常完整的系统方案;在企业做研究是新课题,管理、技术的应用、科技人员的招聘,这些都是新课题。我觉得 MBA 课要开这样的课程,即企业如何吸引到最好的科研人员,同时帮助企业把做出来的科研用上。这是我自己提出的一个新课题,在企业里做研究。我希望在腾讯这样非常好的大企业里,开展这样的研究。我估计在下一代高新企业或者以后的 IT 企业之中,存在这样的一群人,他们既懂技术,又能和其他人合作做好事情,进而成为企业的中坚力量,并且还是企业发展最重要的核心骨干。

机器之心:优图实验室成立于 2012 年,发展时间有 5 年,期间有哪些重要的探索和突破?

贾佳亚:说到优图,最初期上海团队做了很了不起的工作。早期优图是做音、视频的编解码,这是比较传统的事情。后来他们做了巨大的转型,专注于人脸识别,当时优图团队的规模很小,几个人到十几个人。做人脸这块的时候优图很辛苦。虽然大家知道腾讯这边有很多数据,但是优图是拿不到微信和 QQ 的数据的,而是靠自己的能力通过网上寻找或者找其他公司购买,甚至自己标注的方法拿到数据,然后开始艰难地做人脸识别。

后来深度学习爆发,优图转用深度学习,人脸识别准确率明显上升,这个过程很快。优图的前几年,大家一直兢兢业业像慢速火车向前,速度起来之后,突然感觉到,从去年开始到今年,优图的人脸识别,不管是准确度、数据规模还是标注的数量和应用范围,都在呈几何型增长。我们有超过 30-50 个不同项目,都是人脸这块。

从去年开始,优图开始进入其他领域,起步虽晚,但是优图解决问题的能力很强。而且依托于优图的大团队(上海有超过 100 位同事做各方面的研究和开发),同时我们有自己比较大的运算集群,使得这一年里优图发生了很大的变化;而且我来以后,在深圳建立了部门,所有的架构(计算架构和人员架构)都已超过预期,这是一个很好的开始。所以到现在为止,仅是在手写识别或者书面文字识别这块,我们有 20 多个项目,这是很大的一块。优图还在发力教育,不过是刚开始,还有医学上也是刚起步。

机器之心:优图与 AI Lab 之间是什么关系?有什么区别?

贾佳亚:腾讯内部之所以有优图和 AI Lab,是希望专注于做不同的探索。AI Lab 专注于做基础研究和应用的深度探索,比如现在的绝艺,在围棋上很有意义,能把公司品牌和能力充分体现出来。这是一个基础研究,在公司里,你说 QQ 上怎么用这套技术,可能也是大家需要探索的内容。优图定位在事业群里,所以我们会在应用上做得比较多,并迅速把应用上线,这是两者最大不一样的地方。我也是在慢慢适应这种变化,以前做研究非常慢,慢慢做,做好了就做,做不好就等下一年,到变成现在很多的需求过来,比如在公司级或者公司外偏人脸或者 OCR 需求过来的时候,优图要迅速满足甚至调整其系统,以做到更好。这是我们优图团队比较强的地方,也是我们侧重加强的点。

当然还有其他的组,在内部都会再发力,因为 AI 这个事情,并不是公司里面需要一个 AI Lab 就好了,或者 AI 需要一个研究院就好了。整个 AI 布局把 AI 研究院打散了,成立了多个部门,每个部门下面都有一堆科学家或者开发人员负责开发项目。这很正常,一个大公司到了几万亿体量的时候,内部产生一些团队来做不同的事情,这是必然的发展。

机器之心:优图未来的目标是什么?

贾佳亚:出于腾讯战略和优图发展的考虑,我们希望优图专注于做更大的场景。优图会依赖于云平台做城市级规划的项目,从城市级的开发或者管理层面,优图进去帮助云和云结合起来。对于城市规划,视觉是最重要的部分,大部分城市管理要看具体数据,有多少人,多少辆车,路线是否满负载,还是这里发生事情有多少人应急,这是具体数据和具体事件的描述,所以一定要视觉。

我的目标是优图在短期或者中长期范围内,我们能做多大,比如规模上做到管理超过 10 万级的摄像头,或者是超过 10 万级去到百万级的时候,这对我们的技术有什么挑战?这绝对有挑战,不会说技术生产出来就可以在各个档次的数量上解决问题。在规模上,从千到万这是一个跳变,从十万到百万的时候,涉及种类和复杂度是远高于我们想象的。我觉得优图会朝着这个方向走,把自己做大,做大的意思不但是团队做大,重要性做大,我们要做大的项目,希望从城市级的角度把能力体现出来,这是最容易体现能力的地方。与此同时,优图也有很多其他的想法,比如研究的突破,我希望借助优图很好的体系架构把技术突破变成有趣的东西,这是我们正在探索的。

优图要走两条路,一是往高精尖走;二是积累实力。把能力扩充上去,实现百万级数据量或者在腾讯视频或者直播平台上,能够运行 AI 的算法,这是我们将来想做的事,或者现在就在推动的。
更多关注:京财时报

    相关文章Related

    返回栏目>>

    首页   |   帮助

    Copyright © 2008-2016 备案号:京ICP备09109218号 网络视听许可证:1908457号 增值电信业务经营许可证:京-20080118 关于同意投资观察界设立互联网站并提供新闻信息服务的批复 Power by DedeCms