南风娱乐网致力于优质软件,活动线报,游戏辅助,绿色工具等资源共享,好货不私藏!
精品资源,免费分享

华为诺亚方舟实验室(华为诺亚方舟实验室待遇)

作者:南风

12月6-8日,为期三天的“2019世界创新者年会”在北京成功举办。大会由中国企业联合会指导,亿欧EqualOcean和工业和信息化科技成果转化联盟共同主办。大会以“科技4.0:构建全球化新未来”为主题,汇聚了来自美国、英国、印度、新加坡、印度尼西亚、尼日利亚、巴基斯坦、日本、以色列等十余个国家或地区的6000名创新者,总结2019年世界科技与产业创新成果。

本次论坛邀请了华为诺亚方舟实验室计算视觉首席科学家田琦教授、氪空间科技创始人兼CEO博士、文安智能创始人兼CEO陶海教授、MINIEYE创始人兼CEO柴金祥教授、联想创投董事总经理博士、大观数据创始人兼CEO陈博士、知行创始人兼首席科学家于教授。小鹏汽车公司首席科学家郭延东博士探讨和分享了创业者作为科学家在创业路上的收获和感悟,探索科技与商业化结合的契机,促进产学研协同发展。

其中,华为诺亚方舟实验室计算视觉首席科学家田琦带来了主题“科学与企业家,双重身份下我眼中的创新者是怎样的?”演讲,演讲的核心思想是:

学术界和产业界是互补的,学术界对产业界的价值是为产业界源源不断输送人才,为产业界提供前沿方向。同时,学术界对性能的极致追求,为工业应用奠定了坚实的基础。产业对学术界的价值是反馈学术人才的回报。 与工业界的关注点不同,学术界更注重方法的理论化、普适性、对未来的探索和启发式的认知水平。但是业界更关注该方法的商业价值和可用性。 创新要以人才为中心,人才培养是最大的中心。 以下为演讲实录:

华为诺亚方舟实验室田奇:学术界和工业界具有互补性,人才培养是核心

女士们,先生们,早上好。非常感谢组委会的邀请。我今天报告的题目是“双重身份下我眼中的创新是什么?”我来自华为诺亚方舟计算视觉实验室。这是我报告的目录。第一部分是我的学术和行业背景以及诺亚周放实验室的介绍。第二部分是“前沿创新研究与业务落地的AI化差距”,用三个例子说明。最后,从学术界和产业界的角度来看,什么是创新?

刚刚,我2002年毕业于伊利诺伊州厄巴纳-尚佩恩,2012年加入德克萨斯大学。我从教17年,在计算系从助理教授到副教授再到教授。

2008年到2009年,我利用学术假期,做了一年多的微软亚洲研究院主任。2010-2015年,受清华大学张华先生邀请,回到清华大学神经与认知中心担任客座教授;2011-2014年在NECChina做顾问;2016年,荣获IEEE2017年获教育部江学者。以上是我在学术界的一些经历。

2018年夏天,我学术休假加入了华为的诺亚方舟计算视觉实验室。今年9月,我辞掉了美国的终身职位,现在全职加入华为,所以目前的身份是行业内的。当然,你可以看到我大部分时间都在学术领域,不算在工业领域的时间,所以在这里只能说一些个人的浅薄,也算是抛砖引玉吧。

我在诺亚方舟计算机视觉实验室工作。诺亚方舟目前有几个组:计算视觉、自然语言处理、搜索、推荐、决策推理、机器学习、仿真的人机交互。支持产品部门的服务,企业智能,网络智能,终端功能,终端智能手机拍大屏幕,还有一些信息,比如无人驾驶,对我们来说也是微传感器融合。

华为的AI enabling gap,通过和全球25所大学的**,很多科研人员都加入了这个**。诺亚的愿景是建立一所顶尖的AI大学,拥有AI使能的差距和世界一流的产出,帮助公司实现AI战略的转型。

我们在欧洲、伦敦、巴黎、莫斯科、多伦多、加拿大蒙特雷等地都有布局。国内深圳、上海、北京、安、香港都有相关的研究同行。

下面介绍一下我们的前沿创新研究和业务落地之间所谓的AI使能的差距。让我举几个例子:

首先,学术界和产业界的关注点不同。大家都知道学术界更注重方法的理论化、普适性、对未来的探索和启发式认知水平。而业界更看重的是商业价值,所以更看重方法的可用性,针对一个具体的问题,提升用户体验,带来实用价值。所以学术和工业的优化目标是不一样的。事实上,华为可以利用华为的大计算能力和大数据平台,应用华为AI芯片来支持我们的前沿视觉研究。

我们的视觉研究分为六个方向:底层视觉、语义、理解三维视觉、数据生成、视觉计算、视觉多模态的整合,这是我们重点研究的基础方向。应用场景包括自动驾驶、平安城市、终端视觉等。由于前沿研究和应用场景之间的优化目标不同,因此存在AI使能差距。

下面,我就以安全城市中自动驾驶目标检测、行人站识别、终端识别中的轻量级网络设计,来谈谈AI使能缺口的问题以及业界如何应对。

首先以自动驾驶的检测为例。左边是学术界研究的目标检测。它的数据标注比较干净准确,但是工业世界的场景比较复杂,有很多嘈杂的标签。比如右边的车被标为公交车,左边的公交车被误标为汽车。

有两种方法可以处理含有大量噪声的数据。一种方式是直接对有噪声的数据进行处理,通过设计惯性算法,自动对响应上升的标签进行排序以纠正或丢弃;另一类是设计半监督和无监督的方法,使我们的模型能在这个弱标记或未标记的样本上得到更好的推广。

从最广泛使用的角度来看,类别之间的分类清晰,图像清晰,一般都有很好的光照条件,所以准确率可能是唯一的。但在工业自动驾驶中,我们收集的数据类别可能分布不均匀,即标注成本比较高,虚层比较多,所以一些灯和交通锥的标注样本很少。

同时,不同应用场景的语义有时很难确定,需要结合标签。比如三轮载人,先标人,再标三轮,最后形成组合标签。

在采集数据时,要采集一些图像数据模糊,光照条件不好的图像。比如一些光线暗、虚警的场景,从而更好的训练我们的算法,提高系统的性能。

在评价标准方面,我们主要看一些具体的应用,比如检测一些关键障碍来制定我们的产量、存量和评价标准。

在学术界,最常用的目标检测模型没有考虑数据分布的不均衡性和任务间的依赖关系。我们的解决方案是设计考虑一些计算量小的网络模块,采用多目标多分支设计来解决目标检测。

在第二个例子中,我以识别安全城市中的使能站为例。左图为学界对人行站的认可。它的场景比较单一,是城市还是上空。行人站识别最大的两个图像数据集是多场景多时间段的两个数据集,这都是我们这几年做的工作。

而产业使能站的识别是针对城市群的大规模复杂场景,其条件很难约束成为理想条件。然后以这个多场景、多时间跨度的数据集为例,包括4101个行人,用15个摄像头标记了约12万平方米的行人,采集室内和室外场景。行人的假设可以很好的分析,准确率是唯一的评价指标。

在实际工业场景中,我们要面对几十万个这样的行人id,几千个甚至上万个这样的摄像头,几万个上亿甚至更多行人的智能图像,针对校园、小区、街道等各种场景。我们在园区也有**,经常会出现检测不准或者误差严重的情况,所以不仅仅是准确率,还有模型的大小和速度。

这是行人识别中很常见的一种识别模型,基于人体、部位等。这是我们2018年的工作。主要是指将一张图片作为一个整体分成多个模块,使不同的id相互区分,从而提高系统的识别能力。

如果在工业场景中使用这种方法,是很危险的,因为工业数据量极大,不同id之间存在非常相似甚至相同的模块。如果将相似的模块完全分开,特征提取会受到损害,导致系统性能急剧下降。

此外,如果我们将预训练的系统部署到新的场景中,该系统的性能将会迅速下降。一个解决方案是场景迁移,所以2018年我们华为同学提出了一个缩短数据差距的方法。这个算法提出后,当然系统的性能有所提升,但是如果应用到实际的工业场景中,生成的图像质量还是比较差的。同时也引入了很多噪声。虽然在一定程度上提高了系统的性能,但其天花板效应仍然较低,无法满足工业部门的要求。

我们的解决方案是如何探索和部署新的系统到新的场景。以前主要是跨摄像头标注,因为人被不同的摄像头抓拍,做了更多的标注。但是在我们的解决方案中,跨摄像头标注改为单摄像头单摄像头的训练模式,我们只标注另一个摄像头下行人的数据。因为在一个摄像头下,行人检测会变得高速化、自动化,从而大大降低数据标注的成本和时间。

最后,以华为终端视觉轻量级神经网络为例,学术轻量级网络关注的是如何在保持精度的同时,减少计算量或者模型的参数和大小。但在行业内,我们要考虑真实硬件的一些指标,比如能耗、速度、内存等,所以很难用理论指标。

然后是学习计算机网络的方法,比如计算量和模型参数,虽然计算量和模型参数减少了,但是实际速度还是悲观的。目前业内一些轻量级计算集中在Google、V2等引入深度分裂的模型上,提出了混合消费和消费的运算,使用NASS技术在A3中搜索网络结构。但是,也有一些问题。要充分利用功能的融合,适配一些特定的硬件。

2018 young剂量水平模型的共同思路是跨渠道。交叉通道之间的信息可以得到更好的应用,但是交叉操作对硬件实现并不友好。这种操作在内存和存量上是不连续的,所以会导致硬件运行效率的降低。

今年我们提出用廉价的线性变换换取更多的特性,让廉价的线性变换对计算资源的需求和硬件友好性更好的达到这个目的。

最后,我主要从学术界和产业界的角度来看什么是创新。学术界和工业界显然是互补的,学术界对工业界的价值是不断输送人才,为工业界提供前沿方向。同时,学术界对性能的极致追求为工业应用奠定了坚实的基础。

产业对学术界的一个价值,就是反馈学术界人才的回归。我认为人才的相互流动是一个正常的现象,它在实践中给学术界带来了新的方向。最后,学术界的系统整合提供了全球化布局。所以学术界和产业界应该是互补互利的状态。

领域里也有很多双重身份的人,从学术界到工业界。我来分享一下他们的想法。颜水成,新加坡国立大学终身教授,前360AI研究所所长,现任依图科技首席技术官。他认为学术研究成功的关键在于技术。此外,我们需要细化问题的解决方案。学术界的步伐可以慢一点。一个产出需要几个月甚至半年,但只要行业能解决问题,就是好的人工智能。

同为商汤科技创始人的香港中文大学唐晓鸥表示,中国的人工智能要做好三件事:一是要坚持,打好基础;第二,要创新,做一些新的东西。第三,我们应该让东方漂浮在它上面,并使它工业化。香港中文大学的贾加是雅腾优图的杰出科学家。他的观点是“技术要上天,产业要落地”。

大家比较熟悉的李,是斯坦福大学教授,前谷歌云人工智能首席科学家。她认为科学、技术和产品就像一场4×100的接力赛,每一项都有自己的特殊作用。学术界应该是4×100的第一,工业实验室第二,工业和**第三和第四。

最后,他获得了纽约大学的图灵奖,现在他也是脸书的科学家。他认为,学术界和工业界的双重联盟可以同时为学术界和工业界做出贡献,不仅推动了云识别、图像识别、文本理解和语言翻译技术的进步,还带来了理解智能的基础科学进步。

这是业内其他双重身份的人的真知。在我看来创新的核心要素是什么?我觉得创新要以人才为中心,人才培养其实是最大的中心。计算视觉算法、计算力和数据三要素中,学术界在算法设计上更有技巧,但工业界在计算力和数据上更有优势。大计算能力和大数据给行业带来了更多创新的可能。

人工智能行业对人才的需求非常旺盛,产业技术对学术界的吸引力主要体现在计算能力、平台、数据、机会、**、介入、成功和落地。行业人才竞争变得激烈,中美双方都可以看到人才的竞争。

行业需要哪些人才?主要有几点,第一是专注于你的领域和创作才华;第二是在很多领域都有了解和**能力的人才;第三是真正能把技术落地,懂人工智能产品的人才。比如从客户的角度,人和社会需要什么?人工智能在应用场景中能做什么?技术和产品驱动,了解产品需求,了解用户体验,充分发挥算法、数据和计算能力。

行业还应该能够发现新的商业方向,以及一些舵手如何将商业场景、商业模式和具体应用(如自动驾驶、智能家居和安全城市)结合起来,带来商业价值的成功。

最后,AI的应用要以人为本。要寻找有理想经济的人才。在功能完善的基础上,要考虑人的精神文化需求,比如陪伴机器人陪伴老人孩子。

学术界需要什么样的人才?第一,做基础研究。从源头做起,眼光长远,注重技术创新。问题应该来自工业,结果应该在工业中实践。

比如学术和工业训练方法的区别,就是我提供一个新的算法,交给别人去提炼新的方法。对于行业来说,主要是着眼于找到最合适的解决问题的方法。但它们的共同点是,都需要理论基础扎实、工程能力强、善于**创新的AI人才。因此,有必要利用这种双重身份将学术界和产业界紧密联系起来,并提供培养AI人才的最佳途径。

对于华为来说,利用跨界身份的优势,将学术界的高水平研究与产业界的高质量产品实践相结合,找到一种创新的人才培养模式,帮助我们实现如上天入地、落地生根的全站R&D,才是我们要做的。

我们培养人才的策略是联合大学探索培养学生的科学方法,并与大学学者举行学术会议和内部交流。在工程能力培养方面,邀请专家定期对员工进行培训,同时以***的形式分享AI课程,让员工走出暖房,到外面去培训我们的员工。最后,在公司强大的数据资源和计算平台的支持下,我们经常传播企业文化,就像今天的这个活动。

最后,对高校培养AI人才提出几点建议。既要培养较高的职业素质,又要有较强的工程能力;AI课程变化快,要注意课程内容的及时更新;设置交叉学科专业,鼓励本科生甚至高中生尽快接触前沿;在人工智能方面,应该鼓励学生多上编程方面的课程,与产业界**,鼓励学生多参加工程实践;最后,鼓励学生创新、产品孵化和AI创业。

感谢大家对创新的评论。

免责声明

本站提供的一切软件、教程和内容信息仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络收集整理,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑或手机中彻底删除上述内容。如果您喜欢该程序和内容,请支持正版,购买注册,得到更好的正版服务。我们非常重视版权问题,如有侵权请邮件与我们联系处理。敬请谅解!

最新评论