专访澳鹏田小鹏博士:以AI数据服务,赋能各行业AI商业化进程

随着人工智能行业的高速发展,数据作为AI算法的重要基石,如何为机器学习算法训练、优化提供数据采集、标注等高质量的服务,成为人工智能热潮中必不可少的一环。如何正确获取数据、标注数据、应用数据?

10月28日,在由深圳市工业与信息化局、深圳市福田区人民政府指导,高科技行业门户OFweek维科网主办的“2020中国国际数字经济大会暨展览会”上,澳鹏(Appen)全球高级副总裁、大中国区总经理田小鹏博士接受了OFweek维科网的专访,畅谈人工智能的基础以及数据为社会、为行业、为企业的进步所作出的贡献。

图:澳鹏(Appen)全球高级副总裁、大中国区总经理田小鹏博士

人工智能助力新基建

最近,新型基础设施建设,即“新基建”一词备受关注。基础设施是经济社会发展的重要基石。在数字经济时代,5G、人工智能、工业互联网、物联网、数据中心等新技术,正在驱动新一轮科技革命和产业变革,成为数字经济发展的基石。

关于新基建,田博士表示,今年三月,国家再次提出要加快推进包括5G 网络、人工智能、数据中心等新型基础设施的建设进度。本次“新基建”的提出,不仅为经济增长提供新的动力,更为人工智能领域带来了更广泛的关注。人工智能不再仅仅是科技前沿,它已被列入了新基建的七大领域之一。

“国家把人工智能作为新的基础设施来建设,可以说是一项立足长远的规划。”田博士称。

在“新基建”与“旧基建”两方面的对比上,田博士指出,曾经的前沿技术已被纳入国家基础设施建设。“发生这种转变的原因,一是科技已经发展到了可以被日常应用,并且能够切实改善人们生产生活的程度,二是社会已经发展到了需要科技产物的助力来进一步提升生产效率和抗风险能力的程度。”

人工智能作为这个时代科技发展的伟大产物,早已渗透到了人们工作和生活中的方方面面。如何解决民生刚需、解除民生痛点?这是人工智能应该做到的事情。在这一点上,田博士举例指出:“在智能语音和智能语义的加持下,音响不再是单向输出音频的工具,而是能够进行人机互动的智能设备;密码解锁在很多场景中,已经被指纹、人脸识别替代。”

“可以说,人工智能是时代发展的新型燃料,通过高效挖掘数据价值,赋能各行业各领域智慧升级。”田博士说道。

人工智能助力后疫情时代产业发展

人工智能作为支撑经济社会数字化、网络化、智能化转型的关键新型基础设施,不仅在助力疫情防控、复工复产等方面作用突出,同时,在稳投资、促消费、助升级、培植经济发展新动能等方面潜力巨大。

那么,人工智能如何作出贡献?

田博士指出,在这场使人与人之间保持距离、把人们社交活动频次降至最低的新冠疫情中,“左手支撑疫情防控,右手支撑复工复产”的人工智能,在抗疫人力不足时挺身而出,将防疫和工作效率提升数倍。“疫情的影响还在持续,而人工智能带来的健康码、AI医生、送药送餐机器人等各种高效管理和便民服务,已经同水、电、气、网络一样,成了城市必不可少的‘基础设施’。”

田博士进一步指出,社会对于人工智能的需求远远不止于抗击疫情。“此次疫情作为一个推手,已经正式将人工智能全面推向社会的方方面面。智慧金融、智慧教育、智慧医疗、智慧交通等等都有着人工智能在其中发光发热。需求已然成熟,后疫情时代的人工智能产业,绝不仅仅指向其自身的发展,而是要推动各行业完成智能化转型升级,实现新旧动能的转换。”

事实上,作为新一轮科技革命和产业变革的重要驱动力量,人工智能正在对经济发展、社会进步、国际政治经济格局等多个方面产生重大而深远的影响。根据德勤此前发布的《全球人工智能发展白皮书》预测,到2025年,世界人工智能市场规模将超过6万亿美元,2017年至2025年复合增长率达30%。

中国的人工智能舞台更是潜力巨大。我国《新一代人工智能发展规划》提出:到2030年,中国人工智能核心产业规模将超过1万亿元,带动相关产业规模超过10万亿元。

AI算法是车,数据是油

根据国际数据公司(IDC)2018年末的测算,2018年至2025年,全球的数据总量将由33ZB增加至175ZB。其中,中国的数据增长量将保持30%的增长速度,将是所有地区中增长速度最快的。同样,数据量的激增也催生出了数据服务行业这一庞大的市场。

机器强于人的地方在于它能够存储、处理大量数据。过去,机器得到的数据是人类获取并选择性录入,它所产出的结论充满局限性。而现在,在人工智能的帮助下,机器能够自己听、自己看,海量数据信息的记录与分析为各行各业的日常决策与长远发展带来前所未有的改变。

但问题来了——机器存储、处理的大量数据,从何处获取,如何获取成了关键。人工智能商业化在算力、算法和技术方面基本达到阶段性成熟,想要加速落地,解决行业具体痛点,就需要大量经过标注处理的相关数据做算法支撑。

数据决定了AI的落地程度,是商业化过程中重要的一环。

田博士举了一个生动的例子。同样是看月亮,在不同的经度,不同的纬度中,会有差异。如果采用在一个国家的不同地方所观察到的月亮,而不是在全球各个地方实地观察,那么其标注的数据一旦应用于全世界数据中,错误的数据将会给后续一系列应用带来错误的结果。

用AI来服务AI,赋与AI最初始的、准确的数据是基础。“如果把AI中的算法比作是车,那么数据便是油,想要车跑得更快、更好,‘喂’给它高质量的油必不可少。”田博士称。

智能化转型的机遇与挑战

今年6月,在澳鹏(Appen)全球发布的2020年AI现状年度报告《AI与机器学习的现状》中,近四分之三的调研企业组织表示AI对他们的业务而言至关重要,越来越多的企业开始将负责任的初始数据作为其实现业务成功的因素之一,这是机遇。

然而,人工智能项目的成功部署并没有那么容易。据研究机构Gartner的调研显示,在2019年,只有不到20%的人工智能项目成功部署。其中,数据问题正是部署失败的主要原因之一,这对于企业而言是一个无法避免的挑战。

随着技术的不断发展,传统企业一定会走向AI的道路,在这条道路上,他们对于数据的需求相较于以往提出了更高的要求:第1是需要大量的高质量数据;第2是数据的安全性、保密性、私密性及无歧视要求;第3是要求采标一体化。

田博士指出,企业自己完成这些数据任务是具有挑战性的,并且成本高昂,处理不当时甚至可能弊大于利。对于希望高效完成AI部署的企业而言,与专业的数据伙伴开展合作尤为重要。

“20多年以来,澳鹏与全球领先的AI公司合作,提供高质量的多样化可扩展标注选择,包括:先进的人工智能辅助数据标注平台、遍布全球的多语言专家、全球超过一百万的众包资源,满足180多种语言、方言和多样化安全需求,以及符合道德规范的数据来源及公平的众包报酬,降低品牌可能面临的潜在风险。我们的部署速度比市场平均速度快三倍以上。”田博士如是说。

澳鹏的未来

关于澳鹏未来的战略规划,田博士称,澳鹏将对其人工智能辅助数据标注平台的几个重点领域加大投入:

1. 标注工具箱,继续优化部分高复杂度的数据交付场景,比如自动驾驶2D、3D标注;

2. 模型辅助平台,研发行业一流的基于迁移学习和主动学习框架的在线预标注平台,大幅提升人机协同效率,为客户创造价值;

3. 企业级数据API和可视化分析平台,研发企业级数据API和可视化分析平台,将平台无缝接入客户的模型研发流程,进一步提升数据+模型的迭代效率。

田博士说:“去年10月,澳鹏中国首个数据服务交付中心——澳鹏科技(无锡)有限公司正式成立,投资200万美元;今年5月,澳鹏数据科技(上海)有限公司正式成立,投资200万美元。刚刚建成不久的大连服务交付站点,则可以更多地为面向日语、韩语、俄罗斯语,包括覆盖东北领域的公司提供服务。未来,澳鹏还将向更多的行业迈进,不断砥砺前行,深耕细作。”

“澳鹏希望到2025年,可以做到10亿美元的收入、上万人规模的企业,真正开始在大中华区的市场,包括大陆、香港、台湾等提供各种各样的高质量AI数据服务。”田博士称。

感谢支持199IT
我们致力为中国互联网研究和咨询及IT行业数据专业人员和决策者提供一个数据共享平台。

要继续访问我们的网站,只需关闭您的广告拦截器并刷新页面。
滚动到顶部