百度CTO王海峰:百度大脑已成全球领先的人工智能平台,具工业大生产特征

【IT时代网广州报道】12月27日,在百度Create 2021(百度AI开发者大会)上,百度首席技术官王海峰介绍,10余年间,百度AI专利申请量超过1.3万件,连续三年位列中国第一,获得国家技术发明奖、国家科技进步奖、中国专利金奖等多个国家级重要奖励,多项技术入选MIT科技评论十大突破技术,多次入选“全球4大AI巨头”、“全球 AI 公司五强”等国际榜单。

王海峰还表示,百度AI多年技术积累和产业实践的集大成——百度大脑已发展成为全球领先的人工智能平台,开放能力近1400项。国产深度学习平台飞桨汇聚406万开发者、服务15.7万家企事业单位,位居中国深度学习平台综合市场份额第一。领先的AI能力既支撑百度全面发展,探索生物计算、量子计算等前沿领域,也通过百度智能云在制造、能源、金融、城市建设、乡村振兴等关乎国计民生的重要领域落地。

对于当前如何兼顾科技创新与可持续发展,王海峰也谈了自己的看法。他指出,王海峰表示,百度大脑已经具备标准化、自动化和模块化的工业大生产特征,进化为AI大生产平台,持续在技术突破、开源开放、绿色发展等方面融合创新,支持各界共同探索可持续发展之路。【责任编辑/邹琳】

大家好,我是王海峰,很高兴和大家再次相聚。

正如Robin所说,AI将成为改变世界的有力工具,千行百业会被重构。随着AI技术的发展和大规模应用,各行各业的智能化升级越来越深入,AI已经融入我们的生产生活。

百度自诞生之日起,就与AI息息相关。大家熟悉的搜索引擎,需要用到自然语言处理等AI技术。

从2010年起,百度开始全面布局AI核心技术,百度大脑初具雏形。2016年,百度大脑1.0发布,完成基础能力积累,开源开放核心技术。此后,百度大脑在技术突破和开源开放的道路上高歌猛进。今天,百度大脑已发展成为全球领先的人工智能平台,AI能力越来越丰富、强大,开发和应用AI的门槛却越来越低。

百度大脑让百度在AI领域赢得先机,也让中国AI站到世界前列。过去十余年,百度入选全球4大AI巨头、全球 AI 公司五强、全球 50 家最聪明公司等榜单,连续三年入选MIT科技评论十大突破技术,连续三年中国AI专利申请量排名第一,并获得国家技术发明奖、国家科技进步奖、中国专利金奖、省部级科技进步奖等数十项重要奖励。

乘着产业数字化、智能化的东风,百度AI技术通过百度智能云深入到地头田间、工厂车间、城市乡间……在广袤的中国大地生根发芽,遍地开花。

当前,新一轮科技革命和产业变革风起云涌,党和政府提出创新驱动发展战略,一方面,加强科技创新,努力实现科技自立自强;另一方面,促进数字技术与实体经济深度融合,打造绿色低碳、公平普惠的数字经济新优势,推动我国经济社会高质量发展。

在这个进程中,如何兼顾科技创新与绿色低碳,如何推动科技进一步转化为生产力,实现经济、社会、环境的可持续发展?

这是我们共同面临的问题,需要各界协同创新,共同解决。

百度基于多年技术积累和产业实践打造的百度大脑,具备了标准化、自动化和模块化的工业大生产特征,进化为AI大生产平台。AI技术在新的发展阶段,呈现融合创新、降低门槛的特点,百度大脑持续开源开放AI创新成果,支撑各界共同探索可持续发展之路。

首先,介绍百度大脑最新的核心技术突破:知识增强大模型“文心”。

众所周知,知识是人类智慧的结晶,是人类进步的重要推动力。想让计算机像人一样理解和认知世界,也需要让计算机具备获取、运用知识的能力。

百度从2011年开始研发知识图谱技术。截至目前,构建了包含5500亿知识的大规模知识图谱,覆盖我们生活的方方面面,也包括制造、医疗、法律、金融、科技、媒体等领域的专业知识。

结合大规模知识图谱,百度提出了知识增强大模型“文心”。在知识的指导下,文心如同站在巨人的肩膀上,训练效率和理解准确率大幅提升,并具备更好的可解释性。在国际权威评测中,文心多次夺冠。最近,我们发布了全球首个知识增强的千亿大模型,这也是全球最大的中文单体预训练语言模型,已在60余项任务上取得业界最好效果。

人类历史长河中曾经有几万种语言,不管是哪种语言,都能描述大千世界、万事万物,不同的语言可以表达同一语义。为此,我们研制了知识增强跨语言大模型,让机器有了同时学习和理解多种语言的能力。

人类是通过语言、语音、视觉等多种模态获得对真实世界的统一认知。像人一样,机器理解真实世界也需要听懂语音、看懂图像视频、理解语言,这就需要突破不同模态、异构信息的语义融合统一难题。我们提出知识增强跨模态大模型,实现了复杂场景的多层次、高精度语义理解。

知识增强大模型充分从大规模数据和知识中学习,具备很强的通用性,能够让百度大脑更好地支持各种AI应用,满足各种场景需求。

数字人,就是其中一个典型应用。

过去几年,百度打造了系列数字人。今天,我给大家介绍一位新成员——AI手语主播。

【央视新闻AI手语主播:我是AI手语主播,为听障朋友们提供手语服务。】

我们的数字人,正在各行各业发挥价值,24小时无休为用户提供贴心服务。为了进一步降低数字人的应用门槛,今天,我们正式推出数字人平台,百度智能云曦灵,为大家提供多种数字人生成和内容生产服务。

知识增强大模型也让百度大脑的艺术创作能力越来越强。今天,请大家跟我一起体验一下。

百度大脑,我们一起创作一幅水墨画吧。

这边是连绵的山脉,山上云雾缭绕,山脚下有一座草堂建在江边,江上有一条船,一个人站在船头;然后这边有一行飞鸟掠过天空。好,那么这幅画就创作完了。

看起来还少了点儿什么。百度大脑,为这幅画作首诗吧。

大家刚才看到的水墨画、系列数字人,都是百度大脑的应用。这些应用的背后,是知识增强大模型带来的更加强大和智能的AI能力,以及语音、视觉、自然语言处理、知识图谱、VR、AR等技术的融合创新。

从多模态、多技术、软硬一体等等融合创新,到超大规模参数的模型,AI技术越来越复杂,开源开放的深度学习平台持续降低门槛,让AI技术开发和应用越来越容易。深度学习平台下接芯片,上承应用,相当于智能时代的操作系统。

飞桨是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台,集核心框架、模型库、开发套件和工具组件为一体,赋能广大开发者,实现AI模型的便捷开发、高效训练和多端多平台部署,助力各行各业的创新和发展。

首先,飞桨在业内率先实现了“动静统一”的核心框架,兼顾科研开发的灵活和产业开发的高效。飞桨提供丰富的API,支持开发者便捷、高效地开发深度学习模型。飞桨推出的系列科学计算API,支持量子计算、生命科学、计算流体力学、分子动力学等应用,助力中国科研实力的提升。

在训练阶段,飞桨发布了自适应大规模分布式训练技术,针对模型特点和硬件特点,搜索最优的机器组合和模型切分策略,并采用异步流水运行机制,以及高通信和高并发的方式,使大模型训练效率达到最优。百度文心知识增强大模型,正是基于这一核心技术训练的。

在推理和部署阶段,飞桨打造了推理部署工具链,使得高速推理引擎的多端多平台部署更加便捷。飞桨提供的模型压缩等辅助工具,将大模型参数规模压缩至1/1000,得到满足产业实际应用需求的小模型,帮助开发者加速业务落地。

训练和部署都离不开与芯片的适配。飞桨设计了统一的硬件接入方案,全面适配各类芯片,并进行融合优化,大幅降低成本。当前飞桨适配的芯片或IP已有31款。

飞桨还提供官方支持的产业级模型库,模型数量超过400个,既有大模型,也有兼顾精度和性能的小模型。产业级模型库降低了模型开发和部署成本,加速产业应用落地。

无论是前沿技术研究,还是广泛的产业应用,无论是零基础的初学者,还是资深的开发者,都能在飞桨平台获得支持。目前,飞桨已汇聚406万开发者、服务15.7万家企事业单位,位居中国深度学习平台综合市场份额第一。开发者们基于飞桨的创新层出不穷,既有关乎产业转型升级的智能化创新,也有充满人文关怀的公益应用,让我们见证他们的风采。

AI的快速发展离不开算力的支撑。同时,达成“双碳”目标已是社会共识,打造绿色低碳的算力底座,势在必行。

百度的绿色算力底座,包括了自主研发的AI芯片、高性能极致弹性的计算架构,以及绿色节能的数据中心,有力支撑AI技术研发及大规模应用。

百度自主研发了通用AI芯片—百度昆仑,今年8月,国内首款采用GDDR6显存的昆仑2代芯片实现量产,性能比1代芯片提升2-3倍。同时,昆仑芯片与飞桨等多款深度学习框架完成端到端适配,具备软硬一体的全栈国产化AI能力。

计算平台方面,百度打造了AI异构计算平台—百舸。百舸平台由AI计算、AI存储和AI容器组成,具备大算力、大吞吐、极致弹性的特性,支持超大数据、超大模型的训练。昆仑芯片也已应用于百舸平台。

数据中心方面,通过极简供电、高效制冷、智能控制等多项技术,百度的数据中心实现了从硬件、电气、动力系统等多方位节能减排,单体数据中心年均PUE低至1.08,远远低于1.59的全球平均水平。2020年,百度阳泉数据中心荣获国内首个5A低碳数据中心认证。

前沿技术领域,百度大脑也取得了亮眼成绩。

新冠疫情给人类社会带来巨大影响,疫苗的研发和生产被寄予厚望。mRNA疫苗是一种可以大规模快速生产的新型疫苗,但设计出稳定的mRNA疫苗序列难度极大,限制了这种疫苗的广泛应用。百度推出业界首个mRNA疫苗序列设计算法,可以在短短十分钟内找出稳定的疫苗序列。百度和中国疾病预防控制中心开展科研和应用合作,推动疫苗和药物研发,保障全人类的健康。

百度在量子计算领域,布局量子算法、量子人工智能、量子架构等研究方向,打造了百度量子平台。这是国内首个提供从应用到量子处理器一站式服务的量子计算云平台,降低量子计算学习与应用的门槛,推动量子计算在化学、金融、材料等领域的应用。

以上介绍了AI大生产平台——百度大脑在核心技术、开源开放平台、算力底座,以及前沿技术方面的融合创新成果。

百度大脑已有近1400项AI开放能力,我们秉承“用科技让复杂的世界更简单”的使命,坚持自主创新、开源开放,基于百度智能云“云智一体”的优势,将百度大脑的能力输送到千行百业,助力各行各业的数字化转型和智能化升级。

工业是国民经济的支柱产业。中国经济要高质量发展,工业领域的转型升级至关重要。

百度发布开物工业互联网平台,从“点、线、面、体”四个层次,全方位帮助企业实现降本、提质、增效,加快转型升级。

点,进行数据采集、参数调优、设备监控等,实现业务环节智能化;线,优化产线的效能、质量、功耗等,促进业务流程智能化;面,围绕企业生产经营的各个环节,通过构建企业智能化中台,支撑企业经营智能化;体,帮助产业链上下游之间、大中小企业之间、企业与政府之间更好协同创新,助推产业智能化。

沿着这样的思路,百度与重庆两江新区联合打造“AI+工业互联网”产业基地,从“点、线、面、体”四个层次深度赋能,建设技术、人才、资金三位一体的创新生态,形成有竞争力的产业集群,推动区域实现高质量发展。

在能源领域,我们与产业伙伴合作推动模式创新,探索节能减碳新路径。百度智能云与国家电投集团东方能源共同打造了“智慧数字热网”,整合供热服务、民生服务、社区服务三大需求,构建数字热网、融合社群网、联通政务网“三网融合”的创新模式,建设综合智慧能源生态圈,让热能管理和调度更加高效节能,也为企业带来新的价值增长点,让社区服务更加亲民、便民。企业、社区、用户三方共同助力“双碳”目标达成。目前,“三网融合”创新模式已经在石家庄落地,成为当地新型智慧城市建设的生动实践。

说到智慧城市,被誉为“科学智慧之城”的北京海淀,一直走在前列。海淀城市大脑是基于百度领先的AI、大数据、云计算等技术,以及百度专网地图等基础设施打造的,帮助城市管理者快速、高效、智能地进行城市管理,引领孵化产业创新应用,让城市管理更高效、环境更美好、人们生活更便利。

海淀城市大脑的背后,是百度围绕城市现代化治理体系,基于云智一体优势,通过对城市全要素全状态的全景洞察,提升城市治理效率和效果,为城市的发展赋予新动能。

百度也将AI赋能城市管理和建设的经验,拓展到乡村振兴中,让亿万城乡居民共享数字化、智能化发展的红利,促进共同富裕。

在“中国蔬菜之乡”山东寿光,百度智能云打造的寿光大脑,用AI技术助力乡村振兴。AI技术加持的蔬菜大棚,只需2个工作人员加一个APP,就可以管理数十个蔬菜大棚;农业大田里,老乡们只需要和小度聊聊天,就能学习农艺、病虫害处置防范等农业知识,成为“农业专家”。

今年,联合国《生物多样性公约》缔约方大会让昆明市官渡区走进大众的视野。百度与合作伙伴联合打造的官渡大脑为大会的顺利召开提供了重要保障,也为官渡区的安全生产、消防抢险、市容环境、居民生活保驾护航。

从关乎未来的前沿科技,到影响国计民生的大产业,从城市建设、乡村振兴的第一线,到普通群众的身边事,我们看到,各个领域的开发者们正在基于百度大脑这个AI大生产平台,用智慧和汗水创造美好的新生活。

最后,回首百度AI走过的征程,取得的成果,我们始终秉承初心,融合创新、开源开放,支撑各行各业的转型升级和可持续发展。接下来,百度还将在人才培养、绿色低碳、安全伦理、社会责任等方面继续努力。我相信,创新、开放、发展,也是百度和各界携手,实现科技自立自强的必由之路。

谢谢大家!

来源:IT时代网

IT时代网(关注微信公众号ITtime2000,定时推送,互动有福利惊喜)所有原创文章版权所有,未经授权,转载必究。
创客100创投基金成立于2015年,直通硅谷,专注于TMT领域早期项目投资。LP均来自政府、互联网IT、传媒知名企业和个人。创客100创投基金对IT、通信、互联网、IP等有着自己独特眼光和丰富的资源。决策快、投资快是创客100基金最显著的特点。

相关文章
百度CTO王海峰:百度大脑已成全球领先的人工智能平台,具工业大生产特征
李彦宏对话欧阳自远:AI两大能力应用于中国航天 无人车将开上月球
李彦宏:智能交通可使5年内中国一线城市不再限行,10年内基本解决拥堵
李彦宏:5年内将为社会培养500万AI人才

精彩评论