高文：AI赋能新质分娩力发展

专题：2024中国高新技能论坛

　　“2024 中国高新技能论坛”于11月14日在深圳举行。中国工程院院士、鹏城履行室主任高文出席并演讲。

　　以下为演讲实录：

　　高文：今天我和大众共享的是“AI赋能新质分娩力发展”的命题作文。

　　我讲两点：一是对于本年诺奖给了东谈主工智能，谈谈我的推敲；二是对于东谈主工智能发展当前我场合的鹏城履行室作念了小数东西。

　　领先看第一部分。

　　为什么本年的诺奖会给东谈主工智能两个，物理学奖和化学奖，它背后的逻辑是什么？到底是什么使得这两个奖终末找到了东谈主工智能？可能大众不知谈，背后的逻辑是科学大奖赛，是靠比赛终末选出了获奖东谈主。

　　先说问题，这一轮东谈主工智能起来，是深度神经汇集。要想凑深度神经汇集的吵杂，那一定要给作念深度神经汇集的东谈主一个奖，到底给谁？终末给了他俩，给他俩的主要事理，Hopfield即是统计物理学家，后半生主要作念神经汇集，关联词用统计物理学的设施在接洽神经汇集。右边这个和物理学没什么相干，但他发展了Hopfield基于统计学的神经汇集，给出了玻尔兹曼机，是优化问题。优化问题是数知识题，但他用了Hopfield的模子，终末他拿了奖。获奖，这个范围小数问题皆莫得。化学也同样，把这个问题给了一个卵白质折叠的瞻望。右边两个东谈主（Demis Hassabis 、John M.Jumper）是作念软件的，只须最左边这个东谈主（David Baker）是真是作念这个行业的。它是一个搭配，但这个搭配内部有绝顶深档次的原因。

　　诺奖很安稳蹭热度，在上世纪70年代也有一个东谈主工智能的各人得诺奖，他（赫伯特·西蒙）得的是诺贝尔经济学奖。刚才陈院士提到，智能里很雄伟的是推理，上世纪70年代的东谈主工智能主要在接洽推理，接洽推理时赫伯特·西蒙给了一个有狡计模子，要推理时终末要拍板到底哪个对哪个错，他给了一个有狡计模子。为了蹭东谈主工智能的热度，这个有狡计模子说在社会学里可以使用，就给了赫伯特·西蒙。

　　诺奖在持一些在社会上影响比拟大，可能会带动一个潮水的范围。

　　本年为什么给了物理学奖和化学奖？它的判断是由两个科学大赛引出来的。

　　第一个，物理学奖，真是细目要给谁的是由于ImageNet比赛（机器视觉比赛）。但机器比赛太绕口，这个比赛的数据库叫ImgeNet。这个图像数据库是当前东谈主工智能里比拟驰名的斯坦福大学素质李飞飞领着学生作念出来的图像数据库，用这个图像数据库作念比赛。

　　2010年运转负责比赛，全世界扫数作念佛营机视觉和算法的皆可以来比赛，你说你的算法好坏，是骡子是马拉出来练练。这个练是在大数据上练。ImgeNet这个图像数据库里有1500万张图像，内部有22000类狡计或者叫物体。它给出一张图像，问你这图像里有什么，你就回复这个图像里有什么，你回复对了就不减分。比如这里有一只猫，你说是老虎，那你就错了，就扣分。谁扣分扣得最少谁就得第一。

　　2010年得第一的，他的失实率是28.2，2011年的失实率是25.8，到2012年失实率一下落了10个百分点，16.4。那时大众说你这个算法挺稀奇想，一下可以普及这样多。作念科学接洽的皆知谈，奋勉一年能普及一两个百分点皆可以了。他说我用了一个神经汇集作念的。从2013年以后完全是深度神经汇集，仅仅内部的层数不同样、竖立不同样等等。

　　ImgeNet比赛2012年这个放置是深度神经汇集在运用中的第一滴血。如若你要找最根上的东西，那深信要找这个，是以AlexNet就被证实为入围诺奖物理学奖最雄伟的印迹。Alex莫得得到这个奖，他的导师得到了，他的导师即是物理学奖第二位的Hinton。Hinton是深度神经汇集里辞世的最大东谈主物。深度汇集作念起来有三个东谈主比拟要道，这三个东谈主是2006年差异各发表了一篇论文，告诉说深度神经汇集可以作念大范围的使用。2006年也被称为是深度神经汇集的元年。深度神经汇集这三个东谈主中Hinton是排第一的。这三个东谈主是不是皆要给？物理学奖天然可以给三个东谈主，但学生没给，光给老诚，和老诚无关的另外两个东谈主好像也不是很相宜逻辑。就在这内部找，Alex导师是新的，他在这一轮神经采聚合孝敬可以，但和物理学没太大相干，就要往前挖。Hinton在1985年写了玻尔兹曼机，1986年的BP汇集是今天深度神经汇集优化的基础模子，是以要给应该给他这个责任。但说还不可说这个责任，还要说玻尔兹曼机。细目了要给Hinton，但Hinton又不是物理学家，要给物理学家Hopfield，Hopfield皆90多岁了，他作念梦皆莫得猜想须臾会拿到这样一个奖。

　　第二个，这个更稀奇想。前边阿谁是2012年的放置，2024年才给的奖。这个更快，卵白质折叠的瞻望哀吊常挑战的责任，底本作念结构生物学的科学家全世界简略能瞻望出1万个独揽的卵白质三维结构。但骨子上人命界存在的卵白质简略有上亿，一万和上亿之间差了1万倍。如若按通例设施，要把扫数卵白质结构判辨出来，要一万年的时辰，这是不可隐忍的。1994年有一个马里兰大学的素质建议一个比赛，他说有莫得可能用已有的卵白质结构、已有的序列，去瞻望新的东西，因为它每年皆会产生快要1万个。每年产生1万个，先不公布，拿这个东西来比赛，望望谁的算法好。从1994年运转每两年就有一次CASP大赛，这个比赛前些年的放置不如何样，2006、2008年瞻望的准备率皆在40%荆棘，40%能瞻望对，60%瞻望错的，准确率很低莫得认识用。2016、2017年AIphaGo绝顶热，那时AIphaGo把东谈主类围棋击败，有东谈主问过DeepMind的CEO下一个狡计是什么，他说我下一个狡计是拿诺贝尔奖。那时候他如故想默契了他要过问CASP比赛，而况他很深信，他在这个比赛里只须拿了冠军，他明天就可能获诺贝尔奖。这个年青东谈主的想法很骨鲠在喉。2018年第一次去过问他们的得分就快要60，一下普及了快要20个百分点。2020年到90分，通例的东西如故价值莫得那么大了，这个的价值就比拟高了。他一下把底本许多合成生物学的科学家饭碗打掉了，当前合成生物学的责任皆要转到如何用这个东西了。

　　正因为这个责任，细目了背面这两位的奖。但背面两位不是传统意旨上化学范围各人，是以光给瞻望还不行，还要给卵白质遐想，要找一个东谈主来陪榜。是以第一个东谈主是真是作念卵白质遐想和瞻望的，主要作念遐想，三维结构可以东谈主工遐想，他得了一半。背面两个作念佛营机的得了另外一半。

　　这告诉咱们什么？科学比赛对于评价一个科学发现的价值，也哀吊常雄伟的，昔日皆说论文雄伟，因为论文需要千里淀，需要大量东谈主去援用。但你过问这个比赛，就绝顶骨鲠在喉，你把别东谈主击败了，那你就好坏。如何好坏，你可以把它写成论文，但这个放置是由大赛产生的。

　　鹏城履行室是在深圳的一个国度履行室，汇集通讯范围。当前汇集通讯和东谈主工智能分不开，是以咱们也作念东谈主工智能运用。

　　为了作念这个东西，前些年咱们一直在作念算力，用算力维持东谈主工智能大模子的教师，是以咱们作念了一个鹏城云脑2，这个机器的性能绝顶好，在存储性能方面邻接八次得回世界超算比赛榜单，邻接八次第一，而况它在东谈主工智能性能榜单以及东谈主工智能图搜索榜单上皆是弘扬绝顶卓绝的。

　　这是4096块卡用华为昇腾芯片作念的机器。（见PPT）

　　这个机器作念出来后，国内许多大模子皆是在这个机器上教师的，包括大众平日听到的华为盘古，它早期的版块皆是在这个机器上教师的，也包括百度文心，还有像北京智源的模子。

　　咱们开源了许多东西，也有一大皆，包括丝路、大圣、扁鹊、通言、通图、常羲等等。

　　这台机器从2020年10月份上线到当前差未几4年，4年运行下来，机器的使用率绝顶满盈，90%多的使用率。其中简略只须一半48.27是履行室我方使用，剩下大部分皆共享出去给合营单元以致公益机构使用。

　　（短视频播放）

　　这是2020年时。

　　咱们这个机器上线后教师了一批模子，线上开源社区里有许多咱们的模子，包括7B、33B和200B的模子，成心思意思的皆可以到那处下载。200B的模子是比拟典型的任务，花了差未几7个月时辰，用整台机器，这内部的3456卡作念教师，另外的作念数据整备和考证。这个模子教师出来那时也比拟可以。

　　这些模子皆是用开源面孔作念，是以可以作念多样千般的合营。

　　这是云脑2，正在作念的是云脑3，云脑3的算力是云脑2的16倍，内部用了2万多块最新华为的卡，每一块卡的算力特殊于H100确当量。

　　这台机器的原型如故完成了，咱们在原型基础上运转作念视频内容的生成，用Open-sora跑，可以生成几十秒以致几十分钟的视频。背面即是生成一段内容，大众可以看一看。

　　（短视频播放）

　　刚才陈院士说科学无国界，地球上的科学家皆应该彼此合营，其实外星球的也同样。

　　科学大赛绝顶雄伟，鹏城履行室这几年在深圳市科创委的组织下，咱们也搞了一个世界东谈主工智能大赛，这个东谈主工智能大赛如故举行了许多届，每年皆有几千个队列来过问比赛，本年还会有，但愿大众暄和。

　　科学大赛对于科技服从的评价有很雄伟的作用，中国的东谈主工智能大模子要有我方的底座、算力，这样才智承载咱们想作念的智能和中中漂后的传承。对于这样一些生态，但愿大众暄和，谢谢大众！

　　新浪声明：扫数会议实录均为现场速记整理，未经演讲者审阅，新浪网登载此文出于传递更多信息之认识，并不料味着赞同其不雅点或证实其形色。

海量资讯、精确解读，尽在新浪财经APP

遭殃剪辑：梁斌 SF055

让建站和SEO变得简单