[P] 第一个观点不是只有open ai一条路, open ai的路子我认为是对的,他们相信 scaling law,对于更多的数据,对于更大的模型,增加更多的算力,对吧?然后他的相应模型越做越大,最后一定能突破超级强的智能。那么这条路我觉得中国也在走,但是需要点时间,但是如果只有这一条路, open ai做了一个GPT,让全世界所有人都用,这是他们奥特曼的梦想,但是这个不代表所有道路的选择。[SIZE=9pt] [/SIZE][/P][P] 第二个有没有另外一条路?那么我最喜欢的一个 slogan 就是 think different,就是要跟别人想法不一样。举一个简单的例子,你们都知道 Intel 当年如日中天的时候,它的 CPU 核越做越多,每个核的主频越做越高,所以算力越做越强,当然发热也越来越厉害。那 arm 是怎么跟他竞争的? 注意是 arm 不是MD,只 follow Intel的策略,所以到现在 MD 也还和Intel的距离很大。但是arm说我走另外一条相跟你相反的路,不按你游戏规则玩,我越做越轻,越做越小,工作在这种边缘设备或者终端移动设备上,所以反其道而行之。所以大模型并非只有做超级通用大模型一条路,除了越做越大,还能越做越小。其实你们很多人可能都很喜欢apple,今年 apple 成功的时候,你要想想当年 97 年到 2001 年乔布斯回到苹果的时候,它并不是去重复做PC、做笔记本才来胜出的,他实际上做了一个更小的设备叫iPod,也是一个different的产品。[SIZE=9pt] [/SIZE][/P][P] 那第三个我们看一看现在大模型一方面做大的同时还有三个小的趋势。第一,很多通用大模型是由MOE构成,对吧?就是由多个专家小模型构成,甚至说其未来的大模型里面可能不一定是这个越大效果才越好,而是专业的小模型来协作工作。还有一个最后大家可能关注的一个趋势就是大模型现在越做越小,因为大模型要上终端、上电脑,像上手机、上汽车。比如说苹果,对,反正宣布它 M4 的 CPU 要支持大模型,苹果肯定是要做 AI PC 和 AI 手机。那么我觉得特斯拉很快就应该把大模型上车,对吧?大家以后幻想到自己家里这种家用服务机器人,等到你们养老的时候,家用机器人驱动的核心一定是在家里的一个大模型上。[SIZE=9pt] [/SIZE][/P][P] 第三个开源大模型现在爆发,我是一直相信开源的力量,至于说网上有些胡说八道,你们也别被他们忽悠了,说开源不如闭源好。一句话,今天没有开源,没有 Linux 就没有互联网,连说实话的公司自己都是借助了开源力量才成长到今天开源社区聚集的工程师和科学家的数量是必然的数百倍。所以今年开源只做了一年就已经超过了 3.5 的能力,所以我觉得未来我觉得在一两年内,我认为开源的力量很有可能会达到或者超过必然的水平。[SIZE=9pt] [/SIZE][/P][P] 那第四个,我觉得这里面有个巨大的机产业的机会,就是走专业级大模型的机会。那么你知道大模型要引起一场工业革命,想一想个人电脑还是超级电脑,谁引发的工业革命?超级电脑虽然很powerful,但是只是智能用户,后来只有当个人电脑进入了千家万户,进入了百行千业,才引发了真正的工业革命。所以我们要把大模型拉下神坛,让他真正地和很多行业相结合,和很多企业真的能把大模型用起来。[SIZE=9pt] [/SIZE][/P][P] 所以在企业里边,我们过去做了一年,但有很多失败的案例,也有一些成功的例子。我们发现在企业里要找垂直的场景,要训练专业的大模型,所以未来在企业里面的政府里面不会只有一个通用的大模型在工作。[SIZE=9pt] [/SIZE][/P][P] 事实上通用大模型今天对很多行业不了解,包括我们企业内部有很多知识他也不了解。这样请了一个外部专家,对我们企业的情况一无所知,他怎么可能真正的能够介入到企业的业务,所以未来在企业内部不也都不会只有一个专业大模型,将来可能会有数十个专业大模型在各自解决各自的问题,所以当你把问题 think different 往反向去想的时候,你就发现难度没有那么高了。因为今天你要做一个 GPT 4 和作为 GPT 5 真的很难。又要解奥数题,又要写古诗,又要会翻译,还要懂物理、懂历史。但在企业里面,我们只需要培养一个专项的专家一个,而不是做十项全能,那么我们就发现那么很多问题就迎刃而解。比如说现在开源模型的能力达不到 GPT 4。但是我专注在一个方向上,用企业内部的专有数据加上专有工具经营能力的加强之后,它是有可能在专业能力上超过 GPT 4。前两天百度的李彦宏说他们超过了 GPT 4,然后王小川就不相信他,就出来怼李彦宏。其实你仔细听听李总说的有道理,他是他前面说在写古诗方面我们超过了。[SIZE=9pt] [/SIZE][/P][P] 而且做专业的大模型,你会发现说只要你做专业的模型,做专业的事情,那不需要万亿、千亿的参数,几十亿、百亿的参数就能用,那一旦用几十亿、百亿的参数,就意味着不需要100块、1万块,我抽着10万块显卡对吧?可能用一个消费级的显卡,三零九零、四零八零,是吧?可能几块卡就能用,这样的话把成本一样的,就从原来的一个亿的小目标或者几千万,可能降到了10万级或者100万级人民币这个领域,那么到这个量级很多企业就真的用得起了。[SIZE=9pt] [/SIZE][/P][P] 所以这里面我就不插广告了,我们,我们做了一个安全大模型,就是确实在只是发挥专业的安全的攻防知识,然后训练成为在安全攻击的自动发现能力上远远超过了GPT 4。那最后还有最后一两点快完了,还要再忍一下。对,那么我觉得在现在很多创业者面临最大的问题是很多人先做大模型,再去找场景,这个做法是不对的,用户要的并不是大模型,用户要的是大模型在背后驱动的,你解决了他什么问题,对吧?经常用经典的故事讲,用户要的不是一个钻头,用户要的是钻头钻出来的洞。所以我们最重要的是找到明星场景,或者要痛点场景、刚需场景,然后根据场景定义功能,再根据这个功能来训练专业的模型。[SIZE=9pt] [/SIZE][/P][P] 那什么叫痛点刚需场景。有两个数字,你看看在你们内部,要么在内部业务流程上,要么在外部产品服务的体系功能上,有什么东西能够利用人工智能加持某个环节能够提高十倍的效率,提高十倍的体验,或者降低十倍的成本,降低十倍的人力,那么很有可能就你就找到了这一点。[SIZE=9pt] [/SIZE][/P][P] 所以我是觉得对很多创业者来说,实际上是产模一体,就是要先有场景,定义产品,然后由产品再来定义自己专有的模型。所以对在座的很多同学而言,那么做企业级的专业大模型是有巨大的创业机会。[SIZE=9pt] [/SIZE][/P][P] 最后讲一下,中国发展专业大模型有可能是成中国的一个巨大机会,因为中国现在传统的行业门类最多,生产力、供应链最齐全,那么都在搞数转智改,数字化转型、智能化改造,所以所有的企业都需要让专业大模型重塑一遍,所有的工业级、所有的企业级软件都值得重写一遍,这样中国可能会率先带来新的工业革命。包括在新的刚结束的两会,给中国的政府工作报告里专门提到了人工智能+,实际上就是大模型+,为什么要用的加号?就是不利于做一个大模型,而是把大模型的能力真正赋能到各个传统行业里面去,那么这个发展潜能广阔。所以大家如果有好的这个大模型的技术,欢迎大家回国创业与我们合作。谢谢大家。[/P]