(苦读书 www.kudushu.org) 会议室里,在王东来讲完这番客套话之后,便到了本次会议的重点。
五道口组建这么一支研究团队,自然是抱有一定的期待和展望。
而面对这个崭新的科研项目,其实不止是姚启智没有怎么接触过,就连其他邀请过来的专家也都没有接触过。
要知道,国内的互联网行业说是在创新,只不过是把在发达国家的一些成熟行业搬运过来而已。
社交、游戏、外卖、门户网站等等,皆是如此。
而互联网的真正核心却根本没有关心,也志不在此。
就像是早在2012年的时候,谷歌人工智能实验室就提出了让机器能够学习语言和语法。
彼时的国内互联网却在干什么?
高下立判!
会议室上首位置,王东来鞠了一躬之后,就站了起来。
随着站直身子,他的身上散发出一种独特的气质。
既有少年人的昂扬,也有一种科研人员的自信,更有一种商界大佬的气势。
“我不知道在坐的有没有听说过去年2月份,白头鹰人工智能学术年会上展示出来的GPT,我在这里简单地介绍一下。”
“2012年,谷歌人工智能实验室提出想让机器学习语言和语法,次年,便发布了基于GPT的语言模型,该模型通过对输入的编码来学习语言。”
“同年十月,谷歌开始了GPT的试点项目,并通过改进,使得其能够在不需要大量训练数据的情况下学习语言模型。”
“所以,我们的目标其实很简单,那就是对标GPT,先从独属于国内的人工大模型开始。”
“第一阶段最终要完成的模块功能是能够做到像人一样的交流,甚至完成写邮件、文案创作、数学计算等功能。”
在王东来说到这里的时候,下面坐着的教授和研究员都有些躁动起来。
实在是王东来提出来的要求太高了,完全超过了众人的想象。
像人一样的交流,可以写邮件,文案创作。
这样的功能在王东来的嘴里还只是第一阶段。
只是听着王东来这么说,众人的心里便飞快地盘算了一下,便有了一个结论。
那就是根本不可能。
凭借他们的能力根本做不到这一点。
人工智能虽然他们还只是第一次接触,但是他们对于计算机还是有几分了解的,同时他们自己有几分实力,更是心知肚明。
真要是可以做到王东来所说的这样,他们也就不是现在这个样子了。
当即,就有一位戴着眼镜的中年人出声打断了王东来的话。
“王教授,你刚才提到第一阶段要完成的模块功能是能做到写邮件、文案创作等,可据我所知,这样的技术就算是在白头鹰也没有完成。”
“谷歌的GPT项目,我也有听闻,根据和一些海外朋友的交流,GPT是由Opanai的研究团队首次提出,其主要是利用神经网络,通过机器深度学习,从而使得机器获得强大的自然语言处理的能力,如此这般,才能让该模型拥有生成文本、回答问题并进行语言翻译等任务。”
“姑且不说能不能做到这一点,单单只是自然语言处理,就已经是一项难度极大的课题,更不要说人工智能涉及计算机科学、心理学、数学等多领域的,研究领域包括不限于机器人、图像识别、专家系统等等。”
“就算是我们目前要完成的人工模型,也不是一个简单的课题,说是人工模型应该不准确,更应该称之为大型语言模型才对,large language model也被称为LLM,它是一种使用深度学习算法来处理自然语言的模型,可以根据海量的数据来识别、总结、翻译、预测和生成文本和其他内容。”
“所以,这么一来,我们这个研究团队的任务很重,不是我在打击王教授和各位的信心,就目前的团队,其实我并不怎么看好。”
姚启智在王东来说话之前,就抢先地出声问道:“刘工,那你有什么想法?只要你说的有道理,在这个团队可以畅所欲言!”
被称为刘工的中年研究员看了一眼姚启智,再看了看没有说话的王东来,便接着说道:“很简单,那就是再增加人手!”
听到这里,王东来笑了出来。
“刘工,没想到你对人工智能有如此研究和了解,看来这次项目完成的可能性更大一分。”
“而针对刘工刚才提出来的问题,其实我早已有过考虑。”
“首先,我们这次的项目是大型语言模型,这一点想必刘工没有问题,而大型语言模型无非就是利用机器深度学习来完成,我们可以开发出一种基于循环神经网络的语言模型,用于生成连贯的文本等。”
“其次,便是刘工提到的自然语言处理,这一点我也有了解决办法,那就是基于Transformer的解码器,在没有标注的大数据下完成一个语言模型,作为预训练模型,然后在子任务上做微调获得不同任务的分类器,实现自然语言推理、问答和常识推理、语义相似度识别、分类等。”
“最后,便是刘工说到的算法、图像识别、专家系统等领域,我也同样有所准备。”
“刘工恐怕对我不够了解,并不知道其实我第一篇SCI论文就是关于算法的,我自认在算法这方面还是不弱于人的。”
王东来吐字清晰,语气平静,说出这一番话的时候,自带一种无言的压迫气势。
这一刻,在众人的心里对王东来的印象有了一个天翻地覆的变化。
刚才王东来表现的有多么的温文尔雅,现在便有多么的反差。
没有一句脏话,语气也没有什么变化。
可是在话语之中充斥着强烈的自信和霸道,令得众人不由自主地对王东来刮目相看。
王东来的表现也并没有让众人觉得意外,能够在这个年纪取得这样的成就,有这样的表现才是正常的。
不少人把目光放到了刘工的身上,想要看看还会不会说出什么话来。
却不料,得到王东来这样的回答,刘工的脸上浮现出一丝思索之色。
“王教授,你刚才提到的开发出一种基于循环神经网络的语言模型,还有自然语言处理,听上去颇有几分可行性,能不能详细讲讲,我感觉如果这些技术都已经解决的话,我们在人工智能领域的研究恐怕就要走在世界前列了。”
“哪怕这只是人工智能的一个方面,应用产品,但是只要在这个领域完成突破,所带来的影响就会是巨大的,足以在社会上引起巨大的震动。”
越说,刘工的眼神越是明亮,神情也变得激动起来。
见此,王东来在心里对这位刘工也有了一个清楚的认识。
纯正的研究员!
刚才打断自己,也并非是对自己有什么意见,只是见不得有人在大放厥词,所以出声打断。
可是在自己说出一些想法之后,刘工却能够在这么短的时间内反应过来,这就证明了这位刘工的卓越眼光和深厚的知识技术储备。
对于研究团队有这么一位能力超强的研究员,王东来心里颇为满意,脸上顿时露出笑意,说道:“刘工,人工智能的应用领域广泛,涉及的问题也非常多样化。”
“眼下,能够搞出一款国产的人工智能聊天通用模型,这就已经够了!”
王东来并没有多说,更不会在这里把关键点都说出来。
正如他所说的,一些核心的算法都会由他来完成,其他人先是做不到,其次才是出于保密的需要。
领先时代半步是天才,领先一步是妖孽,可要是领先了几百米,那就是祸端了。
刘工听到王东来这么说,张了张嘴,却没有再说什么,点了点头便安静下来。
见此,姚启智顺势接过话题。
“关于此次研究项目的情况,想必大家之前都已经看过了,我们这个项目目前在国内是第一例,所以我们身上还承担着一份开辟的责任。”
“而关于这一次的课题研究,王教授才是核心,说出来也不怕大家笑话,我感觉在人工智能这一方面,王教授其实比我更懂,知识储备也更多,刚才王教授和刘工的讨论就证明了这一点。”
“更何况,这一次的课题项目,也是由银河科技出资研究,成果和专利由银河科技独享。”
“接下来的研究工作,我虽然是带头人,但是希望诸位能够在研究过程中,拿出真正的实力,并且在遇到问题的时候,可以多听取王教授的建议。”
姚启智拿起话筒,无比认真地对着众人如此说道。
随着姚启智这么说,在场众人的神情顿时变得认真起来。
其实,有了之前王东来和刘工的交流,众人都已经看明白了。
王东来其实在这方面的造诣并不低,甚至可以说是超过了在座的大部分人。
一些有心人更是细数了一下,王东来在数学方面的成就不提,在计算机方面的成绩也是不低,这个项目五道口能够这么爽快地和银河科技合作,恐怕也是因为王东来的原因。
有这样的一位天才加入其中,对于人工模型项目而言,只有好处没有坏处。
这一点,众人都能想的明白。
所以,众人在姚启智话音落下之后,都纷纷点头起来。
“姚院长放心,王教授的成就摆在这里,我们自然不会熟视无睹。”
“人工智能技术要是能够突破,不管是对国家还是对学术界,都拥有极大的意义,我们自然不会藏拙,必然全力以赴!”
“正好,我的手上也没有什么要忙的项目,接下来我倒是可以将更多的精力放到这个项目上面。”
“巧了不是,我手上的几个课题也到了结尾工作,交给带的学生就行,正好投入到这个课题中来!”
“……”
一时间,会议室里的众人纷纷表态起来。
对于众人的表现,王东来并没有太过吃惊。
高校教授手上的课题其实并不少,尤其是京城的这些高校教授,就更是如此了。
而一项课题,大部分的工作其实都是交给了下面的学生,在读博士和研究生才是干活的主力。
脏活累活都是他们的,而这些教授也只是在关键的地方进行指点而已。
这并不是说这些教授在故意压榨,而是因为他们的手上的课题项目很多,分身乏术下的最好选择罢了。
也有出于锻炼带的学生能力的考虑。
当然了,一样米养百样人,自然也会有那种压榨学生劳动力的无良教授,这是不可避免的事情。
就连唐都交大也有,不过在王东来的提议下,郑华和徐松尧强硬无比地对这方面进行了严格的限制和监察,倒也使得唐都交大的学术氛围好上许多。
但是现在。
这些高校教授和研究所研究员,纷纷将手上的其他课题项目抛到了一旁,交给了带的研究生和博士们,自己将主要精力放到人工智能大数据上面。
原因简单的很!
人工智能大数据模型的价值更大。
同时,可行性也更高。
一旦课题完成的话,对于他们而言,就是巨大的利益。
不管是发表论文,还是评职称等,都有着帮助。
人工大模型的研发,主要有三大难题,分别是数据、神经网络架构以及硬件部分。
数据方面,因为是要通用大模型,所以需要的数据很大,不过还好这方面国内有优势,所以问题倒也不太大。
而神经网络架构这一点,有姚启智这位大佬以及诸多高校教授一同出手,最后还有王东来在,自然也是问题不大。
最后便是硬件部分了。
虽然可以借用五道口的‘探索1000’超算,但是并不是长久之计。
为了日后的发展,就必须要有自己的机器。
而这就需要有高性能的CPU和GPU,这些东西都需要从国外进口,还要受到钳制。
就算是这样,也只能硬着头皮买。
目前,国内根本无法满足需求。
当王东来提出要人工智能大模型的时候,其实都已经想到了这个问题。
买!
只有这一个选择,在西方还没有制裁,国内没有追赶上来之前,这些东西只能买。苦读书 www.kudushu.org
五道口组建这么一支研究团队,自然是抱有一定的期待和展望。
而面对这个崭新的科研项目,其实不止是姚启智没有怎么接触过,就连其他邀请过来的专家也都没有接触过。
要知道,国内的互联网行业说是在创新,只不过是把在发达国家的一些成熟行业搬运过来而已。
社交、游戏、外卖、门户网站等等,皆是如此。
而互联网的真正核心却根本没有关心,也志不在此。
就像是早在2012年的时候,谷歌人工智能实验室就提出了让机器能够学习语言和语法。
彼时的国内互联网却在干什么?
高下立判!
会议室上首位置,王东来鞠了一躬之后,就站了起来。
随着站直身子,他的身上散发出一种独特的气质。
既有少年人的昂扬,也有一种科研人员的自信,更有一种商界大佬的气势。
“我不知道在坐的有没有听说过去年2月份,白头鹰人工智能学术年会上展示出来的GPT,我在这里简单地介绍一下。”
“2012年,谷歌人工智能实验室提出想让机器学习语言和语法,次年,便发布了基于GPT的语言模型,该模型通过对输入的编码来学习语言。”
“同年十月,谷歌开始了GPT的试点项目,并通过改进,使得其能够在不需要大量训练数据的情况下学习语言模型。”
“所以,我们的目标其实很简单,那就是对标GPT,先从独属于国内的人工大模型开始。”
“第一阶段最终要完成的模块功能是能够做到像人一样的交流,甚至完成写邮件、文案创作、数学计算等功能。”
在王东来说到这里的时候,下面坐着的教授和研究员都有些躁动起来。
实在是王东来提出来的要求太高了,完全超过了众人的想象。
像人一样的交流,可以写邮件,文案创作。
这样的功能在王东来的嘴里还只是第一阶段。
只是听着王东来这么说,众人的心里便飞快地盘算了一下,便有了一个结论。
那就是根本不可能。
凭借他们的能力根本做不到这一点。
人工智能虽然他们还只是第一次接触,但是他们对于计算机还是有几分了解的,同时他们自己有几分实力,更是心知肚明。
真要是可以做到王东来所说的这样,他们也就不是现在这个样子了。
当即,就有一位戴着眼镜的中年人出声打断了王东来的话。
“王教授,你刚才提到第一阶段要完成的模块功能是能做到写邮件、文案创作等,可据我所知,这样的技术就算是在白头鹰也没有完成。”
“谷歌的GPT项目,我也有听闻,根据和一些海外朋友的交流,GPT是由Opanai的研究团队首次提出,其主要是利用神经网络,通过机器深度学习,从而使得机器获得强大的自然语言处理的能力,如此这般,才能让该模型拥有生成文本、回答问题并进行语言翻译等任务。”
“姑且不说能不能做到这一点,单单只是自然语言处理,就已经是一项难度极大的课题,更不要说人工智能涉及计算机科学、心理学、数学等多领域的,研究领域包括不限于机器人、图像识别、专家系统等等。”
“就算是我们目前要完成的人工模型,也不是一个简单的课题,说是人工模型应该不准确,更应该称之为大型语言模型才对,large language model也被称为LLM,它是一种使用深度学习算法来处理自然语言的模型,可以根据海量的数据来识别、总结、翻译、预测和生成文本和其他内容。”
“所以,这么一来,我们这个研究团队的任务很重,不是我在打击王教授和各位的信心,就目前的团队,其实我并不怎么看好。”
姚启智在王东来说话之前,就抢先地出声问道:“刘工,那你有什么想法?只要你说的有道理,在这个团队可以畅所欲言!”
被称为刘工的中年研究员看了一眼姚启智,再看了看没有说话的王东来,便接着说道:“很简单,那就是再增加人手!”
听到这里,王东来笑了出来。
“刘工,没想到你对人工智能有如此研究和了解,看来这次项目完成的可能性更大一分。”
“而针对刘工刚才提出来的问题,其实我早已有过考虑。”
“首先,我们这次的项目是大型语言模型,这一点想必刘工没有问题,而大型语言模型无非就是利用机器深度学习来完成,我们可以开发出一种基于循环神经网络的语言模型,用于生成连贯的文本等。”
“其次,便是刘工提到的自然语言处理,这一点我也有了解决办法,那就是基于Transformer的解码器,在没有标注的大数据下完成一个语言模型,作为预训练模型,然后在子任务上做微调获得不同任务的分类器,实现自然语言推理、问答和常识推理、语义相似度识别、分类等。”
“最后,便是刘工说到的算法、图像识别、专家系统等领域,我也同样有所准备。”
“刘工恐怕对我不够了解,并不知道其实我第一篇SCI论文就是关于算法的,我自认在算法这方面还是不弱于人的。”
王东来吐字清晰,语气平静,说出这一番话的时候,自带一种无言的压迫气势。
这一刻,在众人的心里对王东来的印象有了一个天翻地覆的变化。
刚才王东来表现的有多么的温文尔雅,现在便有多么的反差。
没有一句脏话,语气也没有什么变化。
可是在话语之中充斥着强烈的自信和霸道,令得众人不由自主地对王东来刮目相看。
王东来的表现也并没有让众人觉得意外,能够在这个年纪取得这样的成就,有这样的表现才是正常的。
不少人把目光放到了刘工的身上,想要看看还会不会说出什么话来。
却不料,得到王东来这样的回答,刘工的脸上浮现出一丝思索之色。
“王教授,你刚才提到的开发出一种基于循环神经网络的语言模型,还有自然语言处理,听上去颇有几分可行性,能不能详细讲讲,我感觉如果这些技术都已经解决的话,我们在人工智能领域的研究恐怕就要走在世界前列了。”
“哪怕这只是人工智能的一个方面,应用产品,但是只要在这个领域完成突破,所带来的影响就会是巨大的,足以在社会上引起巨大的震动。”
越说,刘工的眼神越是明亮,神情也变得激动起来。
见此,王东来在心里对这位刘工也有了一个清楚的认识。
纯正的研究员!
刚才打断自己,也并非是对自己有什么意见,只是见不得有人在大放厥词,所以出声打断。
可是在自己说出一些想法之后,刘工却能够在这么短的时间内反应过来,这就证明了这位刘工的卓越眼光和深厚的知识技术储备。
对于研究团队有这么一位能力超强的研究员,王东来心里颇为满意,脸上顿时露出笑意,说道:“刘工,人工智能的应用领域广泛,涉及的问题也非常多样化。”
“眼下,能够搞出一款国产的人工智能聊天通用模型,这就已经够了!”
王东来并没有多说,更不会在这里把关键点都说出来。
正如他所说的,一些核心的算法都会由他来完成,其他人先是做不到,其次才是出于保密的需要。
领先时代半步是天才,领先一步是妖孽,可要是领先了几百米,那就是祸端了。
刘工听到王东来这么说,张了张嘴,却没有再说什么,点了点头便安静下来。
见此,姚启智顺势接过话题。
“关于此次研究项目的情况,想必大家之前都已经看过了,我们这个项目目前在国内是第一例,所以我们身上还承担着一份开辟的责任。”
“而关于这一次的课题研究,王教授才是核心,说出来也不怕大家笑话,我感觉在人工智能这一方面,王教授其实比我更懂,知识储备也更多,刚才王教授和刘工的讨论就证明了这一点。”
“更何况,这一次的课题项目,也是由银河科技出资研究,成果和专利由银河科技独享。”
“接下来的研究工作,我虽然是带头人,但是希望诸位能够在研究过程中,拿出真正的实力,并且在遇到问题的时候,可以多听取王教授的建议。”
姚启智拿起话筒,无比认真地对着众人如此说道。
随着姚启智这么说,在场众人的神情顿时变得认真起来。
其实,有了之前王东来和刘工的交流,众人都已经看明白了。
王东来其实在这方面的造诣并不低,甚至可以说是超过了在座的大部分人。
一些有心人更是细数了一下,王东来在数学方面的成就不提,在计算机方面的成绩也是不低,这个项目五道口能够这么爽快地和银河科技合作,恐怕也是因为王东来的原因。
有这样的一位天才加入其中,对于人工模型项目而言,只有好处没有坏处。
这一点,众人都能想的明白。
所以,众人在姚启智话音落下之后,都纷纷点头起来。
“姚院长放心,王教授的成就摆在这里,我们自然不会熟视无睹。”
“人工智能技术要是能够突破,不管是对国家还是对学术界,都拥有极大的意义,我们自然不会藏拙,必然全力以赴!”
“正好,我的手上也没有什么要忙的项目,接下来我倒是可以将更多的精力放到这个项目上面。”
“巧了不是,我手上的几个课题也到了结尾工作,交给带的学生就行,正好投入到这个课题中来!”
“……”
一时间,会议室里的众人纷纷表态起来。
对于众人的表现,王东来并没有太过吃惊。
高校教授手上的课题其实并不少,尤其是京城的这些高校教授,就更是如此了。
而一项课题,大部分的工作其实都是交给了下面的学生,在读博士和研究生才是干活的主力。
脏活累活都是他们的,而这些教授也只是在关键的地方进行指点而已。
这并不是说这些教授在故意压榨,而是因为他们的手上的课题项目很多,分身乏术下的最好选择罢了。
也有出于锻炼带的学生能力的考虑。
当然了,一样米养百样人,自然也会有那种压榨学生劳动力的无良教授,这是不可避免的事情。
就连唐都交大也有,不过在王东来的提议下,郑华和徐松尧强硬无比地对这方面进行了严格的限制和监察,倒也使得唐都交大的学术氛围好上许多。
但是现在。
这些高校教授和研究所研究员,纷纷将手上的其他课题项目抛到了一旁,交给了带的研究生和博士们,自己将主要精力放到人工智能大数据上面。
原因简单的很!
人工智能大数据模型的价值更大。
同时,可行性也更高。
一旦课题完成的话,对于他们而言,就是巨大的利益。
不管是发表论文,还是评职称等,都有着帮助。
人工大模型的研发,主要有三大难题,分别是数据、神经网络架构以及硬件部分。
数据方面,因为是要通用大模型,所以需要的数据很大,不过还好这方面国内有优势,所以问题倒也不太大。
而神经网络架构这一点,有姚启智这位大佬以及诸多高校教授一同出手,最后还有王东来在,自然也是问题不大。
最后便是硬件部分了。
虽然可以借用五道口的‘探索1000’超算,但是并不是长久之计。
为了日后的发展,就必须要有自己的机器。
而这就需要有高性能的CPU和GPU,这些东西都需要从国外进口,还要受到钳制。
就算是这样,也只能硬着头皮买。
目前,国内根本无法满足需求。
当王东来提出要人工智能大模型的时候,其实都已经想到了这个问题。
买!
只有这一个选择,在西方还没有制裁,国内没有追赶上来之前,这些东西只能买。苦读书 www.kudushu.org
如果您中途有事离开,请按CTRL+D键保存当前页面至收藏夹,以便以后接着观看!