大模型在四五月份迎来“百家争鸣”,战况愈加激烈,有新玩家仍在陆续进场。
(资料图片)
AI 科技评论获悉:近日,一家多模态大模型初创公司“智子引擎”完成了千万元天使轮融资。据了解,“智子引擎”的 CEO 是 90 后青年高一钊。高一钊是人大博士生,师从卢志武,卢志武在“智子引擎”公司中担任顾问一职。此外,卢志武担任软通动力首席 AI 科学家。
在 ChatGPT 火起来之前,北京智源人工智能研究院曾率先开拓中国大模型研究,名为“悟道”,当时聚集了四支主要力量,分别由清华唐杰、清华刘知远、清华黄民烈与人大文继荣领头。
其中,人大文继荣主要带领人大高瓴人工智能学院的科学家们开拓多模态大模型方向,名为“文澜”,卢志武便在团队中担任模型主力军,他的学生高一钊也参与进来,完成了核心的研究工作。“悟道”之后,唐杰、刘知远与黄民烈均基于大模型技术成立了公司,而人大的入局,为智源大模型“四大金刚”的创业阵容拉开了完满的序幕。
据 AI 科技评论了解,卢志武团队也是国内最早研究多模态大模型、并取得杰出技术成果的团队。
卢志武和高一钊二人
卢志武和高一钊从事多模态大模型始于 2020 年。
2020 年 5 月,由 OpenAI 研发的 GPT-3 在人工智能领域掀起了一阵巨浪,引发了国内从业者对预训练大模型的关注,其中就包括了卢志武等人。
卢志武早年就读于北京大学数学科学学院信息科学系,硕士毕业后,于 2011 年在香港城市大学计算机系取得博士学位,他主要的研究方向包括机器学习、计算机视觉等。
卢志武
当时,国内大部分人的注意力都聚焦在 NLP 领域,但有关从文字扩展到图像、视频的多模态大模型鲜少有人关注。
期间,中国人民大学高瓴人工智能学组建了多模态大模型研发团队,专门从事图文多模态预训练模型的研究和开发,由文继荣牵头,其他核心成员包括宋睿华、卢志武等人,这也是国内最早从事多模态大模型研究的团队。
高一钊在同年进入中国人民大学高瓴人工智能学院攻读博士、师从卢志武。
高一钊
“智子引擎”将推出多模态大模型
事实上,早在 ChatGPT 横空出世的三年前,北京智源人工智能研究院已率先开始中国大模型研究,名为“悟道”,其中由文继荣主要带领的人大高瓴人工智能学院科学家组成“悟道·文澜”团队,从事多模态大模型方向研究,卢志武任模型研发主力军。
2021 年 3 月,基于对 3000 万图文数据集的预训练,第一代“文澜”——图文检索模型 BriVL 正式问世,这是一个超大规模的多模态预训练模型,采用了双塔结构可分别对图像和文本进行编码,通过自监督任务来学习图像和文本之间的相似度。
以图文检索模型为基础,研究团队还开发了 H5 小应用“AI心情电台”,只需要向 AI 精灵提供一张图片,模型即可为该图片匹配一段合适的音乐。
随即三个月后,卢志武所在的文澜团队又发布了“文澜 2.0”(BriVL-2)。基于视觉-语言弱相关的假设,研究团队提出图文弱相关假设,设计了高效的跨模态对比学习策略,同时提出了基于DeepSpeed的分布式多模态训练框架,从而提高模型的表达能力和泛化能力。
基于 6.5 亿弱相关的图文数据集的预训练,文澜 2.0 拥有的模型容量达到50亿参数,是目前最大的中文通用图文预训练模型,可覆盖多个领域和场景,在多个图文检索和生成任务上都取得了优异的性能,比如图像检索、图像描述、视觉问答等。
期间,高一钊也深度参与了文澜 1.0 和 2.0 的图文预训练工作,主要负责数据处理、模型训练和评估等。
在 ChatGPT 的热浪下,卢志武和高一钊看到了多模态研究在大模型时代的新机遇,成立多模态大模型公司“智子引擎”。借鉴以往参与文澜模型研发的经验,“智子引擎”团队于今年的 3 月 8 日正式推出了自主研发的多模态对话大模型,并发布了第一款应用级多模态 ChatGPT 产品“元乘象 ChatImg”。
“元乘象 ChatImg”的参数量在百亿级别,主要使用了图文对数据和 VQA 数据作为训练集,同时进行图文匹配、图文检索、图像描述生成、文本描述生成等多种任务的训练。根据用户输入的图片或文字,“元乘象 ChatImg”可以进行智能聊天、讲故事、写广告等。
自四五月份以来,陆续亮相的大模型引起一片喧嚣沸腾,大厂刀光剑影,创业公司也不遑多让。学术界下场入局大模型是个大趋势,如何能在靠近工程化的较量中找到自己的竞争力和位置,亟待从与时间的赛跑中找答案。
(雷峰网雷峰网(公众号:雷峰网))
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
关键词:
大模型在四五月份迎来“百家争鸣”,战况愈加激烈,有新玩家仍在陆续进场。AI科技评论获悉:近日,一家多模2023-05-22
“再见了,我一生的挚爱“”我们是在错的时间,遇上对的人“我这一生犯的最大的错误,就是爱上了一个谎言构2023-05-22
观点网讯。5月22日消息,广州增城区近日公告了2023年1-4月固定资产投资项目审批(备案)情况通报。据观点新2023-05-22
沈阳2023年6月普通话证书查询及领取时间1 电子证书查询领取查询时间:测试结束40个工作日后。查询平台:“2023-05-22
5月22日,外交部发言人毛宁主持例行记者会。 有记者提问,乌克兰总统泽连斯基参加了七国集团峰会,中方对此2023-05-22
本报讯(通讯员朱纯宁朱顺)为促进国家卫生县创建成功,营造让群众在小城享受一个干净、整洁、舒适的居住环2023-05-22
截至2023年5月22日收盘,三一重能(688349)报收于34 54元,上涨0 96%,换手率1 74%,成交量2 48万手,成交额8636 49万元。2023-05-22
存款数据出炉,北京上海领跑全国,杭州超广深,透露出什么信号?,广州,存款,上海,深圳,北京市,杭州市,大运2023-05-22
2023年漳州初中生可登陆漳州市教育局官方网站,查询入口开放后,进入漳州市招生管理系统,点击“中考成查询2023-05-22
还有很多王国之泪网友还不知道王国之泪黄玉耳坠升级材料一览,下面就是第一资讯网小编编辑的《王国之泪黄玉2023-05-22
今天来聊聊关于沙发是什么意思和寓意,沙发是什么意思的文章,现在就为大家来简单介绍下沙发是什么意思和寓2023-05-22
央视网消息:昨天(5月20日),随着55031次检测列车从福州南站驶出,福厦高铁进入联调联试阶段。福厦高2023-05-22
小米Civi3正式迎来官宣,这款手机将于5月25日14点发布,最大的看点在于首发联发科天玑8200Ultra芯片,在影2023-05-22
1、颈椎病不难治疗反复牵引和不当的按摩会适得其反加重病情。2、颈椎病药物没有特别好的疗效的。3、一般采2023-05-22
读特客户端·深圳新闻网2023年5月22日讯(深圳商报首席记者袁静娴)记者日前从深圳市卫健委获悉,目前,深2023-05-22
槐乡永寿常来长寿,中国永寿第二十届槐花旅游文化节开幕式将于5月24日在永寿县永平镇翠屏广场举行,以槐花2023-05-22
1、厦大读3年目前学费是一万一 年一等和二等奖学金都是免学费的一年一评录取比例很低按今年的情况应该是4002023-05-22
英超第37轮,西汉姆联主场迎战利兹联。上半场罗德里戈凌空斩破门,赖斯扳平;下半场鲍文建功,兰奇尼锁定胜2023-05-22
俄罗斯卫星通讯社莫斯科5月19日消息,俄罗斯远东航运集团(FESCO)称,英国对该集团所实施的制裁不会影响运2023-05-22
眼下,各地演出市场复苏回暖,大型演唱会、原创话剧、歌舞剧等接连开票,滋生出各类针对文艺演出等活动的倒2023-05-22
上个月,华为发布了HUAWEIADS2 0也就是华为高阶智能驾驶辅助系统,是一套智能驾驶辅助解决方案。那么问题来2023-05-22
1、女性内裤上有黄色的污渍和痂,一般是白带粘在内裤上晾干形成的。这分为两种情况,一种是正常,一种是不2023-05-22
1、沃尔玛的购物卡有两种:磁条购物卡和条形码购物卡。2、条形码购物卡(背面有条码的那种)就跟商品一样,2023-05-21
爆款综艺IP能否再次引爆芒果超媒股价?详情2023-05-21
拒绝退休!曝李春江担任上海男篮技术顾问,渴望完成冲冠目标,赵睿,李春江,王哲林,蒋兴权,上海男篮,辽宁飞豹2023-05-21