扫一扫关注

各家AI大模型内心OS:名字而已,我卷“死”你

   2023-04-13
说起来也奇怪,这批互联网大厂当年像商量好了一样,名字起得都相当接地气。要么是小米、苹果、搜狐等动植物齐上阵,要么就是滴滴、陌陌、探探等叠音型,再不就是360、58、51等数字型,总之,主打一个好记。
反观他们研发的大模型,那名字起得一个比一个拗口玄乎。百度“文心一言”、阿里“通义千问”、华为“盘古”、腾讯“混元”,甭管好不好记,气势先得出来,名字必须配得上“野心”。
论起名,阿里似乎颇有心得。
最为人津津乐道的就属阿里的“花名”。马云“风清扬”,张勇“逍遥子”,“东邪”“虚竹”“苗人凤”……大佬上班犹如武林开大会,大佬退休则为退隐江湖。
带有浓浓武侠风的阿里,这次却给自家的大模型起了个正经的名字“通义千问”。
“通义”取自《汉书》中的“天地之常经,古今之通义也”,有“普遍适用的道理与法则”之意。作为一个大型预训练语言模型,“通义千问”在训练过程中学习了大量的文本数据,从而具有广泛的知识和普适性,可以针对各种领域的问题“对答如流”。
而“千问”,阿里巴巴达摩院给出的官方解释是“千万次的问,千万的学问,能问出千问的一定是真爱,能回答千问的也一定是真有学问,以及AI和我们一样,都有千万次交互的热情”。
是否经得起“千万次的问”,该模型在内测中已然交了答卷。除了敲代码、算算术等常规操作外,“通义千问”还搞了一个针对不同场景的小应用集合“百宝袋”,可以写提纲,给出放飞的菜谱,甚至还生成彩虹屁。
百度的“文心一言”大有与阿里的“通义千问”一唱一和的架势。
马云痴迷武侠小说,李彦宏酷爱唐诗宋词。众所周知,“百度”这个名字就是取自辛弃疾的《青玉案》,“众里寻她千百度,蓦然回首,那人却在,灯火阑珊处”。
作为“全球首家发布类GPT产品的大厂”,在大模型起名上,百度煞费苦心。
据文心一言解释,“文”是语言文字,“心”是用心理解,“文心”从诞生之初就是致力于理解和运用语言文字的自然语言理解模型,同时也呼应《文心雕龙》,寓意用雕缕龙纹一样精细的功夫去研究语言文字的内涵和魅力。
“一言”既有“一言为定、一言九鼎”之寓意,也有人机之间“你一言我一语”自由流畅沟通之期盼。文心“一言”既出,即可“一生二、二生三、三生万言”。
只不过,百度发布会上“ Demo 演示”的形式不及预期,网友纷纷调侃应该改名为“一言难尽”。
网易在起名这事上向来佛系,只要不带“哥、爷、姐……”,昵称随便取,于是“富贵”“二狗”等名字成了网易打工人眼中的“香饽饽”。
自家人关起门来叫啥都行,但面向公众的大模型要是起个“土得掉渣”的名字实在说不过去。因此,网易一改以往的“土味”,给自家大模型取了个极文雅的名字——“玉言”。
“玉言”,取自“金口玉言”一词,即对别人所说话的敬称。
“玉言”大模型脱胎于网易伏羲,训练语料主要来自小说、百科和新闻等,模型规模从最早的一亿参数增长至千亿参数,模型领域也从文本拓展到图文、音乐、行为序列等多种模态,其具备的自然语言处理能力可应用于语言助手文本创作、新闻传媒、智能客服等领域,甚至在多项任务上超过人类水平。
此外,网易有道还将于近期推出教育场景下类ChatGPT模型——“子曰”。基于“子曰”研发的AI口语老师和中文作文批改DEMO已完成,近期开放内测。
“子曰”在古代是各家学生对老师的尊称,作为国内首个教育场景下的类ChatGPT模型,这个名字与其定位十分契合。
据悉,“子曰”类ChatGPT模型将尽快在网易有道建立起的“内容+硬件+AI”产业链条上实现商业化落地。
网易有“伏羲”,华为有“盘古”。
上周末,华为发布最新的盘古大模型。延续华为取名的霸气,此大模型的名字来自于“盘古开天”的神话,外界解读称这寓意着华为将通过输出技术能力与产业融合,使AI走向千行百业打开新空间。
事实也确实如此。
不同于“文心一言”等通用型大模型,华为“盘古”在消费端的应用并不惹眼,反倒是B端应用更惊艳。据华为介绍,华为更看重AI赋能产业,希望为煤矿、水泥、电力、金融、农业等行业创造更多产业价值。
取名同样“霸气侧漏”的还有腾讯。
与国际接轨的腾讯素有起英文名的传统,例如马化腾“Pony”、 刘炽平“Martin”。而此次腾讯AI大模型却从道家学说中“取经”——“混元即无极,无极生太极,太极生两仪,两仪生四象,四象生八卦,八卦衍万物”。
在这句经典的道家语录中,腾讯有了灵感,将机器学习平台命名为“太极”,基于此平台研发的AI大模型命名为“混元”。
腾讯的混元AI大模型包括计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等多个方向,已广泛应用于腾讯微信搜索、腾讯广告等业务场景。
据总裁Martin所言,该大模型未来还会应用于各业务当中,除社交、通讯和游戏业务外,聊天机器人、数字助手、资讯获取等方面也将是腾讯的尝试方向。
作为人工智能领域的独角兽,商汤科技不负众望,已经成功研发了320亿参数量的全球最大的通用视觉模型。
3月中旬,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,不到一个月,又祭出“王炸”——日日新(SenseNova)大模型体系。
之所以命名为“书生”,一方面是因为研发团队的学院派背景,另一方面,书生作为中国古代读书人的经典形象,代表着一个通过不断学习、不断成长进而拥有各方面才能的人格化角色。
商汤将全新的通用视觉技术体系命名为“书生”,意在体现其如同书生一般的特质,可通过持续学习,举一反三,逐步实现通用视觉领域的融会贯通,最终实现灵活高效的模型部署。
如今,“书生2.5”已具备通用场景下图像描述、视觉问答、视觉推理和文字识别等感知和问题处理能力,在自动驾驶和居家机器人等场景下,可辅助处理各种复杂任务。未来的发展方向也将专注于通用模型的技术突破和创新应用。
而“日日新”,取自《礼记·大学》中“苟日新、日日新、又日新”,虽然目前“日日新”大模型仍集中在自然语言处理、图片生成、自动化数据标注、自定义模型训练等,但研发团队期望模型的迭代速度及处理问题的能力可以日日更新,不断解锁AGI更多可能。
此外,京东旗下言犀人工智能应用平台将推出ChatJD,定位为产业版ChatGPT,未来将聚焦零售和金融两块业务。
同样“不做通用大模型”的还有达观数据,其正在研发的“曹植”系统是一个专注于金融、政务、制造等垂直领域的大语言模型。
它的名称引自曹植“七步成诗”的典故,“我们想让大语言模型和曹植一样,才思敏捷,知识渊博,‘培养’出人工智能版的‘曹植’来”。
 
免责声明:该文章版权归原作者所有,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如果涉及作品的内容、版权和其它问题,请在30日内与本网联系。并且,不保证本网站提供的任何信息的准确性或完整性。在任何情况下,均不对因使用本网站提供的信息而造成的损害承担责任。
举报收藏 0打赏 0
 
更多>创业参考
推荐图文
推荐创业参考
点击排行
网站首页  |  关于我们  |  使用协议  |  版权隐私  |  隐私政策  |  合作代理  |  联系方式  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  京ICP备15045284号-1