产品中心
国产ChatGPT命名图鉴
来源:小九直播下载安装    发布时间:2024-07-07 11:41:07

  随着ChatGPT的威名席卷全球,大洋对岸的中国厂商也纷纷亮剑,各式本土大模型你方唱罢我登场,声势浩大的发布会排满日程表。

  有趣的是,在这些大模型产品初入历史舞台之时,带给世人的第一印象其实不是以亿为单位的参数规模,也不是那些遍布英文缩写的模型特征。

  事实上,人们第一眼见到的只是名字。具体来说,是一个又一个奇特甚至稍显玄奥的词组。

  文心一言、通义千问、日日新、知海图、天工、星火……数不清的互联网新词跃出水面,于众声喧哗间搅动产业风云。

  必须承认,对广大新老用户来说,在“toB内测”“邀请码限量”和“登记预约”的重重限制之下,许多人还未能得到亲自上手体验本土大模型的机会。

  可这毫不损害它们无比强烈的存在感,因为崭新的名称不断出现在头版头条中,念不顺溜的人仿佛要被时代当场抛弃,令你不得不诚心记诵。

  浪漫地讲,遍历于信息大海的AI就像人类手造的“神明”,其称谓便如赛博时代里诸神的尊名。如今,没有一家中国大厂愿意错过新技术的浪潮,也没有谁甘心在“为神赋名”的竞赛中落于下风。

  放眼望去,如今国产大模型的名称究竟有何门道?文绉绉的称谓该怎样解读?什么样的取名思路才是大势所趋?

  倘若盘点一番,本土大模型及相关这类的产品最具标志性的命名思路,无疑是用最复古的名字包装最现代的技术。从先声夺人的百度到后续跟进的一系列强劲选手,多数都属于这一流派。

  2023年3月16日,百度在北京召开发布会,造势已久的“文心一言”正式亮相。

  官网信息数据显示,文心一言是百度新新一代知识增强大语言模型,“文心大模型家族的新成员”。据百度创始人李彦宏介绍,文心一言在文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等领域表现突出。

  百度对AI产业的多年布局我们暂且按下不表,单名字而言,“文心”与“文心一言”来自何处?

  在做客央视财经频道《中国经济大讲堂》时,百度CTO王海峰曾表示:“文”是语言文字,“心”是用心理解,“文心”指致力于理解和运用语言文字的自然语言理解模型,同时也呼应了《文心雕龙》,寓意用雕缕龙纹一样精细的功夫去研究语言文字的内涵和魅力;“一言”既有“一言为定”的寓意,也有对人机之间“你一言我一语”流畅沟通的殷切期盼。文心“一言”既出,即可“一生二、二生三、三生万言”……

  这样看来,文心之名根植于汉语语境,还拉上了文学理论家的千古著作背书,整体上颇具中国特色。

  此后,阿里巴巴集团董事会主席张勇在云峰会上表示,阿里巴巴全部的产品未来将接入“通义千问”大模型,做全面改造,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等等。

  那么,“通义千问”是啥意思?如果我们把这样的一个问题抛给通义千问自己,它会输出一则文心一言那样拆字式的回答。

  按照通义千问的自述,“通义”意味着模型具有广泛的知识和普适性,能够理解和回答各种领域的问题。“千问”则代表了模型能回答很多问题,包括常见的、复杂的甚至是少见的问题。它表达了通义千问致力于使用户得到满足在不同场景下的需求,无论问题多么复杂或者独特。

  简而言之,“通义千问”是一个经过文学化润色的名称,本意仍是在强调模型的强功能性。

  4月13日,在2023知乎发现大会上,知乎创始人周源正式对外发布了“知海图AI”中文大模型。

  据介绍,知乎通过联合研发与战略投资的方式,与面壁智能达成深度合作,共同开发中文大模型产品并推进应用落地。目前,知海图AI已经被运用于知乎热榜,首个大模型功能“热榜摘要”上线并开启内测。

  从命名角度看,“知海图”带有鲜明的企业文化烙印,它既呈现出知识图谱的功能面貌,又像借助海图遨游知识汪洋,如同古时远征。再回看发现大会上知乎CTO李大海的发言,他用“船长”一词称呼周源,更是让这关于大航海的比喻平添声色。

  4月21日,腾讯对外披露混元AI大模型的研发进展,宣布混元在五大跨模态视频检索数据集榜单中先后取得第一名的傲人成绩。据悉,混元基于腾讯太极机器学习平台做研发,借助GPU算力,实现快速的算法迭代和模型训练。

  太极、混元,这些词汇放在一起体系分明。道家有云,混元即无极,无极生太极,太极生两仪,两仪生四象,四象生八卦,八卦衍万物……

  2023年1月,网易伏羲中文预训练大模型“玉言”系列登顶中文语言理解测评基准CLUE分类任务榜单,在多项任务上超过人类水平。据悉,其自然语言解决能力可应用于语言助手文本创作、新闻传媒、智能客服等多个领域。

  在汉语中,“玉言”是指对别人所说话的敬称,常见于成语“金口玉言”。网易伏羲以此命名大模型,与自然语言处理的核心任务相契合,且不失古韵。

  另外,天眼查App显示,网易有道申请注册多个“有道子曰”商标。有消息称,网易有道自研的教育场景下类ChatGPT模型将于近期推出,模型名称为“子曰”。

  结合“AI英语口语老师”和“中文作文批改”等内测项目来看,“子曰”意在还原古代学子对先贤、老师的尊称,专门适配教育场景,技术上是大模型垂直应用的一次探索,命名亦是如此。

  4月8日,京东集团副总裁何晓冬在人工智能大模型技术高峰论坛上表示,京东计划在今年发布新一代产业大模型言犀。言犀将是京东版ChatGPT,预训练参数规模达到千亿级,人工审核通过率超过95%,生成文字超30亿。

  事实上,“言犀”对京东来说不算是新词。早在2020年11月的京东全球科学技术探索者大会上,“言犀”就曾作为京东智能客服品牌名称被正式发布。

  彼时,京东将“言犀”一词解读为“言下之意,心有灵犀”——对于智能客服来说,这或许就是沟通交流的理想境界。而如今升级壮大的言犀产业大模型,想必也会延续当初这份“心有灵犀”的憧憬。

  天工由昆仑万维与奇点智源联合研发,通过自然语言与用户进行问答式交互,可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等需求。其算力基于国内最大的GPU集群之一,采用了千亿预训练基座模型和千亿RLHF模型。

  “天工”一词与“人工”相对,指向天然形成的工巧。成语“巧夺天工”多用以形容技艺高超、胜过天然。放在现代大语言模型的语境里,天工便是对AI智能的极致褒扬,以人力造物媲美天然智巧。看得出,昆仑万维对自家旗下的双千亿模型满怀信心。

  官方信息公开披露,通过海量文本、代码和知识的学习,星火认知大模型拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务,号称“懂你所言,答你所问,创你所需,解你所难,学你所教”。

  与这一串排比相呼应的,是微渺的“星火”一词。“星火”本意是大火的火星或一瞬即逝的光,容易联想到的成语是“星火燎原”,指起初力量弱小但生命力旺盛的事物会快速地发展壮大。

  科大讯飞以此命名大模型,应当是取其燎原壮大之势,与当今AI智能的高速迭代互文。毕竟,你我都正见证大火燃起。

  3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”。

  书生大模型的初版由商汤科技、上海人工智能实验室、清华大学、香港中文大学、上海交通大学在2021年11月共同发布,并持续联合研发。官网信息数据显示,最新的书生2.5致力于构造多模态多任务通用模型,可接收处理各种不同模态的输入,并采用统一的模型架构和参数处理各种不同的任务。

  看完那豪华的联合研发阵容,“书生”这一个名字也就不显得突兀了,它首先恰如其分地展示了模型背后的学院派背景。其次,书生作为中国民间传统文化中最典型的学子形象,在“寒窗苦读”的叙事里意味着长久苦读、不断进益,这和AI模型不断进化的历程相吻合。

  4月10日,在书生2.5发布还不到一个月的时候,商汤科技再度公布了“日日新SenseNova”大模型体系,推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。

  针对这个名称,商汤科技联合发起人徐立表示:“我们以AI大装置SenseCore打造AGI时代的基础设施,并基于此将大模型体系命名为‘日日新SenseNova’,寓意‘苟日新、日日新、又日新’,希望在模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI的更多可能。”

  “日日新”显然延续了“书生”举一反三、持续学习的特质,并进一步强调了自我革新的价值。面临全球AI竞争加剧的大环境,恐怕的确只有日新月异的进步速度,才能在群雄并起时杀出血路。

  2021年7月,虚拟人“小初”在世界人工智能大会亮相,展示了图(视觉)、文(文本)、音(语音)三种模态的智能转换和生成。这样的表现得益于跨模态通用AI平台“紫东太初”,由中国科学院自动化研究所研发。

  紫东太初是全球首个图文音三模态预训练模型,同时具备跨模态理解与跨模态生成能力。中科院自动化所构建了中文预训练模型、语音预训练模型、视觉预训练模型,并通过跨模态语义关联,构建了三模态预训练大模型。

  起步早、技术硬的紫东太初,顶着一个硬核程度不遑多让的名字。所谓“太初”,是哲学概念中的起始状态。追溯古籍,《列子·天瑞》说:“太初者,气之始也。”《庄子·知北游》里写:“外不观乎宇宙,内不知乎大初。”前者在讲天地未分前的混沌之气,后者谈的是道之本源,若是拿来注解大模型的开拓性或蓝图,似乎都说得通。

  在接受观察者网采访时,中科院自动化研究所所长徐波曾回应过关于“紫东太初”名称内涵的提问,他说道:“相当于人工智能走向人类智能的一个混沌初开之际,也是感知智能走向通用智能重要的第一步。”

  2021年6月,智源研究院学术副院长唐杰正式对外发布了“悟道2.0”人工智能模型。?

  当时,悟道2.0以 1.75 万亿的参数量打破了谷歌Switch Transformer预训练模型创造的 1.6 万亿参数记录,一举创下全球最大预训练语言模型纪录。这之后,悟道大模型持续发展,奠定了智源研究院在中国人工智能领域的重要地位。

  “悟道”作为名称,字面上是指领会道理。重点是,“道”之一字具备丰厚的文化渊源,既是中国人文智慧的结晶,也是极深奥的考题,千百年来不知曾有多少人苦苦求索一生。

  在新时代,让AI悟道,去理解人力难尽之谜,是一场关于人工智能的、线、雪湖·海若——毫末智行

  4月11日,北京无人驾驶企业毫末智行发布了首个无人驾驶生成式大模型DriveGPT,中文名叫做“雪湖·海若”。据介绍,雪湖·海若未来将逐步应用到城市智能辅助驾驶、捷径推荐、智能陪练以及脱困场景中。

  第二个大流派很直接,不需要考据字词出处,因为命名直接取用了中国人民无比熟悉的名讳。传奇与史话中的古老代称被重新拾起,冠以21世纪的摩登内涵。

  2021年4月,华为云CEO余承东在HDC华为开发者大会上公布了华为云盘古系列AI大数据模型。

  3月,AI企业达观数据对外宣布,该公司研发团队正在积极探索大语言模型(LLM)的实践,研发国产版GPT“曹植”系统。

  3月14日,认知智能公司澜舟科技宣布完成Pre-A+轮融资。澜舟科技创始人周明在北京创新工场总部宣布,澜舟科技推出孟子对话大模型(MChat)。

  凤凰(Phoenix)大语言模型来自香港中文大学(深圳)和深圳市大数据研究院的王本友教授团队。

  第三大流派主打一个“朴实无华”,用最简单的字眼让人听懂掌声。对它们最好的解释,也许就是不做解释。

  4月9日,360官方正式公开宣布,基于360GPT大模型开发的AI产品矩阵“360智脑”率先落地搜索场景,将于4月中旬面向企业用户开放内测。未来,360智脑计划与浏览器、数字助理、智能营销等场景应用结合。

  3月30日晚间,云从科技发布公告称拟定增募资不超过36.35亿元,用于“行业精灵”大模型研发项目。该项目主要依托公司算法研发能力和大模型理论基础,用于行业大模型的理论研究与构建以及行业大模型下游场景的应用研发。

  最后一类国产大模型的命名十分特别,它们另辟蹊径地融入了一些外延知识,绝不肯落入窠臼。初看者一头雾水,懂梗的人则会心一笑。

  MOSS是来自复旦大学的对线日,复旦大学自然语言处理实验室透露,MOSS已由邱锡鹏教授团队发布,邀公众参与内测。

  4月20日,人工智能公司出门问问在北京举办2023 AIGC战略发布会。会上出门问问宣布内测探索大模型“序列猴子”。作为一款具备多模态生成能力的大语言模型,序列猴子支持文字生成、图片生成、3D内容生成、语音生成和语音识别等不同任务。

  在英文世界里,与AI相连的热门称谓同样是新闻报道的高频词。最前沿的产品正定义着我们对AI服务的认知,它们的代号是迥异于中文的另一种答卷。

  相比于OpenAI给ChatGPT的粗暴命名,谷歌好歹为自家聊天机器人设计了一个带有人格化色彩的称谓:Bard。

  在ChatGPT掀起热潮后,微软宣布新版必应搜索将搭载ChatGPT,改善用户的搜索体验,是为New Bing。

  在如今的大模型竞争中,网络公司们依然是活跃选手。GPT命名之道,其实是过往话题的延续:什么样的名字才是好名字?怎样评判好名字?

  如果从类别上看,网络公司的命名方式主要可以划分为两大类。一类方式是围绕企业名或主品牌名称进行延展,比如百度地图、、百度网盘等等。这样命名的前提,是用户已经普遍对“百度”这一品牌建立了认知。

  就以备受好评的“饿了么”为例,杨泽解释道:“现在美团一直在强调什么都做,饿了么(延展业务)就难一些,因为它过于聚焦‘饿’的场景,这是品牌名称形成的,早期的时候可能让人感觉印象很深刻,但是到现在我们得知它名字的延展性是有问题的。”

  品牌的本质是共识,而共识并不是脱离产品先行的。尽管好名字能够更好的降低用户的认知成本,但其影响力终究要受到市场发展阶段的影响。

  “一般在一些充分竞争的市场里,一个好的名字优势会很大。但是在一个新兴的、比较空白的市场,其实好的名字并不会给你带来太多优势。”

  在新兴领域,共识的形成需要时间,它是在产品服务处理问题的进程中不断建立的。例如今天的大模型竞争,ChatGPT用一个最朴素的名字横空出世,拿出最颠覆性的体验凭空创造共识。

  想来,在每时每刻处理无尽数据的大模型眼里,这个关乎数字的比喻,应当再容易理解不过。