(资料图片仅供参考)

作者 | 吴菲凝

编辑 | 李水青

智东西4月20日消息,AI科技公司出门问问今日在2023 AIGC战略发布会上,宣布内测大语言模型“序列猴子”,为国内大模型创业潮再添一把火。

在大模型能力基础上,出门问问推出面向创作者的CoPilot产品矩阵,包含四款AIGC产品:AI写作平台“奇妙文”、AI绘画平台“言之画”、AI配音平台“魔音工坊”、数字人视频与直播平台“奇妙元”。

除了面向创作者的产品矩阵之外,出门问问本次还推出了面向C端的升级版语音助手“魔法小问”,据称类似于“Siri+ChatGPT”,以及面向B端的企业专属大模型。

出门问问创立于2012年,主打语音交互和智能软硬件研发,代表性产品包括智能手表Ticwatch和高级驾驶辅助系统问问魔眼Ticeye等,主要覆盖智能穿戴设备、车载、家具等场景。出门问问创始人兼CEO李志飞曾任谷歌美国总部科学家,是机器翻译开源软件Joshua的主要开发者,也是这波大模型创业潮中备受产业关注的一位创业者。

“序列猴子”链接为:

openapi.mobvoi.com

一、大模型序列猴子”内测,李志飞只给其打50分?

出门问问大模型“序列猴子”是一款具备多模态生成能力的大语言模型,模型以语言为核心的能力体系涵盖“知识、对话、数学、逻辑、推理、规划”六个维度,能够同时支持文字生成、图片生成、3D内容生成、语音生成和语音识别等不同任务。

出门问问大模型之所以命名为“序列猴子”,是因为从“无限猴子”定理中汲取了灵感,该定理在20世纪初由数学家埃米尔·波勒尔提出,即如果有一群猴子在不限定的时间内学习打字机,最终一定能敲出一本完整的莎士比亚作品。“序列猴子”的构建原理与无限猴子理论类似,通过喂给机器猴子海量的文本序列,再用大规模的算力去训练它,就能训练出一只具有智能的“序列猴子”。

李志飞称,大模型的“大”绝不仅限于参数量,他目前没有透露“序列猴子”参数量的打算,他也强调,不能一味地以参数量的大小来评价一个模型,大模型是对于语言的建模,是对于认知边界的扩展,大模型拥有无限的想象空间。

他直言,GPT-4如今的表现近乎满分,相比之下“序列猴子”就像是一个需要不断教他学习的小孩子,目前还只有50分的水平,但他从中看到了“能考上哈佛的潜力”。

目前,“序列猴子”大模型已经具备了一定的自然语言理解、知识、逻辑以及推理等能力,对于“湖南和湖北哪一个省会的人口更多?”这类比较复杂的问题能够快速给出准确结果。

李志飞称,“序列猴子”在训练过程中已经展现出了“涌现”能力,目前正处于“顿悟”阶段,未来提升的速度会越来越快。他还认为,做人类的CoPilot(副驾驶)会是大模型最好的“工作”,未来CoPilot将无处不在。

二、构建CoPilot产品矩阵,四大神器助力创作者内容生产

基于“序列猴子”大模型,出门问问内测了多款面向创作者的AIGC产品及应用,为创作者构建一站式CoPilot产品矩阵,打通内容创作全流程。据官方数据,目前出门问问注册用户超500万,全球付费用户超百万。

1、AI写作助理:奇妙文

作为发布会上首个亮相的CoPilot产品,“奇妙文”的AI写作能力覆盖了职场办公、市场营销、新媒体和创意写作四大内容创作场景,能够在用户撰写年终总结、客服话术、剧本、广告文案等内容时,为其源源不断地提供灵感和创意方向。

奇妙文链接:write.mobvoi.com

为更好帮助用户提升内容创作效率,“奇妙文”开放了八大AI编辑功能,分别为风格转化、要点提取、校对纠错、续写、改写、扩写、缩写、翻译。“奇妙文”还能在写作中自动生成图片,为用户带来图文并茂的写作体验。

2、AI绘画助理:言之画

面对设计师、插画师等在文字外对设计有强烈需求的创作者,出门问问内测探索了“言之画”AI绘画平台。“言之画”支持二次元、蒸汽朋克、插画、古风、油画等8种创作风格。用户只需输入文字,“言之画”就能一次性生成8张光影逼真、细节丰富的2K高分辨率图像。

言之画链接:paint.mobvoi.com

除了以文生图,它还拥有以图生图、动图生成、个性头像生成等AI绘图能力。面向企业用户,“言之画”还支持专属模型定制,让企业用户能够根据自身需要自定义模型风格,并且支持多人协作生产,更好地满足企业的绘图需要。

目前,“言之画”已经和家装设计平台酷家乐达成了战略合作。在酷家乐平台上,用户在言之画的帮助下,只需用文字描述出自己的详细需求,即可更换装修风格、调整家具位置等,进而设计出自己喜欢的装修方案。

3、AI配音助理:魔音工坊

面向AI配音场景,出门问问推出了新一代AI配音产品“魔音工坊”以及海外版本DupDub。“魔音工坊”是一款全流程一站式AI配音平台,已向用户开放了超1000种音色、超2000种声音风格以及超20种方言和外语。

魔音工坊链接:moyin.com

在大模型技术的加持下,“魔音工坊”搭载了大模型AI写作功能,覆盖了AI写作、AI配音和剪辑等多个场景。用户可以在它的辅助下完成影视解说、有声书、在线教育、新闻播报等集文案与配音于一体的内容创作。目前,“魔音工坊”已经与微信读书、少年得到、趁早行动、大众等多领域企业达成了合作。

“魔音工坊”支持对选定声音进行包括平静、悲伤、开心在内的7种情绪的调节,对包括女中年、男孩等在内的10种角色进行迁移,同时还开放了韵律调节、局部变速、多人配音等AI声音个性化编辑功能,让用户能够像用word编辑文档一样编辑声音。

除了选择声音、编辑声音,基于大模型的语言生成能力,“魔音工坊”还将推出“捏声音”功能,用户可以自由选择性别、年龄、语言、风格和情绪等声音特征,从0到1创作自己喜欢的声音。

4、数字分身:奇妙元

奇妙元链接:weta365.com

在文字、图像、声音等生成能力基础上,出门问问还内测发布了AI数字形象创作及直播平台“奇妙元”。

“奇妙元”现有超100款数字人、超1000款3D数字资产、超1000种声音。凭借多模态生成技术,“奇妙元”平台目前共支持图片建模(2D数字人)、视频建模(2.5D数字人)、3D建模(3D数字人)三种不同形式的数字人生成。其形象克隆功能,仅需一段5分钟的真人视频素材,就可以1:1复刻用户的形象神态,为用户打造声音一致、动作自然的数字人分身。

三、智能AI助手“魔法小问”,类似于“Siri+ChatGPT”

出门问问在语音助手领域有着深厚的积累,对AI语音的研究可以追溯至十年前:2014年,出门问问发布了首款语音助手“小问助手”;2015年,更新“小问秘书”;2017年,推出了全场景VPA,并在2019年进行升级。在本次发布会上,出门问问内测发布了CoPilot“魔法小问”,李志飞称,这款智能语音助手可以理解为是“Siri与ChatGPT的综合体”。

作为面向个人用户开发一款智能语音助手,“魔法小问”可以帮助用户查百科信息、查天气、查餐厅、查酒店,还能与用户对话聊天。在现场演示中,向“魔法小问”提问“这附近有哪些好吃的川菜馆”时,它能按照远近距离、评分星数依次列出附近推荐的川菜餐厅。

据王志飞介绍,“CoPilot”源自超级助理的概念,它将拥有基于大模型的高智商大脑,能够分析海量数据即时准确地与人类交流;还会拥有动听的声音、靓丽的形象,可以搭载任意硬件平台,如手机、手表、车机等;还能够适配千行百业,化身高质量教学的老师、知识渊博的律师、专业的医生、金融理财客服等,在需要的时候,随时随地展示专业知识,为人分担压力。

四、“序列猴子”开放B端C端生态,首批赋能十大行业

基于“序列猴子”大模型的底层能力,对于B端用户和垂直领域,“出门问问Copilot”不仅提供通用能力支持服务和数字人形象定制服务,还将开放自身角色能力,持续迭代数据接口。有需求的企业用户可以登陆网页端调用API服务,并且能通过上传文档的方式,对行业专有内容进行训练,从而实现定制化语音交互。

目前,出门问问已经与首批十大行业的内测探索伙伴达成了合作,覆盖汽车、教育、律所、金融、医疗、旅游等领域,未来出门问问“CoPilot”将逐步赋能更多行业,助力更多企业拥有自己的专属大模型,打造自己的专属“CoPilot”。

结语:大模型卷起创业潮,AI加速平民化

时隔三年,出门问问携中文大模型和AIGC产品亮相,李志飞坦言“序列猴子”与GPT-4的差距不小,但他认为,公司研发大模型的目的从不是“打造一款中国版ChatGPT”,而是通过这个口号告诉外界他们现在正在研制什么,准备往何处发展。目前,出门问问推出了AI声音、AI写作、AI图片以及数字人直播等内容为一体的AIGC SaaS平台。

国内AIGC创业潮来袭,李志飞也称,走在硅谷时几乎所有的人讨论的话题都是“Chat”、“GPT”等。继百度打响了国内大模型第一枪之后,以知乎等为代表的互联网大厂和以商汤、昆仑万维等为代表的科技公司也纷纷加入其中。

不同于微软、谷歌等大厂要颠覆传统的野心,国内多家创企们专注于AIGC的细分赛道,比如聊天对话、音乐生成、协同办公以及AI和任何一个专业领域的融合。在这场大模型的同台竞技中,大模型技术不断平民化、生活化、场景化,使用门槛降低、认知熟悉程度提升,AIGC有望带来一场彻底的产业变革。

关键词: