发布日期:2024-06-23 07:08 浏览次数: 次
澳门新葡萄新京6663腾讯的“大模型宝宝”能长成杀手级应用吗?它可能出自“APP工厂”字节跳动、在AI上长期且重金投入的百度、深耕云计算业务的阿里巴巴等互联网巨头,也可能来自打造了爆款C端(个人用户端)应用Kimi的月之暗面、“希望能够在起步阶段就做出超级应用”的百川智能等AI新贵。
这些AI行业的新老玩家,从2023年以来陆续发布多款C端AI应用。然而,坐拥微信、QQ两大国民级应用的腾讯并不急于出手,它基于混元大模型打造的第一款C端AI应用腾讯元宝,历经近半年时间打磨,最终于5月30日发布。
姗姗来迟的腾讯元宝,囊括了AI搜索、AI总结、AI写作、绘画、创意头像、识图、口语陪练、翻译等市面上常见的功能,并接入了腾讯庞大的内容生态体系。但AI同行乃至用户似乎对元宝有着更高的期待,有从业者感慨,元宝与其他C端AI应用相比,并无显著差异,没有带来引领行业潮流的新体验。
衔着金钥匙出生的元宝,为何着眼于看似普通的功能?背靠腾讯这棵大树,它的成长计划是什么?6月14日,腾讯混元产品总监王昕在接受经济观察报独家专访时回应了上述问题。
王昕称,元宝的产品定位是面向更多普通人的AI产品澳门新葡萄新京6663澳门新葡萄新京6663,而非高高在上的、非常小众的、为极客圈定制的产品。元宝团队从解决工作和生活中的高频需求入手,并希望通过其他AI能力给更多普通人的生活提供帮助。
谈及元宝的未来规划,王昕说,眼下,元宝团队的工作重点是获取用户,根据真实用户的使用反馈,调整模型和产品策略。在AI大模型这条足够长的雪道上,元宝的成长不急于一时。
王昕:这跟产品定位有关系,我们不希望做出来的东西,是一款高高在上的、非常小众的、为极客圈定制的产品。元宝可以理解为混元大模型的宝宝,这个名字我们觉得会更可爱、好记。
王昕:在工作和生活两个大的场景,用户的需求没有变化过,主要是信息获取与生成、内容消费、搜寻服务。我们根据这些需求,通过AI赋能的方式一个个切入。我们希望做一个用户需要的产品,当场景和解决方案覆盖得越来越多时,用户的满意度自然就会提升。
经济观察报:在元宝首批上线的AI搜索、AI总结、创意头像、口语陪练等功能中,哪些功能的使用频率更高?
王昕:元宝现在主打的人群或者场景是工作(效率提升类)偏多一点,其中的AI搜索是一个比较高频的功能。在泛生活化、泛娱乐化的场景中,百变AI头像、口语教练和超能翻译官也是元宝的“拳头”级应用。
第一个维度是最重要的用户诉求。有数据显示,一个人每天在互联网上搜索频率极高,因此我们会先定义用户有哪些高频诉求。第二个维度叫做模型尖刀。当用户有了这个诉求,我们通过现在腾讯混元大模型的能力把它实现得更好。第三个维度要看腾讯的产品与内容矩阵,我们做了这些能力,有没有可能协同更多业务和场景,实现多赢。
经济观察报:总结起来就是用户诉求、产品能力和腾讯自己的优势。那为什么最后具体选择了工作、生活这两个板块和多个子功能?
王昕:一个新生的事物或者一种新生的能力,还是要从高频用户开始切入。一般来说,他们对于工作效率提升的诉求会更强烈。同时,这些用户也是他们周边生活半径里互联网产品的意见领袖,会产生传播效应。所以我们先瞄准了高频用户。
这里的高频用户,首先是18岁35岁、高学历的人群,再慢慢往下拆分,主要是职场人士或高学历学生人群;再去拆分他们在工作、学习、日常生活中有哪些需求,用元宝怎么来满足,因此我们开发出了翻译、文字处理等功能。
经济观察报:腾讯云副总裁、腾讯混元大模型负责人刘煜宏曾说,希望腾讯元宝最终服务于每个普通人的生活。低使用门槛是元宝的其中一个定位吗?
王昕:在产品愿景里,低使用门槛是元宝甚至腾讯做的所有产品的一个指导方针。我们会通过极简式的交互,让用户知道大模型产品大概是什么,只需要让用户简单地点击,而不是较高门槛地去输入一大堆字。
王昕:大模型本身最重要的是总结能力、自学泛化能力,但做搜索本身,不论是AI搜索,还是传统搜索,信息源要准确、不泛滥。微信公众号是整个中文语料里最好的信息源,微信公众号的优质文章便是元宝的优质语料澳门新葡萄新京6663澳门新葡萄新京6663。
业务之间打不打得通,根本上要解决一个问题:如何实现双赢?怎样既能实现对方业务的成功,又能让元宝实现更好的用户体验。
AI可以给内容粉丝群体带来更多互动,比如角色模型。以近期热播剧《庆余年2》为例,我们通过混元的努力,例如通过投喂小说等做训练和学习,训练出了林婉儿、范闲等人物的角色模型。当粉丝跟元宝中的角色模型互动时,他们能够明显地体验到对方的性格、倾向、说话的方式。
经济观察报:我同时向元宝等国内外主流大模型产品提问“单词straw-berry中有几个r”,得到的答案都是2个。为什么它们在这种基础功能上也会出现错误?
经济观察报:然后我依次向元宝提问“正确答案不是3个吗?不是6个吗?”元宝重新分析后,明确回复是3个r。而当我问其他大模型产品同样的问题时,多数大模型产品都会顺着提问者的说法,将答案改为6个r。
王昕:元宝的个性有一点犟,我们内部还叫它“犟宝”。当它重新分析后,确定自己的答案是对的,会反驳提问者:“我已经分析了每个字符,我确定我的答案是对的。”“犟”的前提是回答的精准性。因为现在很多用户会诱导模型,比如问“你确定1+1等于2吗”,很多模型一下子就会“滑跪”:“对不起,我算错了,1+1等于3。”元宝会告诉你:“我确定就是2。”它会坚持自己的判断。
经济观察报:有些用户也经常“刁难”元宝,比如在腾讯今年第一季度财务业绩公布前夕,他们提前问元宝腾讯该季度的业绩,有时候会获得一个不准确的答案。
王昕:这是一个时间幻觉。我们也在逐步训练元宝,一是要让模型知道还没有发生的事情,你就是不知道的。
二是在模型的生成过程中,当时间的插件或指数不是很准确时,模型的信息源应该更卡时间。比如用户问“昨晚欧冠谁夺冠了”,这里的时间参数不够精准,模型就会到处搜,可能搜到去年、前年的欧冠冠军,那就有可能增加幻觉的可能性。
经济观察报:从元宝的项目立项到正式上线期间,国内外互联网大厂纷纷发布自己的大模型产品,这段时间你们团队经受了哪些压力?
王昕:公司管理层给团队的价值观方向非常明确:不争一时之先。元宝的内测版本今年初就出来了,在这个过程中迭代了近40个版本,直到它变成现在的状态。当然元宝现在可能还会有小失误,但整体的准确率已经很高了。我们觉得AI大模型是一条很长的雪道。此时急于一时,没有太大的意义。
王昕:我们只是还没有把文生视频功能包装成独立的应用或者放到元宝里澳门新葡萄新京6663澳门新葡萄新京6663。但文生视频的能力我们早就开发出来了,我们只是想找到一个更好的用户切入口。
视频可以有两个落地方向。一个是专业场景下的创作,赋能专业人士或设计师、新媒体、自媒体等的创作过程;第二是对普通用户来说,大模型可以像PS图片功能一样,未来通过视频风格化做一些泛娱乐尝试。
王昕:放眼C端AI产品,整个行业都处在非常早期的阶段。ToB(面向企业用户)侧的商业化相对而言走得更靠前一点,因为它确实在解决生产端的问题,比如AI作图会提升美工的生产效率。