“ChatGPT向左,文心一言向右”:同一条赛道上的两个方向,一个深耕技术,一个用心做产品,但是他们都会成功。
新闻连着看
- 3月14日,OpenAI发布GPT-4
- 比震惊世界的chatGPT(3.5)再次升级:创造力提升,视觉输入,更长的上下文,更强的推理能力。
- 3月16日,百度发布文心一言
- 现场演示的时候选择直接放录好的视频,而且采用邀请码的方式没有开放试用,被质疑能力不足(事实上也确实如此)
- 在开放的试用过程中,被用户发现文字理解有点呆(这个是预期内的,肯定会离chatgpt会有不小的距离)以及更为严重的生成图片时疑似用了国外的图片生成程序(现实是肯定用了国外的图源做训练和标记了,是否用的国外开源产品改的,还不确定)
- 3月24日,OpenAI发布ChatGPT Plugins
- 官方演示了Web浏览器,代码解释器,检索信息等方面的Demo
- 3月27日,百度闭门会议悄悄发布AI服务平台“文心千帆”
- 现场演示了:对话机器人,三分钟做ppt,数字人直播带货,订机票和酒店等操作。
现状
目前都认可的事实:
- ChatGPT的技术还是遥遥领先与世界上的其他竞争对手
- 百度的大语言模型文言一心已经做出来了,效果虽然赶不上ChatGPT,但至少在中文领域还是可以的(我是3月21日才开始试用文心一言的,并在当天将其接入了我的微信机器人群里)
各自的方向:
- 技术层面
- GPT在一步一步的疯狂往前探索,据说GPT-5已经在内部做安全测试了。AIGC技术这块目前是没有对手的
- 百度还在努力追赶,可能不远的将来能达到chatGPT初代的中文水平(GPT-3.5),一般预测在3-12个月内可以实现
- 产品层面
- OpenAI公司开始做Plugins,也就是说提供给第三方施展的空间,做一个生态圈,走的是用技术挣钱的方向
- 百度从文心千帆的闭门会议可以看到一个趋势,就是他自己把AIGC周边的产品都做了,准备往卖服务,用产品挣钱的方向走
- 形象点说
- GPT是技术大牛,开放它的能力,众多第三方开发者一起跟着它做产品。大家一起跟着吃肉喝汤。
- 文心一言的文心千帆则是直接面向了商家客户,来我这里有现成的产品,你用不,收点钱。
- 做为开发者,肯定支持GPT这种开放策略,事实上早在几个月前,各种周边的GPT衍生功能产品已经满天飞了,各路开发人员都在给它做各种补充功能:生成PPT,生成视频,翻译软件,pdf检索等等,而官方不断的开放和迭代GPT的能力,语音识别能力,图片输入能力等等。形成了比较好的良性互动
- 但是从百度的角度,技术上肯定追不上ChatGPT了,但是它可以在产品上下功夫,将开源社区众多开发者的主意,用自己的原生力量打磨出来,做出一个又一个实用且好用的商业化产品,也确实是个更好的选择。挣钱嘛,不寒碜。而且
- 1.国内短时间还没有哪家ai大语言模型技术能追上百度 。
- 2.挣完钱以后可以反哺技术,加快追赶的脚步。
- 3.这是一种很取巧但是实用的路子,百度文心千帆演示的产品中技术难度都不大,采用或者说揉合了开源的或国外现成的很多技术
- 4.这些产品网上的很多个人开发者都可以短时间完成开发比如:ai生成ppt,ai生成数字人,ai生成行程,但百度拥有的资源做出来的产品肯定会更加好用和精艳。
图:文心千帆企业试用用户:
接下来,我们从百度的闭门会议中发布的ai产品中看看它的技术背景
百度的AIGC产品:文心千帆
场景一:企业办公场景:3分钟制作PPT
- 和金山wps结合,几句话就可以生成一个精美的ppt,亮点是可以从公司网站上提取信息下来
- 这个技术难度不大,我在今年2月10号左右,也用chatgpt做了个类似的功能,但是实话说生成的ppt非常丑,远不如这个好看
- 所以该演示难度对百度来说几乎没有,但是功能非常有用
- 演示的视频如下:
场景二:电商服务场景:快速生成ai视频
- 一键生成文案,再用ai数字人技术生成直播视频
- 技术难度:中等,如果百度是完全自研的那么这个技术难度就有了(事实上应该不是)
- 开源的方案有,可以用微软的edgeTTS生成语音和字幕,用midjourney生成形象,用DID生成视频
- 有理由怀疑百度直接用了这些现成的方案(这也是各种数字人用的一整套技术),当然内心里我更希望更有出息一点,自己搞一套
- 演示的视频如下:
场景三:旅游服务场景:生成旅游规划并完成订单
场景四:金融投资场景:归纳业务评估生成投资建议
总结
- 百度的文心一言,技术上可以做到国内最优,且始终和国外的先进技术存在很大的落差。
- 百度的文心一言产品会在商业上产生很大的成功。尤其是toB业务
- 大语言模型AI,会极大的提高很多职业的工作效率,快跟上,别掉队。