自从春节以来,我一直在准备一本关于人工智能的新书,对AI大模型及其应用关注的比较多。从OpenAI到Anthropic、Mistral,这些价值数百亿美元的AI大模型创业公司,再次证明了“科学技术是第一生产力”这个不朽的论断。
最近正在举行的英伟达GTC,每天都会刷新人们对AI技术进步的预期,其每一场演讲都在我的朋友圈引发了数以百计的转发和评论。不止一个人感叹说,GTC这样的开发者大会,让人更加深刻地意识到了国内AI研究与国际先进水平的差距,“热闹是别人的,我们什么都没有”。
真的是这样吗?早在一年多以前,我跟AI技术界和投资界的几位朋友对话,他们一致认为:中国生成式AI的突破还是要从应用层入手,因为中国公司最擅长的就是基于海量客户、复杂的使用场景去做应用。从互联网到智能手机,从To C到To B,历史一再证明了这一点。
过去一年中国AI应用的发展史也正在证明这一点:根据QuestMobile的统计,截止2024年初,国内AIGC应用的客户数(加总去重)已经突破5000万,而且仍处于井喷式增长当中。上述数字还不包括带有AIGC功能的综合性应用。
就在GTC进行的同时,我注意到了一条新闻:故宫博物院与钉钉签署了战略合作协议。钉钉将基于其钉钉宜搭、智能会议软硬一体、知识库和AI大模型等能力,与故宫博物院在行政办公提效、数字化升级、AI能力共建、青少年文教等领域展开深入合作。这条新闻本身可能不算特别大的事,很容易被忽视。但是,结合过去一年多钉钉的各项举措,以及近期的一系列动作,我们可以清晰地看到它将以AI为代表的先进技术投入实用的决心。对于整个中国生成式AI的发展而言,它的探索都很有指导意义。
2023年4月,也就是整整11个月以前,钉钉接入阿里自研大模型通义千问,宣布全面智能化,“所有产品都要用大模型重塑一遍”——在当时发出过类似豪言壮语的公司很多,但是钉钉的动作之快,确实远远超过了包括我在内的所有人的预期:
当年5月底,钉钉斜杠(现在的钉钉AI助理的前身)开始内测;
8月下旬,钉钉已有17条产品线、55个场景全面接入大模型,还对外开放了智能化底座AI PaaS。此时距离“用大模型把钉钉重做一遍”的官宣,只过去了120多天。
当年11月,在超过50万家企业内测后,钉钉AI魔法棒正式上线,所有功能向客户开放测试。这是国内首个全面开放AI的国民级工作应用。
今年1月,钉钉7.5推出了AI助理,每个人、每家企业都可以定制个性化、专属的AI超级助理。同一时间,钉钉个人版AI也全量上线了。
在快速扩张应用范围的同时,钉钉对于生成式AI的战略目标也已经十分明显:成为一个低门槛、高频、开放的AI Agent(AI助理)平台。这符合当前全球人工智能发展的方向,也是OpenAI、微软、谷歌、Meta等全球人工智能巨头都想走的道路。
虽然我的日常工作不会经常用到钉钉,但是就在昨天下午,我饶有兴味地试用了半天钉钉AI助理。让我印象最深刻的有两点:第一是它的易用性,入口非常好找,就在主界面右上方的“魔法棒”;其内部提示和帮助功能相当发达,哪怕从来没有接触过生成式AI的人也很容易上手。
第二是它的个性化潜力,任何人都可以自定义或者根据公开模板,创造符合自己使用习惯和需求的AI助理——例如“周报生成器”“公文笔杆”,乃至“年会黑话不能停”,等等等等。当然,钉钉AI助理并不完美,当我提出一些比较复杂的要求时,它会经常承认自己的能力有限。不过我仍然认为,它具备极强的提高工作效率的潜力,代表了生成式AI成为一种生产力工具的正确路径。
应该承认,我国在AI大模型的基础研发上,与国际先进水平(尤其是OpenAI)的差距不是一朝一夕所能弥补的。但是正如上文提到,中国互联网和科技行业的特点,就是利用海量客户和复杂应用场景,在应用端打开突破口。
在生产力领域,谁能比钉钉更合适打开突破口呢?超过7亿客户、数以百万计的组织,每天都在产生各种各样的应用需求、沉淀各种数据和知识。包括钉钉AI助理自身,就是基于与70万家企业共创过程中了解到的真实需求,而被开发出来并落地的。这种复杂、真实、海量的需求,是AI大模型落地最佳的试炼场,没有之一。
记得不久前,我跟几位券商研究所的小伙伴喝茶聊天,对方感叹:AI大模型对分析师最大的帮助,就是不用再专门花时间做会议纪要了——无论是语音还是速记内容,只要扔给大模型,很快就能返回一篇条理清楚、详略得当、颇具可读性的纪要。就拿正在举行的英伟达GTC来说,每天的议程又多又深奥,几乎不可能从头到尾观看,通过AI总结是一种事半功倍的学习方式。在钉钉当中,AI助理不是孤立的,而是与企业工作流高度结合的。就拿上文提到的会议纪要来说:
你可以在钉钉会议中实时生成纪要,也可以将钉钉文档中的速记内容发到AI助理对话框,整理成更适合传播的纪要;
你可以将AI助理总结的纪要随手转发到联系人或工作群里,或通过邮件方式转发;
你还可以实时调用钉钉内部的各种工具、插件,对这份纪要进行进一步的处理,例如配图和格式修改等;
如果需要对纪要进行讨论,为你所在组织生成会议日程也是举手之劳,会议本身也可以通过钉钉举行;
如果你的工作经常涉及总结文件或会议速记,可以创建一个专门做这项工作的AI助理,把你偏好的格式、文风都教给他,今后就更方便了。
早在AI大模型浪潮到来之前,钉钉就已建立了一个具备丰富的API、涵盖各类场景、与钉钉自身功能深度融合的开放平台,能够为各类组织提供大量SaaS应用和行业解决方案。而AI助理可以成为这个平台最具活力的一部分,作为“中枢”把各项功能和场景串联起来。在基础设施方面,阿里云可以为钉钉的AI体系提供支撑保障,就像微软Azure、亚马逊AWS、谷歌GCP在海外的各类大模型生态中所扮演的角色一样。“云钉一体”的模式,在AI大模型应用方面的意义是举足轻重的。
让我尤其惊讶的是,钉钉AI助理上线才两个多月,但是功能迭代极快,已经新增了图片理解等多模态能力,对“工作流”的处理能力,以及支持低代码应用一键生成AI助理的功能,等等。在AI技术日新月异的时代,应用产品的快速迭代是很重要的,这一点只有通过研发、产品、运营各部门高效率的通力合作才能实现。
附带说一句,刚才我还在饶有兴味地尝试让钉钉AI助理,主题是AI技术界著名的“无限只猴子理论”:让无限只猴子坐在无限台打字机前面,花费足够长的时间,总能打出莎士比亚全集;在生成式AI领域,这个理论一般用来形容大模型训练的“大力出奇迹”。钉钉生成了很多张图片,下面是其中我比较喜欢的:
图片的质量还不错,不过其中只有一只猴子;我尝试了多次,最多也只能出现三只猴子。这可能是因为大模型尚无法理解“无限”的定义,也可能是生成猴子图像消耗的算力资源太大。无论如何,这张图片作为书籍插图应该是够用的,至于到底能不能用上,还得看出版社编辑的决定。
上面讨论的都是AI助理,然而钉钉的技术领先性并不局限于AI助理。就在今年2月4日,苹果VisionPro正式开售当天,钉钉原生应用就首批加入了Vision Pro应用商店,客户可以下载体验XR版本的DingTalk应用,包括聊天、会议、直播等功能。根据元宇宙概念最大的鼓吹者扎克伯格此前的演讲,“元宇宙”的一个重要功能是远程办公,以360度角沉浸式的远程会议取代单调的视频或音频会议,从而让人类的专业工作彻底摆脱地理位置的束缚。
不管扎克伯格的上述预测对不对,钉钉在这个方向的探索已经展开了。XR与AI的结合,也是一个值得期待的方向——AI强大的生成和渲染能力,可以为XR创造足够丰富的内容,使得“元宇宙”真正成为一个栩栩如生、包罗万象的世界;当然,这个世界应该还需要经过很长、很长时间才会降临。
附带说一句,可能很多人注意到了,从今年3月初开始,钉钉与微信生态之间的壁垒被打通了:只需要将钉钉会议链接分享给微信好友,对方无需下载钉钉客户端,即可在微信内加入钉钉会议。接下来,如果微信小程序可以发起钉钉会议甚至互相跳转,也不是不可能的。现在是互联网平台之间从“造墙”转向“拆墙”的时代,钉钉与微信的打通,对双方数以亿计的客户都只会有好处。
互联网大厂之间的“拆墙”,也意味着今后竞争的重点将更加纯粹,聚焦于技术进步及其应用。能够较快较好地让客户享受到先进技术好处的互联网应用,在未来漫长的时间里会更具竞争力。从这个角度讲,钉钉在AI大模型等科技领域的探索是正确的、符合行业长期发展方向的,希望它能够坚持下去。
来源:互联网怪盗团
互联网竞争的模式越来越趋向于技术上的竞争和 改革,更注重用户的体验感。
对于钉钉还不是很熟悉,只知道可以考勤用,哈哈