自元宇宙后,总会有一波又一波高科技进展冲进人们的视野。
众所周知自2024年开年以来,最火的高科技话题莫过于OpenAI推出的AI视频生成模型Sora,由于能够通过文本提示生成逼真且富有想象力的视频而火爆出圈。
而本文则是基于此引发思考,既然已经有大模型实现逼真的视频创作,那么在AI写作领域呢?未来AI在小说创作上的发展会达到什么程度?
自元宇宙后,总会有一波又一波高科技进展冲进人们的视野。
众所周知自2024年开年以来,最火的高科技话题莫过于OpenAI推出的AI视频生成模型Sora,由于能够通过文本提示生成逼真且富有想象力的视频而火爆出圈。
而本文则是基于此引发思考,既然已经有大模型实现逼真的视频创作,那么在AI写作领域呢?未来AI在小说创作上的发展会达到什么程度?
科技的日新月异总是让人战栗。还没出正月,就又被科技圈贴脸开大了。
先是英伟达推出Chat With RTX,将每个人的电脑变成本地化系统大模型,紧接着谷歌AI推出Gemni1.5版本,最高支持100万tokens的上下文。
如果说这两件事只是在业界内部掀起腥风血雨,离普通人生活还远着呢。
那已经有封神作品Chatgpt的OpenAI就是奔着“干掉所有人”来的,和Gemni1.5同天发布的文字生成视频大模型Sora,只需输入文字,就可以生成一段长达60秒的高清视频。不仅让马斯克感叹:“gg humans。”还让周鸿祎放话:“AGI(通用人工智能)的实现将从10年缩短到1年。”
影视工作者们又开始新一轮的失业焦虑,而上一次集体焦虑的是去年年初面对Chatgpt的文字工作者。
继续阅读这几天,AI行业,乃至整个互联网行业,包括投资界都在谈论一件事:OpenAI发布的文生视频模型Sora,这一石子究竟能激起多少层浪。
AI生成视频并不是一个新生赛道,所以很多人疑惑,在铺天盖地的新闻之下,Sora到底取得了多大的进步。
我们将时间拉回到一年前,“AI视频大模型”此时已经拥有足够的关注度。2023年2月,Runway发布第一代产品Gen-1,让客户可以在iOS上,通过文本转化成视频格式。3月份,Gen-2发布,人们可以插手后期剪辑优化视频。网络热门作品《流浪地球3预告片》正是基于Gen-2创作。作者“数字生命卡兹克”借MidJourney生成分镜图,然后使用Gen-2扩散为4秒的视频片段,最终合成一条以假乱真的预告片。
继续阅读一年前AI智能涌现的场景又重现。
2024开年,Sora就引发了全球科技圈的集体躁动。
当地时间2月15日,OpenAI发布最新视频生成模型Sora。根据OpenAI描述,Sora可根据客户输入的简短文本指令,生成长达1分钟的高清视频,并创建具有多个角色、特定类型的运动以及准确的主题和背景细节的复杂场景。
让全球受众感到惊叹的,是Sora生成视频中极具真实感的画面呈现,甚至还带着些许电影质感。
在OpenAI发布的一系列不同主题视频中,不论是戴墨镜女子走在东京街头的场景,或是动画人物的细节塑造,虽然这些内容完全由AI生成,但其中细节呈现出的画面真实感已经进入一个全新维度。这让不少网友感叹,现实的边界正在数字世界中变得愈发模糊。正如OpenAI 在Sora技术报告的标题中赫然写道的,“ Sora 这类视频生成模型是「世界的模拟器」”。
对中国出海企业来说,AI技术推动下内容生产力的大幅提升,也将进一步助力产业升级,并加速企业的全球化步伐。而TikTok平台上,已经开始充斥各种由AI生成的视频疯狂吸粉。
继续阅读最近,国内的大公司在AI赛道上被Sora抢占了风头。
在2024年2月初,此前在大模型领域保持低调的字节跳动终于有了新动作,上线了“Coze扣子”AI Bot开发平台,据Coze官方介绍,Coze可以让客户快速创建各种由AI提供支持的问答Bot,且可以将Bot发布到各种应用程序,从而促进与这些应用程序上的客户的动态交互。
简单来说,Coze的特点是,可以让客户创建个人定制版Bot,实现“0代码”开发。
这倒也并非创新之举。早在2023年末,OpenAI发布的GPTs也是旨在“每个人都可以定制自己的ChatGPT,从而让GPT成为一个家族。”但对于字节跳动而言,这多少算个大动作,毕竟此前它在大模型领域沉寂已久。
不过,还未等Coze掀起太大的水花,OpenAI发布的Sora直接“王炸”,抢走风头,引发热议。
继续阅读2月16日,OpenAI发布了文生视频模型Sora,引起众多科技大咖与网友的热烈讨论。
之前许多AI工具生成视频时,主要问题出现在视频时长较短,且人物前后形象不一致等方面。而根据OpenAI介绍,Sora最大的优势是可以创建长达60秒的视频,其中包含高度详细的场景、复杂的摄像机运动角度,以及具有生动情感的多个角色。
简单来说,Sora能够更好地理解自然语言描述,也能进一步理解和模拟现实世界。
例如输入提示词:一个时髦的女人走在东京的街道上,到处都是温暖的霓虹灯光和充满活力的城市标志。她身穿黑色皮夹克、红色长裙、黑色靴子,背着一个黑色钱包。她戴着墨镜,涂着红色口红,自信而随意地走路。街道潮湿而反光,营造出五颜六色的灯光的镜面效果,许多行人走来走去。
继续阅读前有《我们一起摇太阳》《红毯先生》等四部影片宣布撤档,让春节档开启“撤档元年”,后有人工智能(AI)巨头OpenAI发布首个文生视频模型Sora,迎来AI视频的“GPT时刻”。这个龙年春节,奏响了独属于影视从业者的“冰与火之歌”。
通过Sora生成的视频,能看到主角、背景人物,都展现了极强的一致性,可以支持60秒一镜到底,并包含高细致背景、多角度镜头,以及富有情感的多个角色……即意味着,只需输入一段文字描述,或许每个使用Sora技术的普通人,不用亲身上阵痛苦减肥也能当上如贾玲这样的“大导演”。
上一次能如此快速引爆网络关注的还是在2022年11月推出的ChatGPT,而如今,ChatGPT不仅引领了全球大模型的蓬勃发展,也开始在文本等相关行业展现其强大的生产力。作为今年的开年“王炸”,Sora自然被外界广泛期待着可以承接起ChatGPT的衣钵,改写视频等产业的发展。
不过,目前60秒的生成视频还撑不起一部电影,真想实现自己的“导演梦”,还得让技术“再飞一会儿”。
继续阅读OpenAI的文生视频(text-to-video)AI模型Sora已经发布,并且引发了如洪水一般的新闻报道和评论。我不是AI技术专家,相信大家也早已通过其他渠道了解了Sora的技术细节。我只是想从内容创作者的角度谈一谈:Sora会对视频内容(包括短视频、中长视频和工业化影视内容)产生什么样的影响?
在我的朋友圈里,大家的观点是复杂的——有些人觉得Sora要革影视行业的命,甚至把视频内容带入“零基础创作”时代;有些人则认为Sora的实用价值还值得怀疑,尤其是不具备创作者所必须的“灵魂”。其实,上述观点都有道理,关键看怎么定义“内容创作”。回顾历史,我们会发现,互联网发展的历程就是内容创作不断重新洗牌的历程,各种体裁、各种主题、各种工业标准的内容一直在此消彼长,“变”是常态,“不变”才不正常。AIGC的深入发展(包括但不限于Sora),将促使洗牌过程向更有利于多样性的方向发展。我们不妨使用一个高度简化的分析模型,将互联网原生内容创作者的能力划分为两个方向。
热点敏感性,也就是追逐热点、热梗的能力。毫无疑问,在任何一个时间点,社交媒体的大部分流量集中于极少数热点题材。能否把握热点题材,决定了创作者的短期爆发力,用更时髦的话讲就是“出圈能力”。
内容调性,也就是内容的特殊性、不可复制性。有些创作者的内容,让人过目不忘,带着鲜明的个性烙印,任何竞争对手无法模仿。是否具备足够的、不可替代的调性,决定了创作者的长跑能力,或曰“可持续性”“粉丝黏性”。
强大的创作者无疑应该在两项能力上都获得高分,从而达到“既有爆发力又有长跑能力”的全能性,这是成为头部创作者的最高效的途径。2017-18年的抖音、2019-20年的B站都曾经涌现出一批这样的创作者,左手抓热点、右手深挖内容调性,从而在一夜之间跃居“全网顶流”之列(具体的例子就不用举了)。这样的幸运儿不多见,但是每隔一段时间就会出现一些,他们是其他内容创作者梦寐以求的标杆。
如果一位创作者不具备抓热点的能力(或者不乐意这么做),那么他的最佳发展方向就是做一个优质垂类内容方,吸引符合自身调性的粉丝,依靠粉丝的口碑效应实现“慢热出圈”。这条道路最典型的例子莫过于罗翔:在多年的司法考试授课过程中,他以深入浅出和幽默风趣的调性逐渐积累了大批“自来粉”,最终依靠粉丝的自发传播实现了“出圈”。严格地说,多年前的罗永浩也算得上一个。一般而言,只要坚持足够长的时间,垂类内容方总归能迎来量变到质变的时刻,但是大部分人往往坚持不下去。
与此相对立的则是那些只会抓热点、不具备调性的创作者,他们的生存之道就是“下手快”,依靠千方百计地“蹭热点”乃至模仿抄袭,尽快完成“出圈”。这种创作者的生命周期一般很短,在瞬时爆发之后就陷入了沉寂,做的是“过把瘾就死”的短线生意。尤其是在短视频领域,MCN等专业机构经常会批量孵化此类账号,希望其中极少数能爆红,至于那些未能爆红的则沦为“炮灰”。
很多客户会哀叹:“互联网社交媒体充斥着快餐内容,短视频、直播更是集快餐内容之大成,完全没有让人静下心来体验的干货!”可是这样的哀叹并不正确。或许网生内容的绝大部分确实是毫无调性和深度的“炮灰”,就像一瓶酒的大部分成分是水,那我们也不能因此得出“酒就是水”的结论。事实上,只有在社交媒体时代,垂直、小众内容才第一次获得了稳定的输出渠道,从而赢得了被更多人看见的可能性。数以万计的“中腰部”垂类创作者,到了移动互联网时代才真正走上内容创作道路。如果一定要在“以前的时代”和“社交媒体时代”之间做出选择,我相信,绝大部分创作者会选择后者而非前者。
那么问题来了:Sora的诞生(及其掀起的生成式AI持续进化的浪潮),会更有利于上面哪一类创作者呢?我觉得答案非常明显——AIGC会有利于那些以内容调性取胜、“慢热出圈”的垂类内容方,不利于那些以抓热点取胜、“昙花一现”的跟风内容方。因为在AIGC时代,“抓热点”的门槛将越来越低,从而不再是内容方的一项核心竞争力。所以,“内容调性”的重要性就进一步攀升了,甚至可能成为取胜的唯一一张王牌。
不要误会,无论到什么时候,“热点话题”总是会此起彼伏地产生,也需要有创作者覆盖。然而,在比拼速度方面,人类创作者无论怎么努力也比不过AI。在文本新闻领域,AI的速度优势已经明显体现出来了:早在ChatGPT诞生之前,从财经到体育,从娱乐八卦到社会新闻,大量的“突发性事件”在第一时间的报道就是由“AI写手”自动撰写的;在ChatGPT大范围投入使用之后,几乎所有的突发事件报道都可以由AI进行了。
平时炒股的人可能对此有更深的体会——打开任何一个股票信息软件,无论是突发的财经新闻还是财报的即时解读,由AI撰写的比例均呈不断上升的态势;专业分析师和评论员正在退出这些“比拼手速”的即时信息工作,把精力集中到需要高度逻辑分析能力的深度解读上。
Sora的诞生,意味着上述趋势正式蔓延到了视频领域。假以时日,上述趋势会延伸到一切体裁、一切类型的内容上:对于热点话题的“时效性覆盖”将主要是AI的任务,比拼的主要是AIGC的效率,很难有人玩出与众不同的花样。目前在国内,已经有电商服务机构向带货主播推出“AI根据热梗自动撰写视频脚本”的服务,哪怕主播对这个热梗毫不了解,也可以依靠AIGC跟上潮流。可以想象,今后对热点话题的竞争将趋于高度同质化;经济学原理告诉我们,高度同质化的市场总是会走向供大于求,从而导致“抓热点”性质的内容严重过剩,以此为核心竞争力的内容方大部分将被淘汰出局。
而对那些以“调性”为核心竞争力的内容方而言,AIGC却可以成为一种强大的新武器。互联网客户仍然有追逐热点的天性,不过他们今后更需要的不是时效性内容,而是有特色的演绎或者有深度的解读。足球爱好者对此肯定深有体会:在资讯匮乏的年代,大家对足球媒体的首要诉求是快速全面的新闻覆盖;到了资讯极端发达的今天,新闻覆盖早已泛滥,大家的诉求转移到了对赛事的深度分析,以及带有互动性、趣味性的节目上面。优质的垂类创作者完全可以与AI达成分工:前者负责有调性的部分,即所谓“灵光一闪”;后者负责不需要调性的部分,即重复劳动——按照内容产业的黑话,可以称之为“行活儿”。
AI是一种工具,一种由人类创造、帮助人类解决问题的技术手段。从目前的形势看,只要AI不产生自我意识,它就不会具备所谓“原创性”,而仅仅是对人类现有知识的收集和整理——即使ChatGPT这样高级的生成式AI也不例外。OpenAI已经公布了Sora的技术细节,可以看到,其技术路线继承了此前公开的DALL-E文生图模型,虽然有一定程度的创新,但并非颠覆性的。显然,至少在当前的环境下,Sora不太可能产生真正的“原创性”,其产生视频的效率和感染力仍然高度依赖于个人客户的“调教”。
所以,与此前的一切生成式AI大模型一样,Sora在内容创作中的角色更接近MOBA游戏中的辅助:帮助C位更好地发挥自己的特点,让C位心无旁骛地输出,而不是自己代替C位去输出。强大的C位玩家借助强大的辅助可以如虎添翼,而不合格的C位玩家有了强大的辅助也很难翻盘。就以刚提到的“AI根据热梗自动撰写视频脚本”功能来说,有调性的创作者可以在此基础上进行修改,使之符合自己的调性,事半功倍地创作出优质内容;缺乏调性的创作者恐怕只能用它生产千篇一律的“垃圾”。
至此,我们可以得出一个结论——内容产业“强者恒强”的趋势,在AIGC时代会持续下去,只是其含义更加复杂,超过了“马太效应”的范畴:头部内容方当然会继续强大、继续享受时代的红利,但具备强大调性的垂类内容方也能享受时代的红利;对于这两者而言,未来二十年将是最好的时代。对于其他内容方而言,却将迎来最坏的时代。Sora再次确认了上面的趋势。
当然,在AI技术日新月异的今天,一切变化都可能发生,一切梦想或噩梦都有可能成真。如果经过一段时间之后,本文的观点被证伪了(或者部分证伪),那也是再正常不过的事情。能够生活在一个AIGC觉醒的年代,无论作为旁观者还是参与者,我们都是幸福的。重要的是对未来做出力所能及的思考和分析,至于其对错则不是特别重要。
虽然Sora目前在内测阶段,都还不能用呢,但已经有一大堆人卖课卖培训了。不得不佩服这些做培训的,他们的眼光永远都是超前的。
人家官方都还用不了呢,大佬们就能出教程了?据说已经卖了2w多份,一天时间200W到手。下面的收费课程不知道大家是否看过,这些都是假假假!
从公开的宣传海报中,我们可以看到这些课程主要针对的是内容创作者、广告营销从业者、教育工作者等人群。课程内容涵盖了Sora专属词库、专属提示词教程以及30个专用提示词技巧等方面。
目前AI相关的课程从99-999的价格层出不穷,特别是在国内,如此简单的信息差就能收割一大批人。动动脑子吧,就连chatgpt现在都不对全亚洲国家开放,国内使用的都是抄袭版本,sora怎么可能这么快就会有使用教程呢,就算有教程,没有使用入口又怎么办?
我感觉Sora也和ChatGpt一样,能直接变现的还是少数。那些赚第一桶金的都是教更多人怎么用,卖培训课的,俗称割韭菜。
其实很多人,花几百几千买了一个课程,实际上也没啥用,80%的人都不会去看,反而给自己的生活添堵,如果你真有这个决定,有很多免费视频都足够你学的了,并能在让你这个领域成为小有名气的专家了。
Sora现在能获取的可信度较高的只有官方博客上的内容,以及官方提供的生成视频案例。别被割韭菜了!
扩展阅读:2024年2月16日,全球领先AGI创企OpenAI的最新文生视频大模型“Sora”悄然亮相。虽然未经提前预热,但Sora很快成为科技圈的重磅热点。