24小时之内,人类生产力迎来颠覆式提升。
北京时间2月16日,美国谷歌公司推出人工智能模型“双子座”(Gemini) 的迭代版本Gemini 1.5 Pro,信息处理能力显著飞升。此时,距离Gemini首次发布仅过去一个半月。
然而,谷歌的风头迅速被美国人工智能公司“开放人工智能研究中心”(OpenAI)抢去。就在同一天,OpenAI发布首个文本转视频模型Sora,可根据用户的提示词生成长达60秒的视频,效果足以乱真。
2月19日,也就是龙年的首个交易日,AI板块全线大涨,Sora概念大涨16.17%领跑两市。
“如果说ChatGPT模拟了人类的思维能力,Sora则是对整个物理世界的模拟。”
Sora生成视频截图
OpenAI的目标是,实现通用人工智能(Artificial General Intelligence ,AGI)。在其公司网页上,OpenAI预期,十年内AGI会被实现。
而在Sora推出的当天,360集团创始人、董事长周鸿祎表示,这意味着AGI实现将从十年缩短到一两年。
人工智能对人类社会引发的新一轮技术冲击波刚刚开始。
有观点认为,2024年将会进入大模型应用元年。
根据IDC的预测,未来五年内,AIGC(生成式AI)将给营销、软件测试等行业带来巨大影响。到2026年,生成式AI将承担42%的传统营销琐碎任务。到2028年,基于生成式AI的工具将能够编写80%的软件测试工作。而到2027年,G20组织中将有40%的现有工作角色因采用生成式AI而被重新定义或淘汰。
一年之前,也是在中国新年期间,ChatGPT进入大众视野,显示出在自然语言交互领域的重大突破。一年之后,Sora则在AI视频领域一举登上行业巅峰。
短短一年间,人工智能的成果此起彼伏。在AI带来飞速变革的时代,必须握紧AI的缰绳,稍不留神,就会被甩下,无论是国家,还是个人。
握紧AI的缰绳,还意味着,这头未知猛兽的命运要牢牢握在人类手里,不能脱缰。
模型加速迭代
在OpenAI的Sora之前, Runway、Pika等文生视频模型已经掀起过一波AI视频应用热潮。
Sora的横空出世之所以还能引起如此大的震撼,原因有三。
首先是时长。Pika仅支持生成一段3秒的视频,Runway公测版本视频时长仅为4秒,网页版最长也仅支持18秒的视频生成,而Sora可生成长达一分钟的视频。
其次是多角度。得益于更长的生成视频时长,Sora可以实现“运镜”,即在一段视频中围绕同一主体实现远景、中景、近景、特写等不同镜头的切换。而Pika、Runway等只能生成较为单一的镜头语言。
第三是理解真实世界的能力。Sora对于光影反射、运动方式、镜头移动等细节处理得十分优秀,极大地提升了真实感。
“Sora是能够理解和模拟真实世界的模型基础,我们相信这样的能力是通往通用人工智能的重要里程碑。”OpenAI称。
目前该功能仅对安全人员开放,以测试、评估该模型在关键领域的风险,还将向特定的艺术家、设计师、电影制作人员提供访问权限。
周鸿祎表示,这次OpenAI利用它的大语言模型优势,让Sora实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是真实的,才能跳出2D的范围模拟真实的物理世界。
“(在)Sora产生的视频里,它能像人一样理解坦克是有巨大冲击力的,坦克能撞毁汽车,而不会出现汽车撞毁坦克这样的情况。”
“一旦人工智能接上摄像头,把所有的电影都看一遍,把YouTube和TikTok上的视频都看一遍,对世界的理解将远远超过文字学习,一幅图胜过千言万语,而视频传递的信息量又远远超过一幅图,这离AGI真的就不远了,不是10年20年的问题,可能一两年很快就可以实现。”
周鸿祎认为,有强劲的大模型做底子,基于对人类语言的理解,对人类知识和世界模型的了解,再叠加很多其他的技术,就可以创造各个领域的超级工具。比如生物医学,蛋白质和基因研究,包括物理、化学、数学的学科研究上,大模型都会发挥作用。
谷歌在同一天推出的全新Gemini 1.5 Pro AI模型,颠覆性同样不容忽视。
Gemini 1.5 Pro主要升级了两点:其一是超大的信息处理能力。经过扩展后,这一多模态大模型可一次处理大量的信息——包括长达1小时的视频、11小时的音频、超过3万行代码或超过70万字的代码库,它都可以一次性地阅读处理完。
目前,ChatGPT的上下文窗口是128K,Claude 2.1是200K,而Gemini 1.5 Pro把这个门槛直接拉到了10M。
更大的上下文窗口意味着,人工智能可以“记住”更多的信息,可以处理更长、更复杂、更多样的文本,从而提高其分析、回答和生成的质量和效率。
其二,它还能对大量的多模态信息进行复杂的推理。也就是能同时处理文本、图像、音频、视频等信息。举个例子,Gemini 1.5 Pro可以从一部长达44分钟的老电影中,准确分析各种情节点和事件,甚至推理出电影中容易被忽略的小细节。
OpenAI虽然风头无两,但这个赛场显然不是一家公司的独角戏。全球超级科技巨头们都在生成式AI上投入重注。
科技巨头鏖战
当地时间2月11日,一年一度的美国职业橄榄球联盟(NFL)超级碗赛事——“美国春晚”正式到来。
微软在超级碗发布广告,广告的主角是其人工智能助手Copilot,称Copilot是可以帮助年轻人实现创业梦想的工具。这是微软四年来首次在超级碗上投放广告。这一举动无疑突显了微软在人工智能领域的重视和投入。
当地时间2月15日,微软宣布,未来两年将在德国投资32亿欧元(合34.4亿美元),主要用于发展人工智能。这是过去40年来微软在德国最大的一笔投资,旨在将该公司在德国的AI和数据中心基础设施的容量提高一倍,以及培养AI领域的人才。此前,微软在印度一些小城市也宣布了类似的人才培养计划。
作为OpenAI 的最大股东,微软向其投资了约130亿美元,持有其49%的股份。
在最新的财报电话会上,微软首席执行官纳德拉表示,我们已经从谈论人工智能转向大规模应用人工智能。
从最直观的财务数据来看,微软的人工智能战略已初见成效。通过将人工智能集成到Azure云计算服务中,微软基于云的收入在最近一个季度实现了24%的猛增,达到337亿美元。微软的市值突破3万亿美元,超过苹果公司,成为全球市值最高的上市公司。
苹果将全球市值最高的桂冠拱手让给微软的背后,是其在AI上迟迟没有动作。
有消息称,苹果公司准备在iOS平台编程软件Xcode的下一次大版本更新中加入AI功能,对标微软旗下的GitHub Copilot,它可以基于自然语言请求生成代码,并将代码从一种编程语言转换为另一种编程语言。
此外,据彭博社报道,苹果将在今年6月推出带有AI功能的iOS 18。苹果将其称为“iPhone十六年历史上最重大的更新之一”。开发者在苹果最新发布的iOS 17.4开发者预览版Beta中发现了一些关于大语言模型技术的代码,表明苹果正在开发由大语言模型加持的新版Siri。
到底能拿出什么样的产品,今年6月举行的苹果全球开发者大会或将成为苹果的“生死局”。
在生成式AI的爆发和概念炒作下,2023年全年美股市值最高的“七巨头”(Magnificent Seven)——微软、苹果、英伟达、Alphabet、亚马逊、Meta、特斯拉——为标普500指数贡献了三分之二的涨幅。
本月初,美股“七巨头”的总市值达到了12.5万亿美元,是日本、法国和英国三国股市市值的总和。
抢夺芯片市场
作为AI崛起最大的受益者,凭借其生成式AI底层基础设施——算力芯片的绝对霸主身份,英伟达堪称近一年多来最耀眼的上市公司。
2023年,英伟达累计暴涨239%。2024年,涨势仍在持续,2月16日美股收盘,英伟达报726.13美元,今年累计上涨近50%,市值为1.79万亿美元,超越谷歌和亚马逊,位列全球第三。
目前,高盛、美银将英伟达的目标价上调至800美元,摩根士丹利将英伟达的目标价从603美元提高到了750美元。
2023年11月22日,英伟达发布了2024财年截至2023年10月的第三季度财报。财报显示,英伟达期内收入创下181.2亿美元的纪录,同比上涨206%;净利润92.43亿美元,同比上升1259%;毛利率为74%。
“从公司强劲的增长中可知,各行各业都在经历从通用计算到加速计算和生成式AI的平台转型。”英伟达创始人兼首席执行官黄仁勋表示。
英伟达将于2月21日美股盘后公布2024财年第四季度业绩。有分析师甚至认为,英伟达的财报将决定美股未来一段时间的命运。
英伟达并非高枕无忧。其最大的两个竞争对手英特尔和AMD正在加速追赶。
更为重要的是,英伟达的大客户们——科技巨头之间的一场新竞赛正在升温。他们正在构建自己的人工智能芯片,以摆脱对英伟达芯片的依赖。这场竞赛将成为科技行业的下一个重要战场。
2023年11月,微软正式推出了其自研的两款人工智能芯片:Maia 100和Cobalt 100。
今年2月,全球最大的社交媒体公司Meta对外证实,计划今年在其数据中心部署最新的自研定制芯片,并将与其他GPU芯片协调工作,助力其 AI 大模型发展。
GPU是发展人工智能的关键芯片。H100亮相于2022年3月22日,是英伟达设计的第九代数据中心GPU。自从2022年9月量产投入市场后,该芯片成为市场上最受欢迎的AI训练芯片之一。
数据显示,2023年,Meta和微软两家公司以15万块H100 GPU的购买量并列第一。
这依然不够。Meta首席执行官马克·扎克伯格表示,该公司计划在今年底前拥有大约35万颗英伟达H100处理器。再加上其他供应商,Meta将累计拥有60万颗H100的等效计算能力。
风头正劲的OpenAI也在探索制造自己的人工智能芯片。
2月9日,OpenAI CEO奥尔特曼表示,正在与包括阿联酋政府在内的潜在投资者进行洽谈,旨在提高全球芯片产能,扩大其支撑AI性能的能力,该项目可能需要筹集至多5万亿至7万亿美元资金。
“我们认为,世界对AI基础设施的需求,包括芯片制造能力、能源供给、数据中心等,已经远远超过了目前的建设计划。”
软银集团创始人孙正义也在打AI芯片市场的主意。
有消息称,孙正义正在寻求高达1000亿美元资金,打造一家能与英伟达竞争的芯片公司,专注于生产对AI至关重要的半导体。软银方面没有对此公开回应。
如果孙正义的计划得以实现,这将成为继ChatGPT问世以来,AI领域最大的一笔投资。
中国全力跟进
在中国,企业掀起“百模大战”,国产大模型频频亮相、加速迭代。百度、阿里、华为、科大讯飞、腾讯等企业积极布局大模型赛道,三大运营商也都推出了原创大模型产品。
截至2023年年底,我国累计发布了200多个人工智能大模型,其中有20多个大模型产品获批向公众提供服务。
Sora的出现,引发了国内业界人士的危机感。
周鸿祎认为,尽管国内大模型发展水平表面看已经接近GPT3.5,但实际上跟4.0比还有一年半的差距。从现在来看,OpenAI手上除了GPT5之外,可能还有一些“秘密武器”没有亮出来。“中国和美国的AI差距可能不但没有缩小,反而在加大”。
已经有企业公布最新的AI计划。
2月18日,Sora发布的两天后,OPPO和魅族两家企业宣布AI计划。OPPO CEO陈明永发表内部信称,2024年是AI手机元年。未来五年,AI对手机行业的影响,完全可以比肩当年智能手机替代功能机。OPPO成立AI中心,加速资源向AI集中。
魅族决定全力投入AI领域,停止新的传统智能手机项目,并将焦点转向“明日设备”。魅族表示,经过两年的精心准备,魅族已经具备了向AI领域全面转型的能力。
稍早之前,2月1日,字节跳动正式推出AI聊天机器人构建平台Coze的国内版——“扣子”。“扣子”可以让用户通过聊天,调用插件等方式,创建个人定制版Bot,实现“0代码”开发。2月7日,抖音CEO张楠宣布辞任。张楠透露,在过去一年已把多数精力倾斜到剪映相关业务上,并带队寻求在AI辅助创作上有所突破,即将推出一个AI生成图片和视频的产品。
人工智能将会成为驱动经济变革的重要力量。麦肯锡预计,到2030年生成式AI有望为全球经济贡献约7万亿美元的价值,中国则有望贡献其中约2万亿美元,将近全球总量的三分之一。
创新工场创始人兼CEO李开复认为,人工智能是一个“强者更强”的产业:数据越多,产品越好;产品越好,所能获得的数据就更多;数据更多,就更吸引人才;人才越多,产品就会更好。在这个良性循环里,中美两国目前已经汇聚了大量人才、市场份额以及能够调动的数据。
李开复此前曾表示,由ChatGPT等掀起的AI 2.0变革风潮,是绝对不能错过的一次革命,也是中国面临着一个巨大的平台式机会。
拉紧监管缰绳
当Sora将AI生成视频能力提升到近乎逼真的程度时, 也就意味着“眼见为实”的时代已不复存在。
世界经济论坛发布的《2024年全球风险报告》显示,人工智能生成的错误信息和虚假信息高居2024年全球风险之首。
尤其迫在眉睫的是,今年是全球大选之年,占全球GDP 60%的国家或地区将举行选举,包括英国、美国和印度等。就在1月,通过深度伪造炮制的“假冒拜登来电”就曾引起对人工智能干扰选举的担忧。
在Sora发布的同一日,近20家科技公司在慕尼黑安全会议举行之际签署联合声明,将在2024年共同打击干预选举的深度伪造技术和错误信息,这些公司包括微软、Meta、谷歌、亚马逊、IBM、Adobe、Arm、OpenAI以及社交媒体TikTok、X等。参与联署声明的公司同意通过评估模型风险、增强平台审核透明度、优化信息分发等方式降低这类信息的传播和影响。
在人工智能国家监管与立法的更高层面,中国、欧盟、美国都有各自的实践。
首先看欧盟。欧盟《人工智能法案》近期取得突破性进展。2月2日,欧盟27国代表投票一致支持《人工智能法案》文本,标志欧盟向立法监管人工智能迈出重要一步。
《人工智能法案》仍需要提交欧洲议会批准。如果获得批准,相关规则将分阶段实施,其中一些禁止性规则将在该法律通过六个月后生效,与通用人工智能模型相关的某些规则将从2025年起适用。
欧盟最早是在2021年提出AI立法,但随着2022年末ChatGPT上线,欧盟立法者又增加了针对大语言模型、AIGC领域的监管条文。
美国方面,2023年7月,美国白宫召集亚马逊、Anthropic、谷歌、Inflection、Meta、微软和OpenAI等人工智能公司作出一系列自愿承诺,包括同意对AI工具进行第三方安全测试,推出识别人工智能生成素材的水印系统等。
同年10月,拜登政府签发行政令《安全、可靠和可信开发和使用人工智能》,这是白宫有关生成式人工智能的首套监管规定。该行政命令建立在先前人工智能公司作出的自愿承诺的基础上,要求对美国国家安全、经济、公共健康或安全构成风险的人工智能系统的开发者在向公众发布之前,应该根据《国防生产法》与美国政府分享安全测试的结果。同时命令指示各机构制定测试标准,并解决相关的化学、生物、放射性、核和网络安全风险。
中国也已出台针对推荐算法、深度伪造等合成内容和生成式AI的一系列监管法规。2021年起,国家网信办联合六部门已出台《互联网信息服务算法推荐管理规定》《互联网信息服务深度合成管理规定》和《生成式人工智能服务管理暂行办法》等法律法规,对计算机合成内容进行管控。这些法规包含了禁止社交平台利用推荐算法设置价格歧视等,还规定人工智能开发商必须对人工智能生成的合成内容进行标注。其中2023年7月发布的《生成式人工智能服务管理暂行办法》是中国针对AIGC的首份监管文件,为飞速发展的AIGC技术提供政策支持。
生成式AI改变人类社会的历史进程才刚刚开始,也注定将出现更大的突破。我们要做的是,握紧缰绳,不被它甩下;抓紧缰绳,不让它脱缰。
(文章来源:国际金融报)