声网CEO赵斌:智能和高清正在推动实时互动体验进入全新时代
2023年10月25日 17:31
来源: 中国经营网
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈

  回顾2023年,AIGC(生成式人工智能)从爆火到渐趋理性,开始更多地落地各行业场景并产生潜在深远的影响,AI大模型驱动着各行业迎来新业务机会,AR、VR、XR等技术能力的迭代为实时互动在各个领域的应用提供了更多可能。在直播社交领域,弹幕玩法成为直播新风口,这些变化都影响着RTE(实时互动)行业的进化。

  10月24日,在声网和RTE开发者社区联合主办的RTE2023第九届实时互联网大会上,声网创始人兼CEO赵斌在接受《中国经营报》在内的媒体记者采访时表示,虚拟人+AIGC所创造的情感和情绪价值或将在未来解决社交供需不平衡的现状,并引领交互对象发生变化。另一层面,随着AIGC能力的进一步加强,越来越多的应用型开发将被AIGC替代,API(应用程序接口)+AI的形式将大幅提高应用开发效率。

  智能和高清正在推动实时互动体验进入全新时代,赵斌表示:“4K不仅仅只有分辨率一个纬度,光亮强度的动态范围、色彩的真实度、饱和度以及色彩渐变的细腻程度,都是真正超高清体验里不可或缺的一环。声网在RTE行业首次实现广播级4K超高清实时互动体验。”而广播级超高清可以带来更加逼真的视觉效果,高对比度和丰富的色彩表现可以使影像更加生动,细节更加清晰,并以此提升观影体验。

  大模型正在快速发展,但交互界面仍局限于文字聊天互动方式。赵斌提到,通过过去一年的投入和打磨,声网推出行业首创AIGC-RTC能力模块,可支持与任何大模型平台结合,实现更低延时、更自然、更沉浸的实时语音对话,为企业协作、社交 、直播、游戏等多种场景提供新玩法、新机会。

  AI如何赋能RTE未来

  AIGC被认为是当前的技术革命,它与RTE的深度结合,又将带来什么改变呢?Founders Space创始人兼CEO史蒂夫霍夫曼对记者表示:“人工智能将对许多领域产生影响,在AI赋能的RTE未来,我们将看到每个人都会拥有更加个性化的体验,更加动态的程序将随着图形、音频、视频的实时变化而变化,AI将为我们带来前所未有的连接方式。在更深层次上,AI还将为人类带来更高的生产力水平,带来动态的虚拟世界等,让我们感受到更多的沉浸式体验。”

  史蒂夫霍夫曼表示:“在AI和RTE技术的加持下,新的穿戴设备可能会进入市场,比如新的皮肤电子设备、感官增强设备等,它可以让我们听到人类听力范围之外的频率。此外,脑机接口也将读取我们的脑电波,从而帮助我们实现冥想或对其他设备的控制。”在工业RTE场景应用下,人们可以聚在一起,实时通过虚拟或真实工厂观看流水线运作、产品生产等。在AI陪伴场景中,人工智能伴侣这一概念将成为人们社交生活、娱乐、事业的一部分。

  为此,未来可能会有各种类型的伴侣应用以及新的实时接口方式出现,甚至会出现一套为RTE开发的全新硬件,这些都将大大改变RTE领域的发展前景。

  在一个科技无国界的世界里,人工智能、实时互动技术、生物技术、材料科学等技术创新力量构建了一个“数字包容”的世界。过去一年,联合国人口基金(UNFPA)与声网通过实时互动技术,为中国偏远地区的一万多名青少年提供了适龄的健康教育。联合国人口基金驻华代表处副代表兼负责人欧雯姗对记者表示,“人工智能和实时互动技术为那些仍在使用型号较老的多媒体设备的学校提供了量身定制的解决方案。它不仅优化了直播流的分辨率,还增强了在教学和学习过程中的音视频质量。学生和直播教师可以实现像传统课堂那样身临其境的教学质量和速度。”

  同时,欧雯姗宣布,联合国人口基金驻华代表处与声网及其他合作伙伴联合发起了“智享银龄”科技助老青年创新挑战赛。她表示,“我们希望激发青年人,特别是大学生和年轻毕业生,为代际数字包容贡献想法并做出积极行动。”

  AI技术的发展也为各行各业带来了用户体验改善和场景玩法创新。针对这一话题,引发了业内广泛的关注和讨论。

  谈到AI技术对业务发展的影响时,喜马拉雅首席科学家卢恒对记者表示,作为全国最大的有声内容平台,喜马拉雅从文本处理到音频内容生成的过程中都使用了大量的AI技术,目前,AIGC生成的音频内容日均播放量已超过250万小时。Soul APP技术副总裁张高政则表示,大模型的理解能力对于UGC(用户生成内容)平台及用户来说都非常有利,它不仅可以快速提升内容生产效率,还能降低内容生产门槛。

  AI时代实时互动何去何从

  AI时代已经来临,实时互动该何去何从?声网首席科学家、CTO钟声指出,回溯过去五年,最典型的事件就是(AI)大模型的突破,从2017年的Transformer,到如今的ChatGPT-4,人工智能的发展,让信息传播和消费智能化的趋势越来越明显,万事归于中心化AGI(通用人工智能)接管的趋势和威胁也越来越明显。大模型在带来发展机遇的同时,也带来了计算需求快速增长、算力受资源供给力限制、大模型数据资源不够、存储需求增长过快等问题。未来,我们除了要做负责任的AI之外,在端上和边缘上的分布式实时智能将成为价值公平分配的重要技术手段,也是减缓中心化AGI对人类威胁的有效途径,这也注定会成为一个新的技术发展趋势。

  钟声认为,AGI将走进实时互动,实现人人可分身,帮助在应用场景中复制名师、网红,甚至普通人也将通过AI分身丰富(人生)体验、缓解时间稀缺的瓶颈。此外,他预测,具备端边实时智能的高清实时互动能力将成新趋势和竞争焦点。

  钟声介绍称,实时高清需要许多端上实时AI,在Low Level Vision and Audio这一需求层面,声网的SDK 4.1.x, 4.2.x版本已经可以支持1080P/4K视频的例如超分、虚拟背景、感知编码、降噪、去回声等底层计算机视觉处理和高音质的计算机听觉处理能力。在High Level Vision and Audio层面,声网已经部分实现对物体、声音、场景的理解和重构能力,包括面捕、动捕、情感计算、物体识别和场景重建等,可以大力改善多种应用场景下的用户体验。

  不过,AI大模型的发展对各行业领域是机遇与挑战并存的。小红书音视频架构负责人陈靖向记者指出,对于很多公司而言,说清楚AI大模型项目的必要性是一个巨大挑战,很多项目并不像利用AI去做体验增强那样,能够跟用户留存及转化的一些指标建立关联。陈靖还提到,提高主播观看率的美颜美体功能可能是过去AI为实时互动领域贡献最大价值的场景,希望今后会看到更多新的尝试。

  商汤科技商务总监、数字文娱事业部副总裁李星冶则认为,目前能看到的挑战有两点:首先,在为许多C端流量产品提供服务时,算力、带宽、智力相关的弹性储备是一个很现实的挑战;其次,大模型开发厂商如何平衡投入以及预期收入之间的关系,也是一个挑战。

  声网首席运营官刘斌对记者表示,无论未来是挑战还是机遇,我们都应该在各自行业里去努力尝试。我们也期待,在大模型新的范式发展下,看到越来越多的场景落地及业务价值。

(文章来源:中国经营网)

文章来源:中国经营网 责任编辑:33
原标题:声网CEO赵斌:智能和高清正在推动实时互动体验进入全新时代
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500