艾瑞咨询:视频云场景应用愈来愈普遍,短视频、超高清视频和实时音视频成为需求风口视频云为行业提供技术支撑,AI赋能全链条,实现全民生产、全域应用,行业步入视频服务社会的新时代。
碎片化的消费模式、极致的观感需求、创新应用场景,让短视频、超高清视频和实时音视频成为需求风口。
视频云为行业提供技术支撑,AI赋能全链条,实现全民生产、全域应用,行业步入视频服务社会的新时代。
视频云渗透率最高的场景在互联网泛娱乐以及在线教育。云服务与产业互联网的结合不断加深,视频云厂商场景化、私有化能力加强,能更好地匹配传统行业的部署需求,在传媒、教育、平台电商化、协同办公等领域的应用也正慢慢的变多。
发展趋势:1)视频云技术将在视频处理和传输环节发力,实现技术极致化。除了精研软件算法,同时积极与硬件厂商合作,实现性能优化和成本下降。2)低代码开放模式持续在音视频行业渗透,向公司可以提供面向全场景的音视频互动一站式解决方案。3)高新视频新业态,让视频赋能千行百业的能力得到充分的发挥。
近年来,我国持续推进网络基础设施建设,以5G、数据中心、人工智能、物联网等为代表的信息数字化能力不断的提高。根据工信部数据,截至2020底,我国新建5G基站超60万个,全部已开通5G基站超过71.8万个,5G基础设施网络覆盖全国地级以上城市及重点县市。移动通信技术的发展不仅带来网速的提升,同时推动流量单位成本下降,“提速降费”让视频服务类App的用户量和活跃度持续不断的增加。艾瑞UserTracker监测多个方面数据显示,自2018年以来,视频服务App月总独立设备数和月使用时间虽偶有波动,但整体呈现稳步增长趋势。在各细致划分领域中,短视频以承载量大、内容多元兼趣味化、传播力强为优势,市场规模逐步扩大,同时带动了营销模式的改变,短视频慢慢的变成为新型的营销手段与分发渠道。
受消费习惯的影响,短视频市场需求旺盛。艾瑞UserTracker监测多个方面数据显示,视频服务类App用户使用的内容形式中,短视频位列首位。伴随5G网络的普及,短视频用户规模持续增长,移动网民端短视频渗透率达到73.28%。短视频带来了全新的节目形态和传播场域,小屏幕、碎片化、快节奏成为行业潮流。在这种趋势下,视频消费习惯的改变对短视频生产端提出新的要求:更短的制作周期确保更新频率、画质清晰、剪辑节奏流畅、内容策划紧跟热点热度等。
2019年2月28日,工业与信息化部、国家广播电视总局和中央广播电视总台三部门联合发布了我国的超高清产业高质量发展计划—《超高清视频产业高质量发展行动计划(2019-2022 年)》,明确将以“4K 先行、兼顾 8K”的总体技术路线,大力推进超高清视频产业高质量发展和相关领域的应用。政策利好推动超高清视频产业高质量发展,同时也对技术和服务提出了更高的要求。除了要使用户得到满足还原真实的观感需求,还需不断探索并服务于新的应用场景:远程医疗、安防监控、工业制造等,应用端利用超高清技术更快、更准确、更高效的完成专业作业。超高清在各领域应用的加速推进,将使其步入发展的黄金时期。
疫情爆发推动了实时交互视频的快速的提升,高带宽消耗的视频通讯从高端消费层下沉,视频通话、视频会议、在线教育等成为人类生活、工作和学习中的“刚性需求”。疫情期间,企业通过协作办公确保业务连续性,视频通讯成为企业和员工间主要的沟通方式;在教育领域,“停课不停学”的政策鼓励学生利用线上平台教学,而教学活动的质量取决于师生间互动质量的优劣,此时在线互动教育平台顺应了主动化、多元化、开放性的需求;在医疗领域,为了缓解资源缺乏和分布不均的问题,在线医疗迎来爆发,通过远程问诊、线上复诊等分散线下压力,开发新用户的同时提升用户粘性。此外,实时音视频向社交娱乐、金融服务、公用事业等领域渗透,应用场景日渐丰富的同时对画面质量、延时、抖动提出更高要求。
从2006年网络视频的兴起,到现在步入视频社会化时代,视频不再局限于电影、电视、广告等传统媒体领域,音视频通话、互动直播等新型应用使产业边界逐渐消融。内容上,网络自制剧、短视频的出现打破传统媒体的垄断地位,迫使其加速转型。形式上,音视频通话、直播以互动性强的特点,向电商、游戏、办公等垂直领域延伸。技术上,“5G+AI+4K”的战略布局推进了新旧媒体一体化发展,借助电视媒体在音视频制作方面的优势,提升高品质新媒体制作能力。同时,技术进步也降低了视频生产的成本和技术门槛,为加速推进传统行业的智能化裂变做出贡献,使应用场景进一步拓宽。
智能终端的普及和流量资费的下降,为大视频产业提供良好的发展环境,人们逐渐习惯以直播、短视频作为信息交流的媒介。视频拍摄无需依托专业的硬件设备,手机的拍摄功能即可满足需要,硬件和软件相辅相成,简单易操作、成像效果清晰。手机摄影方便创作者记录日常生活中的每一个瞬间,题材还原生活本质,增强纪实性,也让内容更为丰富。与此同时,各类型视频平台为了争夺市场,一直更新平台功能、拓展应用场景、降低生产门槛,从而吸引更加多的流量和内容供应。网络基础设施、拍摄设备和平台端的优化升级为视频内容创作者提供了肥沃的土壤,万物皆可拍、万物皆可播、全民可参与。
视频云在智能生产、智能分发以及通过音视频处理保障流畅度等方面提供强大的技术上的支持,对视频生产供应、传播和跨领域应用起到及其重要的作用。首先,视频智能生产赋能视频生产环节,帮助创作者高效处理和制作视频内容,加上视频AI的多种能力,能够在大型直播场景下实现内容识别、定位、剪辑、合理聚合,高效产生精彩素材。其次,在视频传播方面,按照内容分发特点可分为强中心化和去中心化两种模式。去中心化将内容选择权留给用户,智能标签实现内容快速检索,提升资源检索效率和准确性。在强中心的传播途径中,视频内容分析和智能标签实现精准、个性化的内容推荐,达到千人千面的效果。最后,实时音视频能力保障稳定流畅的观看体验,推动视频行业跨界融合,在传统媒体、电商、医疗、教育等领域广泛应用。
对于竞争非常激烈、快速迭代的大视频产业而言,视频云已经逐渐发展为一项关键的基础设施。经过多年发展,视频云由最早期的聚焦CDN加速到以PaaS服务助力视频应用快速开发,进一步延伸服务链条,对视频从生产到处理、传输以及最终消费的全流程进行全方位支撑。视频云不仅大幅度降低了视频应用的准入门槛,更通过促进产业效率提升不断推动大视频产业的繁荣。
视频生产是视频产业链的内容产出环节,主要基于视觉与深度学习技术,在素材采集后提供视频内容的识别、编辑、生成、增强与摘要等能力。视频生产可大范围的应用于互联网媒体、短视频、娱乐直播、在线教育、广电传媒等行业应用。近年来,通过智能媒资系统,使用多模态搜索、智能拆条、智能审核等AI处理技术对各类采集源的视频素材做处理,客户能轻松高效地从海量视频中找出自己所关注的目标,快速找出相关创作素材,提升后期创作效率。
视频编码的最大的作用是对视频像素数据压缩,以此来降低视频的数据量。高效率的视频编码在同等的码率下,能够得到更高的视频质量。转码处理主要是针对海量媒体资源提供高效、智能的服务,包括普通转码、倍速转码、超清转码、窄带高清转码等。其中窄带高清技术在编码前先对内容做分析,在不降低甚至增强源视频画质的基础上,对视频分辨率、流畅度、码率、帧率等进行算法优化,大幅度的提高画面清晰度以及转码速度,同时节省带宽和存储成本。
CDN即内容分发网络,通过将视频内容发布到最接近用户的网络边缘,提高用户访问时的响应速度。发展至今,CDN已由2.0阶段过渡到3.0阶段,从单纯以缓存边缘内容为目标步入到运用机器学习实现智能调度、智能分发,从而大大降低经营成本、提升传输质量。但传统的CDN通常只下沉到地市的城域网,距离最终用户依然比较远,在流量高峰时段,CDN资源紧张会影响用户使用体验。随着5G和边缘计算技术的逐步成熟,传统CDN开始向边缘云发展,通过将中心云的视频服务能力下沉到边缘,在边缘云上进行转码、分发,能更加进一步降低视频时延、节省带宽成本,满足大规模、实时互动的需求。
在视频消费环节,视频云能够给大家提供包括美颜特效、美声变声特效、沉浸式交互等在内的多样化玩法,以丰富终端用户的使用体验。视频特效多以人为中心,关键点定位、识别和跟踪是其技术核心,在此基础上可以对人物细节的优化处理,或添加AR贴纸等互动特效。基于视觉特征、音频特征、文本特征进行视频内容理解,并与用户特征和交互特征结合建模,可用于预测用户在另一视频数据集上的消费行为,以此来实现视频内容的精准推荐与营销。
目前来看,视频云渗透率最高的场景依然是在互联网泛娱乐以及在线教育。视频属于这两类场景的核心业务,资源和技术门槛的存在加之应用玩法的快速迭代均凸显了视频云的价值。随网络基础设施的优化,人们越来越习惯利用视频进行日常沟通、信息分享。在短视频风口的助推下,视频演变为各类互联网应用的标配,视频云自然而然地向游戏、社交、K歌、长音频等非视频服务应用渗透。现如今,云服务与产业互联网的结合不断加深,视频云厂商场景化、私有化能力加强,能更好地匹配传统行业的部署需求,在传媒、教育、平台电商化、协同办公等领域的应用也正慢慢的变多。
互联网泛娱乐主要以中长视频、短视频、秀场直播以及游戏直播应用场景为细分,具备用户群体大、涵盖内容丰富、覆盖场景多样的特点。面对内容生产方自身水平和所处网络环境的差异性,视频云可提供拍摄剪辑、特效编辑和高速上传的解决方案,并基于智能化编转码技术和媒体资源管理能力,将清晰流畅的视频内容准确推送给目标人群,提升用户观看体验。在短视频领域,除了在产业链各环节存在与其他应用场景共同的应用痛点,还面临着平台搭建和运营所涉及的成本及效率问题。视频云可提供一站式的短视频综合服务,快速搭建平台、满足基础功能需求,让客户能够专注核心业务创新。
教育行业覆盖的用户群体广泛,从低龄儿童到中老年,从学生到上班族,客户的真实需求多样化。线下教育学习管理机关向线上转型不仅需要投入巨大的花销,而且会遇到开发难度层面、集成对接以及扩容速度等方面的困难。视频云从基础服务出发,通过实时音视频RTC技术在流畅度、成本、时延等需求间实现平衡,实现使用者真实的体验的整体提升。此外,视频云厂商还通过设计多种课堂功能,运用AI能力和版权保护等附加功能为在线教育提供更多的可延展性。
移动互联网冲击传统媒体业态,传媒行业以媒体融合为关键词进行转型。经历了初期的产品融合和平台打造之后,各层级媒体开始构建打通台、网、端、微、视等多种资源的一体化、全媒体传播体系。传统媒体行业拥有一套成熟且模式化的策、采、编、发流程,严谨有余但效率不足,为适应新媒体的媒介形式与消费习惯,需要向更高效智能的生产模式演进。视频云不但可以提供分布式的内容分发网络,通过超清转码、窄带高清、画质重生等满足传媒行业高质量视频更低时延、更低成本的传播需求,更能够以云端一体化的解决方案帮助传媒行业重塑生产流程,提高产业效率。
视频云在协同办公应用中通过稳定可靠的IM及音视频通信底层能力,为客户提供开放、可靠、智能的会议服务。视频云厂商基于视频会议技术,提供公有云、私有云、混合云的多模式部署,帮企业快速构建多端互通与简单易用的会议协作应用。此外,覆盖Windows、Mac、Android、iOS、Web等多端的SDK能够完全满足不同终端用户的接入需求,在各端APP内可直接发起会议,通过“云端一体化”解决方案帮助客户实现随时随地入会,提升沟通效率。
在电商直播中,视频云大范围的使用在美妆、母婴、3C、快消等各个垂直分类直播场景。怎么样才能解决高并发、直播延迟卡顿等痛点,保证直播画质、提高观众参与度和积极性是视频云在电商直播中核心关注的问题。基于视频云低时延解决方案,融合直播管理、内容审核等视频处理技术,通过PC端和手机端触达观众,可以越来越好的保证观众互动体验,提升直播转换效果。除此之外,视频云厂商针对企业直播提供丰富多样的产品功能模块,如共享直播、弹幕打赏、直播抽奖等,满足企业在直播过程中的个性化需求,并通过视频加密、监播等技术,全面保障直播安全,实现高质量直播解决方案落地。
除了互联网泛娱乐、教育、传播、平台电商化、协同办公等典型场景外,视频云也开始尝试触达新社交、金融业务、医疗业务、云游戏等创新型场景。尤其是社交游戏领域,无论是狼人杀、剧本杀还是太空狼人杀,游戏进程的推进都依赖参与者的线上实时沟通。语音互动中,发言者的语气、声调变化能成为玩家判断的依据,实时语音不仅充当了主要沟通工具,也是影响玩家体验的重要功能,应用视频云能够在一定程度上帮助客户快速将更多创意派对游戏落地。云游戏的落地面临网络稳定性、低时延和成本等痛点,对云端编码优化和客户端解码有更高的要求。Intel SG1 GPU高密度、低时延、低功耗、低TCO的特性,能够很好的满足《王者荣耀》等安卓云游戏对GPU的硬件需求,为视频云带来更大的市场价值和想象空间。
产业端,推动视频云创新的计算机视觉产业投融资市场活跃度下降,市场趋于理性。但图像识别、人脸识别、物体与场景识别、视频识别等细致划分领域的投融资热度不减。专业人才供应方面,阳光高考信息平台发布的多个方面数据显示,计算机科学与技术为高考最热门专业,开设院校数量高达969个,课程设置包括图像处理与模式识别、三维计算机视觉等音视频专业课程。虽然企业和学校的供需资源丰富,但是音视频产学研专项项目、企业院校联合研究中心、校园创新大赛较少,影响科研成果向市场转化。放眼国外市场,全球音视频赛事种类非常之多,在业界享有盛誉的国外音视频类比赛有CVPR、ICCV、ICML等计算机视觉机构协会主办的竞赛,每年全球参赛人数众多、奖金池丰富、难度含金量高,这三个要素使国外的比赛在全球业界占技术主导地位。而国内的音视频比赛主要由视频平台和云服务厂商主导举办,影响力略有不足。推动产学研结合,需要发挥国内机构协会和头部企业的引领作用,组织并且开展创新型竞赛,提升大学生实践能力,补足音视频人才缺口。
视频处理和传输环节是视频云技术攻坚的重点方向,以更高的压缩比呈现更高质量的视频,保障在高并发、弱网环境下的低时延、去抖动、抗丢包,始终是视频云厂商技术实力对比的关键指标。一方面,视频云厂商将进一步精研软件算法,运用人工智能技术降低视频处理的计算量、提高网络传输效率,另一方面,视频云厂商也将积极同英特尔等硬件厂商合作,利用硬件厂商提供的高性能芯片、AI硬件加速产品、边缘智能产品等实现性能优化和成本下降。
相对传统软件开放,低代码开发平台具有开发效率高、可配置性强、易用性强等特点,近年来不少厂商开始厂商将音视频解决方案aPaaS平台化。一方面,在通用能力模块化封装的基础上,aPaaS平台针对不一样场景进行了大量业务层面的功能整合,无需研发人员写代码,非技术人员也可按需完成应用开发。另一方面,通过开放各类标准API接口,扩展自有业务所需功能,满足个性化开放需求。未来,低代码开放模式将持续在音视频行业渗透,和视频云其他层级结合向公司可以提供面向全场景的音视频互动一站式解决方案。
5G时代,用户除了关注视频内容之外,更加看重体验感和应用能力。5G基础设施建设为高新视频发展提供了基础条件,同时,我国自主研发了拥有自主知识产权的AVS3编码标准,以英特尔为代表的8K超高清工程化厂商在编解码技术开发上持续发力。再加上后疫情时代人们的娱乐和消费习惯从线下转向线上,高新视频的发展可谓占据了“天时、地利、人和”。互动视频、沉浸式视频、VR、云游戏作为5G基础设施和超高清视频共同叠加产生的高新视频新业态,让视频赋能千行百业的能力得到充分的发挥。超高清、沉浸式、互动性视频带来的海量数据流对算法、算力提出更高的要求,这为视频云的技术迭代和场景应用带来新的机遇和挑战。