疑似使用了生成技术,请谨慎甄别。
这行不小字如今几乎在生活中无处不在,特别是在繁荣的短视频平台上。
从刷个西游记能看到AI妖精真身,到小猫视频的口型是AI合成,甚至整个动画片画面都是由AI生成,AI视频的时代似乎已经悄然而至。
对此,东吴证券的一份研究报告预测,中国AI视频生成的潜在行业空间可能拥有超过5800亿元的市场。
尽管市场前景光明,行业却也面临着诸多挑战。
成本问题便是一大难题。
生成式大模型,特别是视频类模型,需要大量的数据进行训练,对计算和处理数据、以及数据本身有着巨大的需求,随之而来的是成本的急剧增加。
以年初推出的视频模型Sora为例,其训练和推理所需的算力需求分别达到了GPT-4的4.5倍和近400倍。
大模型训练样本质量、处理链路复杂,涉及多个环节和团队协同作战,自研或第三方、GPU、cpu、ARM等多种异构算力资源的灵活调度部署也是一大挑战。
在这个背景下,抖音和火山引擎等视频领域的佼佼者展现出了他们的实力。
上个月底字节推出的PixelDance效果显著,而在火山引擎视频云技术大会上展示的定制数字人谭待则让人们看到了高质量AI产出的可能。
这些高质量产出的背后离不开一个名为BMF的智能框架。
火山引擎通过和自家大模型团队在内部合作,一起对海量的视频数据进行预处理,最后基于火山引擎音视频处理平台和BMF框架在短时间内生产了足够多高质量的视频素材用于模型的训练。
其中,BMF框架就像是一个年夜饭的一键全流程套餐,它提供了一系列的工具和服务,帮助企业轻松、快捷地准备好年夜饭,针对性地解决了行业痛点。
为了更精细地解决行业问题,BMF框架通过多种算法对视频进行多维度的分析和筛选,做到了充分精细化的过滤;同时利用框架的灵活调度提前调配好性能。
火山引擎还推出了智能算力和智能编解码技术。
火山引擎直接在去年推出了一款自研视频转码芯片,将自研的视频编解码技术融入其中。
这款转码芯片针对视频点播、直播等特定场景有着更高的计算密度优势。
在此基础上推出的BVE1.2编码器更是大胆融合了深度学习技术推出了革命性的智能混合编解码解决方案极大地提升了编解码的效率。
在不久前结束的第六届深度学习图像压缩挑战赛(CLIC大赛)中BVE1.2编码器取得了两个冠军足以证明其实力。
这套组合拳下来无疑给企业带来了极大的便利和效益。
值得一提的是火山引擎并没有打算藏着掖着像BMF框架这样的重要技术早在去年就已经开源了更新完的BMFlite也是直接开源。
这种开放的态度不仅有助于推动行业的发展也有助于加强企业间的合作共同应对行业挑战。
总的来说目前大模型的进化还在持续视频AI公司之间的竞争也只会日益激烈但合作共赢的态度才是最佳的选择。
一枝独秀难成林万紫千红才是春。
在这种竞争和合作共存的环境中中国的AI行业将会迎来更加繁荣的发展。
总之火山引擎通过其强大的技术实力和开放的态度在AI视频时代引领着行业的革新。
以BMF框架为代表的一系列技术解决方案正在帮助企业解决AI视频化进程中的种种难题推动行业的快速发展。
在未来我们期待看到更多的企业在竞争和合作中共同成长共同推动AI视频行业的繁荣发展。
本文地址: https://www.gosl.cn/shbkwz/4b8d17f16a2bd86399c5.html
上一篇:迎接新功能上线,品质卓越的重磅升级即将来袭...