2024-03-01
24年是AI多模态的元年!股友们,如果说2023年是全球AI大模型大爆发,是图文生成元年的话,那2024年行业会进入AI视频生成和多模态大模型元年。从Chatgpt到Sora,AI进入新的阶段。
AI多模态引发各种巨头的关注和发力!现在市场似乎把火力集中到了同一个方向也就是AI多模态尤其是视频生成,主要是因为Sora的火热一石激起千层浪,同类产品发布你追我赶。在多模态这个领域,要让视频人物和声音完美同步,需要捕获说话人微妙和多样化的面部动作,这是一个巨大的挑战。最近,阿里推出视频生成框架EMO,不仅可以生成任意时长的说话视频,还能生成表情、五官、姿势都会产生非常自然的变化的效果。据说字节跳动正秘密研发多模态数字人,可见此赛道的火热。
多模态大模型将成为未来大模型领域的主流趋势!除文字外,优质原创图像、视频内容均将成为数据集的重要来源。目前,OpenAI正面临多起诉讼,指控他们使用受版权保护的作品来训练人工智能产品。多起案件加在一起,有可能会动摇文字类AIGIC的基础,那么多模态可能会是主要发展方向。
2条评论
- 回本之路一切顺利:我对这些公司的未来前景感到担忧,如果他们不能解决我的问题,我可能要退出股市了。
- 抄顶专家:AI视频生成和多模态大模型的未来充满了无限可能,期待看到更多的创新和应用。