2月16日,来自多伦多大学、Meta、加州大学圣迭戈分校的研究团队在arXiv上发表论文,提出利用大模型的多功能语言能力。作者构建了视频剪辑工具LAVE,其引入了一个基于大模型的规划与执行智能体,能实现素材概览、创意头脑风暴、视频检索、故事板、剪辑修剪等功能。
论文地址:
https://arxiv.org/pdf/2402.10294.pdf
本文地址:https://www.163264.com/6611
2月16日,来自多伦多大学、Meta、加州大学圣迭戈分校的研究团队在arXiv上发表论文,提出利用大模型的多功能语言能力。作者构建了视频剪辑工具LAVE,其引入了一个基于大模型的规划与执行智能体,能实现素材概览、创意头脑风暴、视频检索、故事板、剪辑修剪等功能。
论文地址:
https://arxiv.org/pdf/2402.10294.pdf
本文地址:https://www.163264.com/6611