AI 共存派
-
OpenAI 发布了 Sora
它支持高达 1080p 的分辨率,视频时长最长为 20 秒,并且可以选择宽屏、竖屏或方形格式。该工具提供文本转视频、图像转视频和视频转视频的功能。还配备了精美的分镜工具,能够帮助用户精准地指导视频创作。它包含 “精选” 和 “最近” 两个内容板块,用户可以从社区中获取灵感。此外,该工具内置了安全措施,以确保透明性并防止滥用。用户可以通过 Plus 订阅来使用这个工具,或者通过 …
-
DeepSeek AI 发布新版 DeepSeek-V2.5-1210
DeepSeek AI 最近发布了其 DeepSeek V2 系列的最终版微调模型——DeepSeek-V2.5-1210。以下是该版本的主要特点和功能: 这些更新使得 DeepSeek-V2.5-1210 成为一个在多个领域都具有强大性能的 AI 模型,为用户提供了更加全面和高效的服务。 地址: https://huggingface.co/deepseek-ai/DeepS…
-
Adobe联手MIT打造CausVid视频生成模型
Adobe与MIT合作推出的CausVid视频生成模型是一项突破性技术,它能够实现实时视频生成,极大地提升了视频内容创作的效率。以下是CausVid的一些关键特性: CausVid的出现标志着视频生成领域的一次重大突破,它将彻底改变我们创作和消费视频内容的方式,开启一个充满无限可能性的未来。 项目地址: https://causvid.github.io
-
月费高达500美元的AI Agent程序员Devin来了
全球首个AI Agent程序员Devin已经全面开放使用并实现商业化。Devin以其强大的功能和高效的自动化编程能力引起了业界的广泛关注。以下是Devin的一些核心功能和特点: 尽管Devin的功能强大,但其月费高达500美元(约合人民币3624元),成为目前市场上最贵的生成式AI产品之一。这一定价对于小团队和个人来说难以承受,因此有呼声希望Devin推出个人订阅模式以降低使用…
-
MMAudio:输入视频或文本可自动给视频配音效
MMAudio是一项由伊利诺伊大学厄巴纳-香槟分校、Sony AI及Sony集团联合推出的新技术,它能够实现视频到音频的高质量合成。这项技术的核心创新在于利用视频和文本输入生成同步音频,从而拓展了音频生成的应用场景。MMAudio的设计使其能够在各种视听和音频文本数据集上进行训练,这种多模态联合训练的方式,不仅提高了合成音频的质量,还确保了生成的音频与视频帧之间的同步。 MMA…
-
谷歌已经正式发布了新一代的AI模型Gemini 2.0
谷歌已经正式发布了新一代的AI模型Gemini 2.0,这标志着谷歌在人工智能领域的又一重大进展。以下是Gemini 2.0的一些关键特性和亮点: Gemini 2.0的发布,展示了谷歌在构建更智能、更自动化的AI代理方面的雄心,这些代理能够理解环境、执行任务并在一定程度上独立做出决策。这不仅是技术上的一次飞跃,也为用户带来了更加丰富和便捷的智能体验。
-
Midjourney推出一款名为“Patchwork”的全新实验性多人世界构建工具
Midjourney最近推出了一款名为“Patchwork”的全新实验性多人世界构建工具,这是一个结合了语言模型、图像模型和无限画布的新型创作平台,专为虚拟世界构建而设计。Patchwork支持多人协作,用户可以在无限画布上自由创作虚拟世界的角色、地点、派系等元素,它结合了AI的强大生成能力和实时协作功能,旨在帮助创作者更轻松地打造一个完整的虚拟世界。 Patchwork的主要…
-
推荐这篇播客:《我们到底如何记录AI行业这一年》
《Vol.45 132 页 PPT 记录 AI 行业这一年》对 2024 年中美两国的 AI 行业进行了全面总结。涵盖大模型公司竞争格局、巨头共识、应用场景等。介绍了美国的 AI 方向、一级市场投资及斯坦福教授观点,还有中国大模型创业新叙事、新老公司对比、巨头发展及应用实践。内容包括 AI 视频生成、教育、硬件等方面,以两条新闻结尾,强调生活要继续。该视频通过 132 页 PP…
-
【宝藏】黑森林实验室FLUX.1 Tools,图片编辑新神器!
家人们,今天要给大家安利一个超好用的图片编辑工具包——黑森林实验室新推出的FLUX.1 Tools!🌟 🎨【FLUX.1 Fill】这个功能简直是图片修复的救星!无论是填补图片的缺失部分,还是想要扩展图片超出原始边界,FLUX.1 Fill都能无缝整合,效果比市面上的工具都要强大! 🔍【FLUX.1 Depth & FLUX.1 Canny】 🎉【FLUX.1 Redu…