AI 共存派 | 第26页

开源项目

通过简短视频克隆人像并转化为3D数字形象的技术ExAvatar

全文总结本文主要介绍了一种名为 ExAvatar 的新型表达性全身 3D 高斯化身。它结合了 SMPL–X 的全身驱动性和 3DGS 的强大外观建模能力，可通过短时间的手机扫描创建，并支持新的身体姿势、手部姿势、面部表情的动画和任意视角的渲染。文中还阐述了其混合表示、身体各部位的协同注册、架构以及与先前技术和生成式 AI 的比较等方面。重要亮点地址： https:…

2024年8月10日

开源项目

全景图像生成新方法PanoFree

全文总结本文主要介绍了一种名为 PanoFree 的新型无调优多视图图像生成方法，该方法在沉浸式场景生成，特别是全景图创建方面具有显著优势。重要亮点项目地址： https://panofree.github.io

2024年8月10日

开源项目

苹果发布了一种新的图像和视频生成方法Matryoshka Diffusion Models (MDM)

全文总结本文主要介绍了一种名为 Matryoshka Diffusion Models（MDM）的端到端框架，用于高分辨率图像和视频合成。指出扩散模型在生成高质量图像和视频方面表现出色，但在高维空间学习存在挑战，现有方法常采用训练级联模型，而本文提出的 MDM 采用多尺度联合扩散过程，小尺度模型嵌套在大尺度内，促进了特征共享和架构的渐进式增长，在多个基准上展示了有效性，包括 I…

2024年8月10日

应用

字节跳动旗下豆包上线音乐生成功能，用户可一键“撰写”词曲

体验地址： https://www.doubao.com/chat/music

2024年8月10日

开源项目

Qwen2-Math 开源 AI 模型发布,基于 Qwen2 LLM 构建、专门用于数学解题的语言模型

全文总结这段文本主要介绍了多个数学问题及相应的求解过程，包括关于 Qwen2–Math 系列模型在数学推理能力方面的表现和评估，以及一系列不同类型的数学函数问题的求解。重要亮点求解方法与思路：在解决问题时，通常先进行条件分析和代入特定值，然后探索规律、假设函数形式并进行验证，以得出最终结论。 Qwen2-Math 模型介绍：Qwen2-Math 是基于 Qwen2…

2024年8月10日