AI 共存派
-
通过简短视频克隆人像并转化为3D数字形象的技术ExAvatar
全文总结本文主要介绍了一种名为 ExAvatar 的新型表达性全身 3D 高斯化身。它结合了 SMPL–X 的全身驱动性和 3DGS 的强大外观建模能力,可通过短时间的手机扫描创建,并支持新的身体姿势、手部姿势、面部表情的动画和任意视角的渲染。文中还阐述了其混合表示、身体各部位的协同注册、架构以及与先前技术和生成式 AI 的比较等方面。重要亮点 地址: https:…
-
全景图像生成新方法PanoFree
全文总结本文主要介绍了一种名为 PanoFree 的新型无调优多视图图像生成方法,该方法在沉浸式场景生成,特别是全景图创建方面具有显著优势。重要亮点 项目地址: https://panofree.github.io
-
苹果发布了一种新的图像和视频生成方法Matryoshka Diffusion Models (MDM)
全文总结本文主要介绍了一种名为 Matryoshka Diffusion Models(MDM)的端到端框架,用于高分辨率图像和视频合成。指出扩散模型在生成高质量图像和视频方面表现出色,但在高维空间学习存在挑战,现有方法常采用训练级联模型,而本文提出的 MDM 采用多尺度联合扩散过程,小尺度模型嵌套在大尺度内,促进了特征共享和架构的渐进式增长,在多个基准上展示了有效性,包括 I…
-
字节跳动旗下豆包上线音乐生成功能,用户可一键“撰写”词曲
体验地址: https://www.doubao.com/chat/music
-
Qwen2-Math 开源 AI 模型发布,基于 Qwen2 LLM 构建、专门用于数学解题的语言模型
全文总结这段文本主要介绍了多个数学问题及相应的求解过程,包括关于 Qwen2–Math 系列模型在数学推理能力方面的表现和评估,以及一系列不同类型的数学函数问题的求解。重要亮点 求解方法与思路:在解决问题时,通常先进行条件分析和代入特定值,然后探索规律、假设函数形式并进行验证,以得出最终结论。 Qwen2-Math 模型介绍:Qwen2-Math 是基于 Qwen2…
-
字节出了AI音乐产品:海绵音乐,类似Suno,中文支持的很好
只需要输入当下的灵感,无论是主题如“恋爱”“离职”“发疯”,还是流派如“民谣”“摇滚”,甚至是歌词和风格,海绵就能快速生成一首约1分钟的音乐。 可以听听我刚制作的这首歌(没找到下载音频的地方……): https://www.haimian.com/share/WlKZL71KYG
-
创新的头发转移技术:Stable-Hair,适合做发型设计
解决了传统方法无法处理复杂发型的问题,为用户带来全新的试发体验。 地址: https://github.com/Xiaojiu-z/Stable-Hair
-
一款适合时尚爱好者使用的小型AI虚拟换衣模型:CatVTON
参数小仅899.06M,支持高分辨率,支持在ComfyUI和Gradio应用上部署,操作便捷。 地址: https://github.com/Zheng-Chong/CatVTON
-
360搞了个集合国内16家主流模型的AI助手
在ISC.AI2024第十二届互联网安全大会上,周鸿祎宣布360悬浮球将换成AI助手,并新增AI助手悬浮按钮。用户可以根据自己的需求选择最合适的AI模型,进行效果对比和交叉验证,以挑选最满意的解决方案。 体验地址: https://bot.360.com
-
又一个AI搜索:mindsearch,能够模仿人类在网络上寻找和整合信息
可以体验~官方介绍说它通过浏览300+网页收集详细信息,并在1分钟内总结出高质量答案。 体验地址: https://mindsearch.openxlab.org.cn 项目地址: https://github.com/InternLM/MindSearch