模型框架
-
华人团队提出大模型上下文窗口的自行扩展新方法SelfExtend
华人团队提出大模型上下文窗口的自行扩展新方法SelfExtend,无需任何训练和微调,只需修改四行代码即可扩展现有大模型的上下文窗口长度,最高可增加3倍。 论文地址: https://arxiv.org/abs/2401.01325.pdf
-
SUTD团队发表论文,提出11亿参数的小型语言模型TinyLlama
新加坡科技设计大学(SUTD)团队发表论文,提出11亿参数的小型语言模型TinyLlama,其在大约1万亿个Token上进行了3轮预训练。 论文地址: https://arxiv.org/pdf/2401.02385.pdf
-
百川智能发布角色大模型 Baichuan-NPC
百川智能于2024年1月9日发布了角色大模型Baichuan-NPC,该模型通过优化角色知识和对话能力,使角色能够更好地理解上下文对话语义,更符合人物性格地进行对话和行动,让角色栩栩如生。此外,百川智能还推出了“角色创建平台+搜索增强知识库”的解决方案,游戏厂商可以通过简单的文字描述快速构建自己需要的角色,实现低成本、高效率的角色定制。Baichuan-NPC在对话能力、角色一…
-
实时创建和渲染逼真的动态3D头像的技术-BakedAvatar
一项实时创建和渲染逼真的动态3D头像的技术-BakedAvatar,可通过简短视频复制出人物3D头部,能在移动设备上进行实时渲染,编辑和调整头像的表情和姿势。。 项目地址: https://buaavrcg.github.io/BakedAvatar/ 《BakedAvatar:用于实时头像合成的烘焙神经场》是一篇关于头像合成的论文。该方法可以从单目视频中生成基于…
-
阿里巴巴项目aceChain-FACT,只要上传你的照片克隆你自己
支持零样本人像生成,我们使用了数百万个精美的人像进行模型训练。我们有100多个高级定制模板可供选择。我们的模型支持CPU和二级推理时间。FaceChain-FACT生成的人像照片是二级的。简要总结:FaceChain-FACT是一个零样本人像生成模型,不需要用户进行LoRA模型训练,只需要一张用户的照片即可生成定制的人像照片。相比其他商业应用,我们的生成速度提高了100倍,支持…
-
能够直接操纵图像中的背景或对象项目DragNUWA 发布了在线体验地址
DragNUWA是一个由yinsming创建的Hugging Face空间,可以发现由社区制作的令人惊叹的机器学习应用程序。 体验地址: https://huggingface.co/spaces/yinsming/DragNUWA
-
Meta发布了audio2photoreal 演示,可以从对话音频中生成逼真的面部、身体和手势
项目地址: https://people.eecs.berkeley.edu/~evonne_ng/projects/audio2photoreal/ 代码: https://github.com/facebookresearch/audio2photoreal 内容:1 Meta Reality Labs研究,2加利福尼亚大学伯克利分校。简而言之:从对话的音频中,我们生成相应…
-
ComfyUI Portrait Master 2.2 版本发布,新增了一个姿势库
代码库:https://github.com/florestefano1975/comfyui-portrait-master/ 提供了与 Portrait Master 兼容的工作流程文件,包括对姿势的管理和控制。 集成了放大器和两个 ControlNet 以管理角色的姿势。 ComfyUI肖像大师是一个帮助AI图像创作者生成人物肖像提示的节点。通过ComfyUI Manag…
-
一个基于扩散模型让人物头像说话的框架DreamTalk
DreamTalk是一个基于扩散模型的框架,由清华大学、阿里巴巴和华中科大共同开发。它能够根据音频让人物头像照片说话、唱歌并保持嘴唇的同步和模仿表情变化。该项目使用扩散模型生成动态和表情丰富的说话头部动画,包括去噪网络、风格感知的嘴唇专家、风格预测器、音频和视频处理以及数据和模型训练等关键组件。 亮点: DreamTalk不仅能够处理和生成训练过程中见过的面部类型和表情,还能有…
-
阿里发布的虚拟服装试穿 – Outfit Anyone
阿里发布的虚拟服装试穿 – Outfit Anyone:只需要一张人物照片和服装照片就可以让那个人穿上这个衣服,特色是可以为不同的姿势和身体形状创建高质量的虚拟试穿。(目前还没有代码) 体验地址: https://huggingface.co/spaces/HumanAIGC/OutfitAnyone
