海内外大语言模型（LLM） | 第28页

模型框架

一款基于大型语言模型的视觉与语言生成工具MiniGPT-5

看得懂图片的多模态大模型MiniGPT4 MiniGPT-5是一个基于大型语言模型的图像和语言生成模型。它采用了一种创新的交错式视觉和语言生成技术，通过“生成vokens”作为图像和文本输出之间的桥梁。该模型经过两个阶段的训练，无需对图像进行详细描述，同时结合了无分类器引导的指导方法，提高了图像生成的效果。在多个评估数据集上，MiniGPT-5在人类评估中表现出优秀的多模态输出…

2023年10月9日

模型框架

只需 2 分钟即可从单视图图像生成高质量的3D模型 – DreamGaussian

内容：DreamGaussian：用于高效3D内容创建的生成高斯点云。Arxiv 2023。最近在3D内容创建方面的进展主要通过基于优化的3D生成来实现，采用分数蒸馏采样（SDS）。尽管展示出了有希望的结果，但这些方法往往在每个样本的优化过程中速度较慢，限制了它们的实际使用。在本文中，我们提出了DreamGaussian，一种新颖的3D内容生成框架，同时实现了效率和质量。我…

2023年9月30日

模型框架

创新生成模型CoDi：能够从任何组合的输入模态生成任何组合的输出模态

内容：北卡罗来纳大学教堂山分校和微软Azure认知服务研究团队在微软实习期间开发了一种名为Composable Diffusion (CoDi)的创新生成模型。CoDi能够从任何组合的输入模态（如语言、图像、视频或音频）生成任何组合的输出模态。CoDi的输入不仅限于文本或图像，它可以并行生成多种模态。尽管许多模态组合的训练数据集不存在，但我们提出在输入和输出空间内对模态进行对齐…

2023年9月25日

模型框架

试试用这个开源项目用Stable Diffusion 做 Gif

看了下效果，还挺不错的~ 代码地址： https://github.com/Kosinkadink/ComfyUI-AnimateDiff-Evolved 来源：https://mp.weixin.qq.com/s/iX5mw5cH7fVpoFTBRsXGhQ

2023年9月25日

AI视频生成解决方案Rerender A Video已开源

内容：SIGGRAPH Asia 2023会议上，研究人员提出了一种名为“Rerender A Video: Zero-Shot Text-Guided Video-to-Video Translation”的新框架，用于将图像模型适应到视频中。这个框架包括两个部分：关键帧翻译和完整视频翻译。首先，通过改进的扩散模型生成关键帧，并应用分层跨帧约束以保证形状、纹理和颜色的一致性。…

2023年9月25日 • 模型框架

DALL·E 3发布了！Open AI 整了个大的，这里有你需要知道的所有信息

Open AI 悄咪咪整了个大的，推出了图像生成工具 Dall-E 3。它利用 ChatGPT 通过自动扩展提示的方式，帮助创作更复杂、精心构思的艺术作品，为生成器提供更详细、连贯的指导。 Dall-E 3的新功能在于简化了所需的文本细化过程，即所谓的“提示工程”，并且通过ChatGPT的对话界面允许用户进行细化。这个新工具有助于降低生成复杂AI艺术作品的门槛，并且由于其聊天机…

2023年9月22日 • 模型框架

模型框架

由清华北邮等高校研究团队发布的一套AI多智能体协作模拟框架：AgentVerse

AgentVerse是一个多LLM环境模拟的框架，可以帮助研究人员快速创建自定义的多代理环境。该框架提供了高效的环境构建工具和可定制的组件，研究人员可以专注于研究而不必担心实现细节。 AgentVerse还支持使用BMTools提供的工具来增强多代理环境的功能。项目地址： https://github.com/OpenBMB/AgentVerse 可以模拟多种社会实验场景的工…

2023年9月16日

模型框架

Chupa这个厉害咯～用2D 扩散概率模型雕刻3D 穿衣人体

该内容介绍了一种名为Chupa的3D人物生成流程，结合了扩散模型和神经渲染技术，可以生成多样化、逼真的3D人物。该流程可以适用于未见过的人物姿势，并展示逼真的特质。Chupa可以从SMPL-X网格生成高质量的人物网格。项目地址： https://snuvclab.github.io/chupa/ 来源：https://mp.weixin.qq.com/s/TZqiTS-3uQ…

2023年9月16日

模型框架

开源 AI 头像生成器 Web 应用程序photoshot

开源 AI 头像生成器 Web 应用程序，包含了完整的网站、AI的API调用、支付等功能，即使你不做同类应用，如果你想做类似的收费AI项目，可以帮你节约很多前期开发工作。技术栈： ▲ Next.js： Web 应用程序 Chakra UI ：UI 组件的 Prisma：数据库 ORM Replicate：一个运行机器学习模型的云平台 Stripe：Stripe 支付 …

2023年9月8日

模型框架

妙鸭相机的核心功能已被打造成一个SD WebUI插件：EasyPhoto 在本地电脑上处理真人写真和证件照了！

EasyPhoto是一个智能AI照片生成器的WebUI插件，可用于训练与您相关的数字化人物形象。建议使用5到20张半身照片进行训练，最好不要戴眼镜（如果有几张照片中的人物戴眼镜也没有关系）。训练完成后，可以在推理部分生成照片。支持使用预设模板图片或上传自己的图片进行推理。新功能包括支持多人生成和不同的基础模型用于训练和推理。项目地址： https://github.com/a…

2023年9月8日