AI 共存派

模型框架

微软开源框架AutoGen：通过多个LLM、工具及人工的合作来解决复杂任务

AutoGen提供了多代理对话框架，可以方便地构建大型语言模型的工作流程。AutoGen还提供了一系列不同领域和复杂度的工作系统，可以用于构建多样化的应用程序。此外，AutoGen还支持增强型的大型语言模型推理API，可以提高推理性能并降低成本。项目地址： https://microsoft.github.io/autogen/ 来源：https://mp.weixin.qq…

2023年10月9日

一个基于 Transformer 的文本到图像生成模型-PIXART-α

这篇内容介绍了一个名为PIXART-α的图像生成模型，它是一种基于Transformer的文本到图像(T2I)扩散模型，其生成的图像质量与现有的最先进的图像生成器相媲美。PIXART-α支持高分辨率图像合成，训练成本低，速度快，节省了大量的时间和资源。它在图像质量、艺术性和语义控制方面表现出色，为人工智能图形计算(AIGC)社区和初创公司提供了新的启示，帮助他们从零开始构建高质…

2023年10月9日 • 模型框架

模型框架

一款基于大型语言模型的视觉与语言生成工具MiniGPT-5

看得懂图片的多模态大模型MiniGPT4 MiniGPT-5是一个基于大型语言模型的图像和语言生成模型。它采用了一种创新的交错式视觉和语言生成技术，通过“生成vokens”作为图像和文本输出之间的桥梁。该模型经过两个阶段的训练，无需对图像进行详细描述，同时结合了无分类器引导的指导方法，提高了图像生成的效果。在多个评估数据集上，MiniGPT-5在人类评估中表现出优秀的多模态输出…

2023年10月9日

一键创建漫画的AI工具：shortbread.ai

输入故事主题，AI一键创建漫画。支持手动修改台词，支持修改每张图片的提示词，重新生成图片。送50次免费次数，可以生成下方这种图片50张。体验地址： https://shortbread.ai/ 作品⬇️ 来源：https://mp.weixin.qq.com/s/tXE22c21t128xKhgwTtnPQ

2023年10月9日 • 应用

报告

微软发布了一份166页的论文《LMM 的黎明：GPT-4V (ision) 的初步探索》

摘要多模态大模型（LMMs）不仅拥有大型语言模型（LLMs）的特点，还拓宽了其多感官技能，例如视觉理解，从而实现了更强的通用智能。本文深入探索并分析了最新的 GPT-4V(ision) 模型，旨在加深我们对 LMMs 的认识。我们的分析重点是 GPT-4V 能够完成的各种有趣任务，通过一系列精心设计的测试样本，来检验 GPT-4V 能力的质量和通用性，以及它所支持的输入和工…

2023年10月3日

模型框架

只需 2 分钟即可从单视图图像生成高质量的3D模型 – DreamGaussian

内容：DreamGaussian：用于高效3D内容创建的生成高斯点云。Arxiv 2023。最近在3D内容创建方面的进展主要通过基于优化的3D生成来实现，采用分数蒸馏采样（SDS）。尽管展示出了有希望的结果，但这些方法往往在每个样本的优化过程中速度较慢，限制了它们的实际使用。在本文中，我们提出了DreamGaussian，一种新颖的3D内容生成框架，同时实现了效率和质量。我…

2023年9月30日