AI 共存派

  • 微软开源框架AutoGen:通过多个LLM、工具及人工的合作来解决复杂任务

    AutoGen提供了多代理对话框架,可以方便地构建大型语言模型的工作流程。AutoGen还提供了一系列不同领域和复杂度的工作系统,可以用于构建多样化的应用程序。此外,AutoGen还支持增强型的大型语言模型推理API,可以提高推理性能并降低成本。 项目地址: https://microsoft.github.io/autogen/ 来源:https://mp.weixin.qq…

    2023年10月9日
  • 一个基于 Transformer 的文本到图像生成模型-PIXART-α

    这篇内容介绍了一个名为PIXART-α的图像生成模型,它是一种基于Transformer的文本到图像(T2I)扩散模型,其生成的图像质量与现有的最先进的图像生成器相媲美。PIXART-α支持高分辨率图像合成,训练成本低,速度快,节省了大量的时间和资源。它在图像质量、艺术性和语义控制方面表现出色,为人工智能图形计算(AIGC)社区和初创公司提供了新的启示,帮助他们从零开始构建高质…

    2023年10月9日 模型框架
  • 一款基于大型语言模型的视觉与语言生成工具MiniGPT-5

    看得懂图片的多模态大模型MiniGPT4 MiniGPT-5是一个基于大型语言模型的图像和语言生成模型。它采用了一种创新的交错式视觉和语言生成技术,通过“生成vokens”作为图像和文本输出之间的桥梁。该模型经过两个阶段的训练,无需对图像进行详细描述,同时结合了无分类器引导的指导方法,提高了图像生成的效果。在多个评估数据集上,MiniGPT-5在人类评估中表现出优秀的多模态输出…

    2023年10月9日
  • 一键创建漫画的AI工具:shortbread.ai

    输入故事主题,AI一键创建漫画。支持手动修改台词,支持修改每张图片的提示词,重新生成图片。送50次免费次数,可以生成下方这种图片50张。 体验地址: https://shortbread.ai/ 作品⬇️ 来源:https://mp.weixin.qq.com/s/tXE22c21t128xKhgwTtnPQ

    2023年10月9日 应用
  • 微软发布了一份166页的论文《LMM 的黎明:GPT-4V (ision) 的初步探索》

    摘要 多模态大模型(LMMs)不仅拥有大型语言模型(LLMs)的特点,还拓宽了其多感官技能,例如视觉理解,从而实现了更强的通用智能。 本文深入探索并分析了最新的 GPT-4V(ision) 模型,旨在加深我们对 LMMs 的认识。我们的分析重点是 GPT-4V 能够完成的各种有趣任务,通过一系列精心设计的测试样本,来检验 GPT-4V 能力的质量和通用性,以及它所支持的输入和工…

    2023年10月3日
  • 只需 2 分钟即可从单视图图像生成高质量的3D模型 – DreamGaussian

    内容:DreamGaussian:用于高效3D内容创建的生成高斯点云。Arxiv 2023。 最近在3D内容创建方面的进展主要通过基于优化的3D生成来实现,采用分数蒸馏采样(SDS)。 尽管展示出了有希望的结果,但这些方法往往在每个样本的优化过程中速度较慢,限制了它们的实际使用。在本文中,我们提出了DreamGaussian,一种新颖的3D内容生成框架,同时实现了效率和质量。我…

    2023年9月30日
  • Meta :《Llama 生态系统:过去、现在和未来》

    Llama社区的增长得到了几个显著的发展的证明: 云使用:AWS、Google Cloud和Microsoft Azure等主要平台已经在其平台上采用了Llama模型,并且Llama 2在云中的存在正在扩大。今天我们宣布AWS成为我们在Llama 2上的第一个托管API合作伙伴。现在,各种规模的组织都可以在Amazon Bedrock上访问Llama 2模型,而无需管理底层基础…

    2023年9月28日
  • Meta 发布自己的AI聊天机器人: Meta AI ,拥有超过 28 个名人角色

    原文: https://ai.meta.com/genai/ 介绍了来自Meta的新型AI体验,这是一种新的生成型AI功能,扩展和加强了人们彼此联系的方式。现在我们有了新的创意工具,可以创建和分享自定义贴纸,或者通过简单的文本提示更新照片的视觉风格。与28个不同的AI聊天,获取有关旅行、游戏和食物等主题的独特观点。这些新体验将帮助您享受乐趣,建立联系并学到新的东西。个人助手与M…

    2023年9月28日 行业/好文
  • 完全由 GPT4提示词驱动的文字模拟游戏:人生重来模拟器 LifeReloaded

    midjourney提示词:Life Reloaded –ar 16:9 人生重来模拟器是一个使用GPT-4 Advanced Data Analysis功能驱动的交互式模拟人生游戏。游戏内容由顶尖人工智能GPT4实时生成,给玩家带来丰富多彩的真实人生体验。游戏中包括文学和人工智能的完美融合,利用心理学塑造角色,以及多元宇宙和开源社区等特点。 玩家可以通过复制粘贴游…

    2023年9月27日 行业/好文
  • 一起看看ChatGPT多模态功能亮相后实际应用情况如何

    OpenAI宣布在ChatGPT中推出了新的语音和图像功能。语音功能使ChatGPT成为用户的语音助手,可以随时与用户交谈并响应指令。图像理解功能使ChatGPT能够分析图像中的信息并给出相应结论。这些功能将在接下来的两周内向ChatGPT Plus和ChatGPT Enterprise用户推出。OpenAI还计划将类似功能推向更大规模的用户群体。 ChatGPT 的多模态就这…

    2023年9月27日 行业/好文