AI 共存派
-
一款基于大型语言模型的视觉与语言生成工具MiniGPT-5
看得懂图片的多模态大模型MiniGPT4 MiniGPT-5是一个基于大型语言模型的图像和语言生成模型。它采用了一种创新的交错式视觉和语言生成技术,通过“生成vokens”作为图像和文本输出之间的桥梁。该模型经过两个阶段的训练,无需对图像进行详细描述,同时结合了无分类器引导的指导方法,提高了图像生成的效果。在多个评估数据集上,MiniGPT-5在人类评估中表现出优秀的多模态输出…
-
一键创建漫画的AI工具:shortbread.ai
输入故事主题,AI一键创建漫画。支持手动修改台词,支持修改每张图片的提示词,重新生成图片。送50次免费次数,可以生成下方这种图片50张。 体验地址: https://shortbread.ai/ 作品⬇️ 来源:https://mp.weixin.qq.com/s/tXE22c21t128xKhgwTtnPQ
-
微软发布了一份166页的论文《LMM 的黎明:GPT-4V (ision) 的初步探索》
摘要 多模态大模型(LMMs)不仅拥有大型语言模型(LLMs)的特点,还拓宽了其多感官技能,例如视觉理解,从而实现了更强的通用智能。 本文深入探索并分析了最新的 GPT-4V(ision) 模型,旨在加深我们对 LMMs 的认识。我们的分析重点是 GPT-4V 能够完成的各种有趣任务,通过一系列精心设计的测试样本,来检验 GPT-4V 能力的质量和通用性,以及它所支持的输入和工…
-
只需 2 分钟即可从单视图图像生成高质量的3D模型 – DreamGaussian
内容:DreamGaussian:用于高效3D内容创建的生成高斯点云。Arxiv 2023。 最近在3D内容创建方面的进展主要通过基于优化的3D生成来实现,采用分数蒸馏采样(SDS)。 尽管展示出了有希望的结果,但这些方法往往在每个样本的优化过程中速度较慢,限制了它们的实际使用。在本文中,我们提出了DreamGaussian,一种新颖的3D内容生成框架,同时实现了效率和质量。我…
-
Meta :《Llama 生态系统:过去、现在和未来》
Llama社区的增长得到了几个显著的发展的证明: 云使用:AWS、Google Cloud和Microsoft Azure等主要平台已经在其平台上采用了Llama模型,并且Llama 2在云中的存在正在扩大。今天我们宣布AWS成为我们在Llama 2上的第一个托管API合作伙伴。现在,各种规模的组织都可以在Amazon Bedrock上访问Llama 2模型,而无需管理底层基础…
-
Meta 发布自己的AI聊天机器人: Meta AI ,拥有超过 28 个名人角色
原文: https://ai.meta.com/genai/ 介绍了来自Meta的新型AI体验,这是一种新的生成型AI功能,扩展和加强了人们彼此联系的方式。现在我们有了新的创意工具,可以创建和分享自定义贴纸,或者通过简单的文本提示更新照片的视觉风格。与28个不同的AI聊天,获取有关旅行、游戏和食物等主题的独特观点。这些新体验将帮助您享受乐趣,建立联系并学到新的东西。个人助手与M…
-
完全由 GPT4提示词驱动的文字模拟游戏:人生重来模拟器 LifeReloaded
midjourney提示词:Life Reloaded –ar 16:9 人生重来模拟器是一个使用GPT-4 Advanced Data Analysis功能驱动的交互式模拟人生游戏。游戏内容由顶尖人工智能GPT4实时生成,给玩家带来丰富多彩的真实人生体验。游戏中包括文学和人工智能的完美融合,利用心理学塑造角色,以及多元宇宙和开源社区等特点。 玩家可以通过复制粘贴游…
-
一起看看ChatGPT多模态功能亮相后实际应用情况如何
OpenAI宣布在ChatGPT中推出了新的语音和图像功能。语音功能使ChatGPT成为用户的语音助手,可以随时与用户交谈并响应指令。图像理解功能使ChatGPT能够分析图像中的信息并给出相应结论。这些功能将在接下来的两周内向ChatGPT Plus和ChatGPT Enterprise用户推出。OpenAI还计划将类似功能推向更大规模的用户群体。 ChatGPT 的多模态就这…
-
OpenAI官网刚刚公布了ChatGPT多模态的能力Demo,预计两周内plus和企业用户就能用上
官网文章地址: https://openai.com/blog/chatgpt-can-now-see-hear-and-speak 内容:我们开始在ChatGPT中推出新的语音和图像功能。这些功能通过允许您进行语音对话或向ChatGPT展示您正在谈论的内容,提供了一种新的、更直观的界面。 语音和图像为您在生活中使用ChatGPT提供了更多方式。在旅行时拍摄地标的照片,进行实时…
-
midjourney不同关键词下的人物肖像照的变化
示例: portrait photo of a chinese women,「核心词」–ar 2:3 一个中国女人的肖像照片 如果直接用这个,不加特定描述词, portrait photo of a chinese women –ar 2:3 效果如下: 加一个现实主义「realism」 portrait photo of a chinese women…