AI 共存派
-
GPTs 提示词模板…
Act like a [Specify a role]你应该像[指定角色]一样操作 I need a [What do you need?]我需要一个 [你需要什么?] you will [Enter a task]您将 [输入任务] in the process, you should [Enter details]在此过程中,你应该 [输入详细信息] Please [Ent…
-
字节研究院发布视频控制方式Boximator,可以精确控制物品结束运动的位置
这种控制方式比Runway的运动笔刷更进一步,你可以精确控制物品结束运动的位置。 演示中使用的视频模型也是字节研发的PixelDance视频生成模型。 项目简介: 我们提出了Boximator,这是一种用于精细运动控制的新方法。Boximator采用了两种约束机制:硬性约束(hard box)和软性约束(soft box)。 用户可以利用硬性约束选取视频中某一帧(称为条件帧)的…
-
苹果开源名为多模态大语言模型引导的编辑(MGIE),可通过指令修改图片
苹果发布了一项名为多模态大语言模型引导的编辑(MGIE)的新技术,该技术可以帮助用户通过自然语言指令来修改图片,使得编辑图片变得更加简单和自然。 MGIE利用多模态大型语言模型(MLLMs)生成图像编辑指令,并通过端到端训练来捕捉视觉想象力并执行图像处理操作。该方法在ICLR’24上获得了Spotlight成果。 多模态大语言模型引导的编辑技术(MGIE)不仅可以帮…
-
YC 公布了他们今年投资的 100 家 AI 初创公司,大部分都是2-4人小公司
它们在不同领域应用了生成式人工智能技术。这些公司的产品和服务涵盖了各个行业,包括内容创作、视频制作、教育、金融、医疗、游戏等。它们利用人工智能技术帮助用户提高工作效率、创造更好的用户体验,并解决各种实际问题。这些初创公司的目标是通过创新的人工智能解决方案推动行业的发展。 原文地址: https://www.ycombinator.com/companies/industry/g…
-
好文分享:《大淘宝设计部2023年度AI设计实践报告》
这篇内容总结了大淘宝设计团队在过去一年中对AI技术的实践心得。他们发现AI工具带来了降本增效,提高了创意效果和设计方案的达成。AI工具改变了设计工作流程,提升了设计师的角色和能力。通过AI的应用,设计团队在品牌设计、营销设计、互动玩法等多个领域取得了显著的效果。未来,设计师需要不断学习和适应新工具,优化工作流程,以应对不断变化的需求。 原文地址: https://mp.weix…
-
ML Blocks:让用户可以轻松创建复杂的图像处理工作流,无需编写代码
该工具提供了一个简单易用的界面,让用户可以轻松创建复杂的图像处理工作流,无需编写代码。 用户只需要将不同的功能块组合在一起,例如图像编辑功能和AI模型,就可以实现个性化的图像自动化处理。 这个工具主要解决电商领域中批量处理图片的问题。 ML Blocks允许用户创建自定义的图像处理工作流,可以处理多步骤的图像生成或分析管道,使用基于图的工作流。用户只需要按照顺序连接几个块,比如…
-
到底怎么给自己做一个独一无二的微信红包封面?免费教程来咯~
分享几个可以用Midjourney画龙年微信红包封面的提示词 前几天发了一篇这个,同时这几天免费送出去了大约三万个红包封面,很多人依然没有领到,甚至愿意花钱购买。 今天这篇主要是来给大家一个思路,怎么给自己做一个独一无二的?按照微信惯例,往往在过年之前,它都会给普通人一些免费的封面额度(包括视频会用户),比如10个或者20个之类的,通过我这个方法,你可以快速做一张封面图上传,审…
-
谷歌计划对其产品Bard进行一系列重大改变,包括更名为Gemini
谷歌计划对其产品巴德进行一系列重大改变,包括更名为Gemini。消息源自安卓应用程序开发人员Dylan Roussel泄露的变更日志。 文档中明确表示:“巴德现在是Gemini”,表明巴德将更名为谷歌去年推出的新模型Gemini,该模型旨在与OpenAI的GPT-4进行竞争。 据透露,谷歌将首次推出Gemini语音聊天,并引入新的“Ultra1.0”模型,其中包括名为“Gemi…
-
Meta提出了一种名为AudioSeal的技术,该技术能够在人工智能生成的语音中嵌入隐形水印
Meta的研究人员在对抗合成语音的挑战中取得了一项重大突破。他们提出了一种名为AudioSeal的技术,该技术能够在人工智能生成的语音中嵌入隐形水印,用于主动检测AI生成的言论,同时还能够识别生成它的具体模型。 人工智能语音合成技术的迅速发展使得虚构的人类语音变得极为逼真。然而,这也引发了对声音克隆、深度伪造和其他形式的音频操纵的担忧。为了有效区分真实录音和音频深度伪造,需要强…
-
OpenAI推出适用于Apple Vision Pro的ChatGPT应用
OpenAI近日发布了一款名为ChatGPT for Vision Pro的应用程序,使用户能够通过文本、图片和语音与Apple Vision Pro进行多模态AI交互。这标志着OpenAI在人机交互领域迈出了重要一步,展示了AI对人类的潜在影响。ChatGPT成为了visionOS的首批应用之一,利用Apple Vision Pro操作系统提供了无缝、沉浸式的数字内容体验。该…