AI 共存派

OpenAI官网刚刚公布了ChatGPT多模态的能力Demo，预计两周内plus和企业用户就能用上

官网文章地址： https://openai.com/blog/chatgpt-can-now-see-hear-and-speak 内容：我们开始在ChatGPT中推出新的语音和图像功能。这些功能通过允许您进行语音对话或向ChatGPT展示您正在谈论的内容，提供了一种新的、更直观的界面。语音和图像为您在生活中使用ChatGPT提供了更多方式。在旅行时拍摄地标的照片，进行实时…

2023年9月25日

midjourney不同关键词下的人物肖像照的变化

示例： portrait photo of a chinese women,「核心词」–ar 2:3 一个中国女人的肖像照片如果直接用这个，不加特定描述词， portrait photo of a chinese women –ar 2:3 效果如下：加一个现实主义「realism」 portrait photo of a chinese women…

2023年9月25日 • Midjourney

应用

开源软件FaceFusion，不止换脸，还可以自定义调整面部特征

一个名为FaceFusion的开源软件。这个软件可以在手机或电脑上进行换脸游戏，并且可以自定义调整面部特征。新版1.1.0还增加了摄像头功能，让用户可以实时看到换脸的效果。此外，这个软件还有许多定制选项和参数供用户调整。项目地址： https://github.com/facefusion/facefusion 不会安装的可以去他们官方的dis频道： https://disc…

2023年9月25日

模型框架

创新生成模型CoDi：能够从任何组合的输入模态生成任何组合的输出模态

内容：北卡罗来纳大学教堂山分校和微软Azure认知服务研究团队在微软实习期间开发了一种名为Composable Diffusion (CoDi)的创新生成模型。CoDi能够从任何组合的输入模态（如语言、图像、视频或音频）生成任何组合的输出模态。CoDi的输入不仅限于文本或图像，它可以并行生成多种模态。尽管许多模态组合的训练数据集不存在，但我们提出在输入和输出空间内对模态进行对齐…

2023年9月25日

应用

ChatGPT API 水龙头：每24小时可领取一个令牌用于开发测试 AI 产品

这个名为「ChatGPT API 水龙头」的项目，每 24 小时可免费领取一个 1 美元的 OpenAI API 使用额度。项目地址： https://faucet.openkey.cloud/ git地址： https://github.com/terobox/ChatGPT-API-Faucet 输入邮箱，验证后，即可使用，强烈建议仅用于产品测试，不要拿人家这个撸羊…

2023年9月25日

Stable Diffusion

试试用这个开源项目用Stable Diffusion 做 Gif

看了下效果，还挺不错的~ 代码地址： https://github.com/Kosinkadink/ComfyUI-AnimateDiff-Evolved 来源：https://mp.weixin.qq.com/s/iX5mw5cH7fVpoFTBRsXGhQ

2023年9月25日

AI视频生成解决方案Rerender A Video已开源

内容：SIGGRAPH Asia 2023会议上，研究人员提出了一种名为“Rerender A Video: Zero-Shot Text-Guided Video-to-Video Translation”的新框架，用于将图像模型适应到视频中。这个框架包括两个部分：关键帧翻译和完整视频翻译。首先，通过改进的扩散模型生成关键帧，并应用分层跨帧约束以保证形状、纹理和颜色的一致性。…

2023年9月25日 • 模型框架