AI 共存派

  • Controlnet 作者新项目 Omost ,帮你更好的理解现有图像模型的提示词

    controlnet作者张吕敏公开了新项目, Omost:一个将 LLM 的编码能力转换为图像生成(或更准确地说,图像合成)能力的项目。 Omost是一个将LLM的编码能力转换为图像生成(或更准确地说是图像合成)能力的项目。 Omost(发音:almost)这个名字有两个意思:1)每次使用Omost后,你的图像几乎已经完成;2)O代表“omni”(多模态),most表示我们希望…

    2024年6月3日
  • 百度的AI原生应用“橙篇”,定位长文AI理解模型

    百度表示,橙篇可利用AI技术,帮助用户对超大量、超多格式、超长内容的文件进行深入理解、精准总结与即时问答。橙篇还支持超长篇幅的长文生成、深度编辑以及多模态的自由创作,极大地丰富了用户的内容创作手段。 据悉,橙篇的研发依托于百度文库庞大的12亿内容积累,同时结合了20万的精调数据、1.4亿用户的行为数据反馈以及上百项尖端AI技术。 体验地址: https://cp.baidu.c…

    2024年6月3日
  • AI 音频模型elevenlabs.io:可以根据文本提示生成音效、短乐器曲目、音景和各种人物声音

    每个人都可以使用ElevenLabs的工具将文本转换为声音。你可以输入你想听到的内容。它可以制作音效,短歌,背景噪音,以及角色的声音! 文本转音效现已推出。我们最新的 AI 音频模型可以根据文本提示生成音效、短乐器曲目、音景和各种人物声音。现在可供所有用户使用。 从内容创作者、视频游戏开发者到电影和电视工作室,每个人都会使用音效来创作丰富而身临其境的内容。现在,除了 AI 配音…

    2024年6月1日
  • Jina AI Reader可一键从网页抓取PDF,不用下载提交

    Jina AI 宣布其 Reader 工具现在能够从任意 URL 读取 PDF 文件,并快速解析成文本,供下游的语言模型(LLM)使用。 (普通网页内容也可以,以 musesai.io为例,在体验页面那个demo 的地方输入任意网页点击“Fetch Content”即可。) 体验地址: https://jina.ai/reader/ 还开源: https://github.co…

    2024年5月31日
  • ToonCrafter:可自动生成卡通动画的中间帧 ,并根据参考图像对动画草图自动上色

    ToonCrafter,它可以通过预训练的图像到视频扩散先验来插值两幅卡通图像。项目支持生成512×320分辨率的视频,推荐使用Anaconda安装环境并通过命令行或本地Gradio演示进行推理。需要注意的是,由于生成视频先验的多样性,成功率并不保证。 ToonCrafter 通过生成性插值方法,在卡通动画帧之间生成自然、连贯的中间帧。能够处理复杂的非线性运动和遮挡问…

    2024年5月31日
  • a16z 发布了关于语音 Agents 的报告:B2B 和 B2C 两个场景下语音 Agents 存在的机会

    B2C 语音 Agents 产品的机会: – 他们对那些对语音如何为产品带来独特价值有明确看法的产品和创始人感兴趣——而不仅仅是“为了语音而语音”。 – 虽然语音难以使用,但实时语音更难。所以创始人需要有明确的认知,认为自己的产品需要使用实时语音。 – 他们怀疑最后的产品形态不会是先前人类对人类对话的直接复刻,需要利用AI更好地(更有效率、更…

    2024年5月31日
  • 视频虚拟试穿的框架:ViViD,解决视频虚拟试穿的问题

    可以合成自然、逼真的视频,保留目标服装的身份,同时保持源视频其余部分不变 项目地址: https://github.com/novitalabs/AnimateAnyone 论文地址: https://arxiv.org/pdf/2405.11794 这篇论文介绍了一种名为ViViD的视频虚拟试穿技术,通过强大的扩散模型来实现视频虚拟试穿。他们提出了一种新的架构,利用扩散模型生…

    2024年5月31日
  • Perplexity AI推出Perplexity Pages,可以将你的答案一键生成博客、文章

    根据Perplexity官方博客的介绍,Perplexity推出了一项名为”Pages”的新功能。 Pages功能概述 Pages利用Perplexity的AI搜索模型查找相关信息,然后基于用户提供的提示生成一个可定制的网页报告。用户可以指定报告的主题或想要了解的内容,并选择面向初学者、专家读者或一般受众。 Perplexity会搜索信息,然后将信息分成…

    2024年5月31日
  • 腾讯正式推出了全新的AI助手App腾讯元宝,集成了AI搜索、AI总结、AI写作等强大功能

    腾讯元宝的亮点在于其出色的解析能力。无论是多个微信公众号链接、网址,还是PDF、Word、txt等多种格式的文档,它都能一次性进行深度解析。此外,其超长的上下文窗口设计,使得在处理复杂信息时更加得心应手。 在功能强大的同时,腾讯元宝也非常注重用户体验。它提供了口语陪练等多个特色AI应用,让用户在轻松愉快的氛围中提升口语能力。 它还新增了创建个人智能体的功能,用户只需简单操作,即…

    2024年5月30日
  • 黑客发布了一款名为 “GODMODE GPT” 的破解版 ChatGPT

    黑客发布了一款名为 “GODMODE GPT” 的破解版 ChatGPT。今天早些时候,一位自称为 “Pliny the Prompter” 的白帽黑客和 AI 红队成员在 X-formerly-Twitter 上宣布了这款 ChatGPT 的破解版本的发布,自豪地宣称 OpenAI 最新的大型语言模型 GPT-4o 已经摆脱了限…

    2024年5月30日