AI 共存派

  • Jina AI Reader可一键从网页抓取PDF,不用下载提交

    Jina AI 宣布其 Reader 工具现在能够从任意 URL 读取 PDF 文件,并快速解析成文本,供下游的语言模型(LLM)使用。 (普通网页内容也可以,以 musesai.io为例,在体验页面那个demo 的地方输入任意网页点击“Fetch Content”即可。) 体验地址: https://jina.ai/reader/ 还开源: https://github.co…

    2024年5月31日
  • ToonCrafter:可自动生成卡通动画的中间帧 ,并根据参考图像对动画草图自动上色

    ToonCrafter,它可以通过预训练的图像到视频扩散先验来插值两幅卡通图像。项目支持生成512×320分辨率的视频,推荐使用Anaconda安装环境并通过命令行或本地Gradio演示进行推理。需要注意的是,由于生成视频先验的多样性,成功率并不保证。 ToonCrafter 通过生成性插值方法,在卡通动画帧之间生成自然、连贯的中间帧。能够处理复杂的非线性运动和遮挡问…

    2024年5月31日
  • a16z 发布了关于语音 Agents 的报告:B2B 和 B2C 两个场景下语音 Agents 存在的机会

    B2C 语音 Agents 产品的机会: – 他们对那些对语音如何为产品带来独特价值有明确看法的产品和创始人感兴趣——而不仅仅是“为了语音而语音”。 – 虽然语音难以使用,但实时语音更难。所以创始人需要有明确的认知,认为自己的产品需要使用实时语音。 – 他们怀疑最后的产品形态不会是先前人类对人类对话的直接复刻,需要利用AI更好地(更有效率、更…

    2024年5月31日
  • 视频虚拟试穿的框架:ViViD,解决视频虚拟试穿的问题

    可以合成自然、逼真的视频,保留目标服装的身份,同时保持源视频其余部分不变 项目地址: https://github.com/novitalabs/AnimateAnyone 论文地址: https://arxiv.org/pdf/2405.11794 这篇论文介绍了一种名为ViViD的视频虚拟试穿技术,通过强大的扩散模型来实现视频虚拟试穿。他们提出了一种新的架构,利用扩散模型生…

    2024年5月31日
  • Perplexity AI推出Perplexity Pages,可以将你的答案一键生成博客、文章

    根据Perplexity官方博客的介绍,Perplexity推出了一项名为”Pages”的新功能。 Pages功能概述 Pages利用Perplexity的AI搜索模型查找相关信息,然后基于用户提供的提示生成一个可定制的网页报告。用户可以指定报告的主题或想要了解的内容,并选择面向初学者、专家读者或一般受众。 Perplexity会搜索信息,然后将信息分成…

    2024年5月31日
  • 腾讯正式推出了全新的AI助手App腾讯元宝,集成了AI搜索、AI总结、AI写作等强大功能

    腾讯元宝的亮点在于其出色的解析能力。无论是多个微信公众号链接、网址,还是PDF、Word、txt等多种格式的文档,它都能一次性进行深度解析。此外,其超长的上下文窗口设计,使得在处理复杂信息时更加得心应手。 在功能强大的同时,腾讯元宝也非常注重用户体验。它提供了口语陪练等多个特色AI应用,让用户在轻松愉快的氛围中提升口语能力。 它还新增了创建个人智能体的功能,用户只需简单操作,即…

    2024年5月30日
  • 黑客发布了一款名为 “GODMODE GPT” 的破解版 ChatGPT

    黑客发布了一款名为 “GODMODE GPT” 的破解版 ChatGPT。今天早些时候,一位自称为 “Pliny the Prompter” 的白帽黑客和 AI 红队成员在 X-formerly-Twitter 上宣布了这款 ChatGPT 的破解版本的发布,自豪地宣称 OpenAI 最新的大型语言模型 GPT-4o 已经摆脱了限…

    2024年5月30日
  • Mistral发布首个用于编码的生成式人工智能模型—Codestral,支持 Python 等 80 多种语言

    法国人工智能初创公司Mistral发布了Codestral,这是一个用于编码的生成式人工智能模型,支持多种编程语言。虽然模型在一些测试中表现优异,但其实际价值和可靠性仍有待观察。其他研究指出,AI开发工具可能导致错误代码被提交,而一些AI模型在编程问题上的回答存在错误。Mistral计划将Codestral整合到多个应用框架和开发环境中。 Codestral 可以熟练使用 80…

    2024年5月30日
  • 免费ChatGPT用户也可以用GPTs了,数据分析、图表创建、视觉、文件上传等

    免费 ChatGPT 用户现在可以使用一些之前仅对付费用户开放的功能,例如GPTs、分析图表、询问有关照片的问题以及5月初通过 GPT-4o 添加的其他功能。但他们无法创建自己的 GPT。 体验地址: https://chatgpt.com/gpts

    2024年5月30日
  • 免费 AI 作图工具:Adobe Firefly,文字生成图片,生成音频视频等

    Firefly是Adobe推出的新创意生成AI模型系列,专注于图像和文本效果生成,提供新的构思、创作和沟通方式,改善创意工作流程。Firefly是Adobe技术的延伸,旨在让人们能够将想法完全实现。该工具目前处于测试阶段,输入内容需合规,输出内容不能商用。Firefly提供去除/填充、文本特效、更换logo着色等功能,速度快且免费试用。 体验地址: https://firefl…

    2024年5月29日