-
量子位:2023中国AIGC产业全景报告
报告指出,AIGC有狭义和广义概念之分。 狭义的AIGC与普通用户更为贴近,更关注图像、文本、音频、视频等内容生成,和Generative AI(生成式AI) 、Synthetic…
-
Meta 发布号称是最强大的开源大语言模型:Llama 3
Meta 公司发布了新闻稿,宣布推出下一代大语言模型 Llama 3,共有 80 亿和 700 亿参数两种版本,号称是最强大的开源大语言模型。Llama 3 具有更强的推理能力和服…
-
Stable Diffusion 3 的 API 版本正式发布
Stable AI宣布了Stable Diffusion 3和Stable Diffusion 3 Turbo在Stability AI开发者平台API上的可用性。 1. **模型…
-
AI换装MagicClothing:实现可控的换装效果
MagicClothing这个AI换装的演示效果确实很强大。它基于潜在扩散模型(LDM)开发的新型网络架构,专门处理服装驱动的图像合成任务。通过服装特征提取器和自注意力融合技术,能…
-
斯坦福大学近日发布《2024年AI指数报告》(AI Index Report 2024)
2024年AI指数报告是迄今为止最全面的一份报告,涵盖了AI技术进展、公众对技术的看法以及其对社会的影响等重要趋势。报告显示,AI在某些任务上已经超越了人类,但在一些更复杂的任务上…
-
MiniMax发布万亿MoE模型abab 6.5,包含abab 6.5和abab 6.5s两个模型
国内 AI 初创企业 MiniMax正式推出abab 6.5系列模型,包含abab 6.5和abab 6.5s两个模型。万亿MoE模型abab 6.5支持200k tokens的上…
-
文本生成声音效果的AI工具:Optimizer AI
1、声音效果生成:用户可以利用这个平台生成适用于多种应用场景的声音效果,比如游戏中的射击声、跳跃声,动画中的雨声环境,以及视频中的地铁到站声音等。 – 变声:能够基于一…
-
可识别图像中文字并转换为可编辑文本的工具:2txt
2txt是一个基于AI的图像转文字工具,使用Claude Haiku和Vercel AI SDK创建。它可以快速准确地识别图片中的文字,并转换成可编辑的文本格式。通过这个工具,用户…
-
什么是𝗥𝗔𝗚 ?一个基于 RAG 的简单聊天机器人示例,用于查询您的私人知识库
什么是𝗥𝗲𝘁𝗿𝗶𝗲𝘃𝗮𝗹 𝗔𝘂𝗴𝗺𝗲𝗻𝘁𝗲𝗱 𝗚𝗲𝗻𝗲𝗿𝗮𝘁𝗶𝗼𝗻 ( 𝗥𝗔𝗚 ) 𝗦𝘆𝘀𝘁𝗲𝗺𝘀 ? 以下是一个基于 RAG 的简单聊天机器人示例,用于查询您的私人知识库。 第一…
-
AI Agent 应该更有趣还是更有用?
原文: https://01.me/2024/03/ai-agents-entertaining-or-useful/ 这篇文章探讨了AI Agent的发展方向,主要围绕“有趣”与…