AI 共存派

  • Meta 发布号称是最强大的开源大语言模型:Llama 3

    Meta 公司发布了新闻稿,宣布推出下一代大语言模型 Llama 3,共有 80 亿和 700 亿参数两种版本,号称是最强大的开源大语言模型。Llama 3 具有更强的推理能力和服从指令能力,并且能够处理文本、图片和视频。Meta 公司还发布了新的信任和安全工具,即将在 Facebook、Instagram、WhatsApp 等应用中整合 Llama 3。 地址: https:…

    2024年4月19日
  • Stable Diffusion 3 的 API 版本正式发布

    Stable AI宣布了Stable Diffusion 3和Stable Diffusion 3 Turbo在Stability AI开发者平台API上的可用性。 1. **模型性能**:Stable Diffusion 3在排版和提示遵循性方面,根据人类偏好评估,与DALL-E 3和Midjourney v6等最先进的文本到图像生成系统相当或更优。 2. **架构更新**:…

    2024年4月17日
  • AI换装MagicClothing:实现可控的换装效果

    MagicClothing这个AI换装的演示效果确实很强大。它基于潜在扩散模型(LDM)开发的新型网络架构,专门处理服装驱动的图像合成任务。通过服装特征提取器和自注意力融合技术,能够保留服装细节并忠实于文本提示,确保生成的角色穿着定制的服装。同时,采用联合无分类器指导技术平衡服装特征和文本提示的影响,提高生成图像的多样性和可控性。此外,还提出了一种新型评估指标MP-LPIPS用…

    2024年4月17日
  • 斯坦福大学近日发布《2024年AI指数报告》(AI Index Report 2024)

    2024年AI指数报告是迄今为止最全面的一份报告,涵盖了AI技术进展、公众对技术的看法以及其对社会的影响等重要趋势。报告显示,AI在某些任务上已经超越了人类,但在一些更复杂的任务上仍有差距。同时,美国在AI领域的领先地位进一步加强,但对AI的监管和规范仍存在挑战。总体来说,AI对劳动力的生产力和工作质量有积极影响,但也存在着一些潜在风险和挑战。 报告地址: AI Index R…

    2024年4月17日
  • MiniMax发布万亿MoE模型abab 6.5,包含abab 6.5和abab 6.5s两个模型

    国内 AI 初创企业 MiniMax正式推出abab 6.5系列模型,包含abab 6.5和abab 6.5s两个模型。万亿MoE模型abab 6.5支持200k tokens的上下文长度,在各类核心能力测试中,开始接近GPT-4、Claude 3 Opus、Gemini 1.5 Pro等世界领先的大语言模型的性能。abab 6.5s跟abab 6.5使用了同样的训练技术和数据…

    2024年4月17日
  • 文本生成声音效果的AI工具:Optimizer AI

    1、声音效果生成:用户可以利用这个平台生成适用于多种应用场景的声音效果,比如游戏中的射击声、跳跃声,动画中的雨声环境,以及视频中的地铁到站声音等。 – 变声:能够基于一个参考声音生成多个类似的声音。 – 风格标签:许用户通过指定风格标签(如卡通、恐怖、8位等)来引导不同风格声音生成 – 背景音乐或氛围声:生成用于背景音乐或创建特定氛围的声音。…

    2024年4月16日
  • 可识别图像中文字并转换为可编辑文本的工具:2txt

    2txt是一个基于AI的图像转文字工具,使用Claude Haiku和Vercel AI SDK创建。它可以快速准确地识别图片中的文字,并转换成可编辑的文本格式。通过这个工具,用户可以方便地从图像中提取文字,提高工作效率。 项目地址: https://github.com/ai-ng/2txt

    2024年4月16日
  • 什么是𝗥𝗔𝗚 ?一个基于 RAG 的简单聊天机器人示例,用于查询您的私人知识库

    什么是𝗥𝗲𝘁𝗿𝗶𝗲𝘃𝗮𝗹 𝗔𝘂𝗴𝗺𝗲𝗻𝘁𝗲𝗱 𝗚𝗲𝗻𝗲𝗿𝗮𝘁𝗶𝗼𝗻 ( 𝗥𝗔𝗚 ) 𝗦𝘆𝘀𝘁𝗲𝗺𝘀 ? 以下是一个基于 RAG 的简单聊天机器人示例,用于查询您的私人知识库。 第一步是以适合查询的格式存储内部文档的知识。我们通过使用嵌入模型嵌入它来做到这一点: 𝟭 :将整个知识库的文本语料库分割成块——一个块将代表可查询的单个上下文。感兴趣的数据可以来自多个来源,例如 Conf…

    2024年4月15日
  • AI Agent 应该更有趣还是更有用?

    原文: https://01.me/2024/03/ai-agents-entertaining-or-useful/ 这篇文章探讨了AI Agent的发展方向,主要围绕“有趣”与“有用”两个维度进行讨论,并提出了构建一个既有趣又有用的AI Agent的可能性和挑战。以下是文章的重点归纳: 1. **AI Agent的两个发展方向**:– 有趣的AI:更像人的AI,…

    2024年4月15日
  • 360 开源了 360 智脑 7B(70 亿参数模型)支持 50 万字长文本输入

    360 公司日前在 GitHub 上开源了 360 智脑 7B(70 亿参数模型)。360 智脑大模型采用 3.4 万亿 Tokens 的语料库训练,以中文、英文、代码为主,开放 4K、32K、360K 三种不同文本长度。360 表示,360K(约 50 万字)是当前国产开源模型文本长度最长的。 地址: https://github.com/Qihoo360/360zhinao

    2024年4月13日