AI 共存派

  • 百度宣布文心大模型ERNIE Speed、ERNIE Lite全面免费

    百度智能云宣布免费开放ERNIE Speed和ERNIE Lite两大主力模型,ERNIE Speed为高性能大语言模型,适合精调处理特定场景问题;ERNIE Lite为轻量级大语言模型,适合低算力AI加速卡推理使用。

    2024年5月21日
  • a16z:AI 的二阶效应

    a16z 应用(Apps)基金的 GP Alex Rampell 最近写了一篇文章:AI 的二阶效应。 这篇文章提到了一个非常有意思的观点,那就是 AI 除了直接成为产品的一部分提高生产力外,它还会极大的帮助大量和 AI 没关系的产品,也就是其所说的二阶效应。 Alex 给出了一道数学题:一名优秀的销售人员一年可以销售 50 个小部件,年收入 10 万美元,并且不接受降薪。现在…

    2024年5月21日
  • 从任意数量的图像生成一致的高质量3D新视图只需要1分钟的CAT3D

    CAT3D是一种用于创建任何物体的3D方法,通过模拟真实世界的捕捉过程,使用多视角扩散模型生成高度一致的新视图。这些生成的视图可以用作强大的3D重建技术的输入,以实时渲染任何视角的3D表示。CAT3D可以在一分钟内创建完整的3D场景,并优于现有的单图像和少视角3D场景创建方法。 项目地址: https://cat3d.github.io/index.html  

    2024年5月18日
  • Google发布Gemini 1.5 Pro 和 Gemini 1.5 Flash 150页技术报告

    报告详细介绍了Gemini 1.5 Pro和 Gemini 1.5 Flash的性能特点和架构 同时也介绍了Gemini 1.5 Pro模型架构改进情况 Gemini 1.5 Pro采用了稀疏专家混合(MoE)架构,使用学习路由功能,允许模型在计算效率和性能之间找到最佳平衡。 这种方法允许模型根据输入的特性动态选择和激活特定的参数子集进行处理,而不是使用所有参数。 Gemini…

    2024年5月18日
  • OpenAI 发布AI 模型 GPT-4o,语音对话很丝滑,还免费

    OpenAI 欣然宣布推出旗下最新顶尖生成式 AI 模型——GPT-4o,“o”代表“omni”,凭借其Omni(全能)之名。该模型将逐步融入OpenAI各项产品中,让用户在未来几周内逐步感受其强大之处。最令人振奋的消息是,GPT-4o将向所有用户免费开放 1. **多模态交互能力**:GPT-4o 能够处理文本、音频和图像的任意组合输入,并生成对应的任意组合输出,这使得它在交…

    2024年5月14日
  • 号称最强的 RAG Search API的Trieve开源,支持向量/全文检索、混合检索等

    Trieve是一款强大的RAG Search API,支持数据摄入、全栈搜索、推荐和LLM答案生成。支持开源嵌入/推理模型、向量/全文检索、混合检索,私有化部署和API访问,以及配套的Search UI组件。 重点评论:1. Trieve提供私有化部署、语义搜索、关键字/全文检索、混合检索等多种特性。2. Trieve支持推荐、Filter检索,以及通过OpenRouter提供…

    2024年5月11日
  • Phi-3 WebGPU: 在浏览器中本地运行Phi-3

    您即将加载Phi-3-mini-4k-instruct,这是一个38.2亿参数的LLM,专为在网络上进行推断而进行优化。一旦下载完成,该模型(2.3 GB)将被缓存并在您重新访问页面时被重用。 一切都直接在您的浏览器中运行,使用 Transformers.js和ONNX Runtime Web,这意味着您的对话不会被发送到服务器。甚至在模型加载后您可以断开与互联网的连接!. P…

    2024年5月11日
  • AniTalker:通过静态的肖像画和输入音频,生成生动多样的面部说话视频

    AniTalker是一个创新的框架,它能够将单一静态肖像和输入的音频转换成具有自然流畅动作的动画说话视频。以下是该产品的主要特征的归纳总结: 1. **面部动态捕捉**:AniTalker能够捕捉到广泛的面部动态,包括微妙的表情和头部动作。 2. **通用运动表示**:该框架使用一种通用的运动表示方法,与仅关注口头线索(如唇部同步)的现有模型不同,AniTalker能够更全面地…

    2024年5月11日
  • faceswap:一个换脸工具,支持图片和视频(可免费用)

    利用免费的即时换脸技术,轻松创建和分享个性化、搞笑的视频和照片。 支持图片和视频,视频最长支持60秒。 图片效果很好,视频的话别太复杂就行。 支持视频中多个人脸识别和分别替换每个人脸。 可以玩一下~ 体验网址:https://faceswap.so/

    2024年5月11日
  • 彭博社 Emily Change 采访李飞飞:顶级研究员李飞飞谈人工智能的前景与危险

    欢迎李飞飞博士登台,她是斯坦福大学计算机科学 Sequoia 教授,人工智能中心联合主任。 “AI 教母”称号的感受 Emily Chang: 李博士被誉为人工智能的教母。你对这个称号有何感想?这是我要提的第一个问题。 李飞飞:Emily,我自己从未自称为任何事情的教母,但当我被授予这个头衔时,我确实停下来思考了一下,我想,如果男性可以被称为某事的教父,那么女性也可以,所以我完…

    2024年5月10日