模型框架

  • MagicTime:可以生成延时视频的模型

    MagicTime:可以生成延时视频的模型MagicTime:可以生成延时视频的模型MagicTime:可以生成延时视频的模型MagicTime:可以生成延时视频的模型

    1. **项目背景**:– MagicTime是由北京大学、罗切斯特大学、新加坡国立大学、广东工业大学和加州大学圣克鲁斯分校共同研发的项目。– 该项目旨在生成高质量的变化时延视频(metamorphic videos),这些视频能够展示物体随时间变化的过程。 2. **研究问题**:– 现有的文本到视频生成(Text-to-Video, T2…

    2024年4月10日 模型框架
  • Mistral AI 开源了 Mistral 8X22B 模型,发布磁力链(262 GB)

    地址: magnet:?xt=urn:btih:9238b09245d0d8cd915be09927769d5f7584c1c9&dn=mixtral-8x22b&tr=udp%3A%2F%http://2Fopen.demonii.com%3A1337%2Fannounce&tr=http%3A%2F%http://2Ftracker.opentrac…

    2024年4月10日
  • 谷歌推出 Gemini 1.5 Pro 公共预览版 ,支持处理音频

    根据提供的网页内容,以下是对谷歌Gemini 1.5 Pro模型免费开放的归纳总结: 1. **对外开放**:谷歌的最强大模型Gemini 1.5 Pro已经全面对外开放,目前完全免费供开发者和普通用户使用。 2. **使用方式**:开发者可以通过API调用的方式使用Gemini 1.5 Pro,而普通用户可以直接在谷歌AI Studio中体验该模型。 3. **音频理解功能*…

    2024年4月10日
  • OpenAI 向开发人员提供具有视觉能力 GPT-4 Turbo with Vision

    根据提供的网页内容,以下是对OpenAI发布GPT-4-Turbo正式版的归纳总结: 1. **产品发布**:OpenAI发布了GPT-4-Turbo的正式版,这是一个经过改进的人工智能模型,之前一直以预览版的形式提供给用户。 2. **模型访问**:用户可以通过“gpt-4-turbo”这一名称来访问和使用这个模型,其最新版本为“gpt-4-turbo-2024-04-09”…

    2024年4月10日
  • 用于3D重建和生成的大型高斯重建模型GRM:少量图片能在短时间内构建出物体的3D模型或整个场景

    该内容介绍了一种名为GRM的大规模重建器,能够从稀疏视图图像中恢复3D模型。GRM是一种基于Transformer的前馈模型,能够有效地将输入像素转化为像素对齐的高斯函数,从而创建一组表示场景的密集分布的3D高斯函数。该方法在重建质量和效率方面表现出优势,并展示了在生成任务中的潜力。该项目得到了Google、三星和瑞士博士后流动奖学金的支持。 项目地址: https://jus…

    2024年4月2日
  • 苹果研究人员开发了一种新的AI系统ReALM,模型性能优于GPT-4

    近日,苹果研究人员开发了一种新的AI系统ReALM,该系统可以理解屏幕上实体、对话和背景上下文的模糊引用,从而实现与语音助手的更自然的交互。ReALM的一项关键创新是使用解析的屏幕上实体及其位置来重建屏幕,以生成捕获视觉布局的文本内容。研究人员证明,这种方法与专门用于参考解析的微调语言模型相结合,可以在该任务上优于GPT-4。苹果研究人员在论文中写道:“让用户能够对屏幕上看到的…

    2024年4月2日
  • Inflection公司推出了其最新版本的个人人工智能助手Pi,名为Inflection-2.5。这个升级版的模型在性能上与全球领先的大型语言模型(LLMs)如GPT-4和Gemini相竞争,同时保留了Pi特有的个性和独特的共情微调。Inflection-2.5现在向所有Pi用户开放,可以在pi.ai网站、iOS和Android应用以及新的桌面应用上使用。 Inflection…

    2024年3月7日
  • AI芯片创企Groq推出了Mixtral 8x7B API,采用自研AI芯片 推理速度超英伟达GPU十倍

    近日,AI芯片创企Groq推出了Mixtral 8x7B API,据AI模型和托管提供商ArtificialAnalysis.ai的测评数据,该接口创下了新的大模型吞吐量记录,达到每秒430 Tokens。Groq还提供Llama2 7B模型访问,最高可实现每秒750 Tokens。据介绍,Groq平台基于其自研LPU(语言处理单元)芯片运行,该芯片在大模型推理任务上速度是英伟…

    2024年2月20日
  • OpenAI推出文本到视频生成器Sora,根据文字描述创建长达60秒的视频,非常适合重现梦境

    如果你以为OpenAI Sora只是像DALLE那样的创意玩意儿,那你就需要重新思考了。Sora是一个数据驱动的物理引擎,它能模拟各种世界,无论是现实的还是虚构的。这个模拟器通过去噪技术和梯度计算来学习复杂的渲染、直观物理、长期推理和语义基础。 如果说Sora使用了虚幻引擎5来训练大量合成数据,我一点也不会感到意外。它肯定是这样的! 让我们来分析一下下面的视频。提示:“两艘海盗…

    2024年2月16日
  • 专门的去除照片背景模型:RMBG-1.4

    该模型经过精心选择的数据集训练,从网络购物的商品图片到游戏和广告中的内容,几乎包含了所有你能想到的场景。 不管是电商需要清除产品背景,还是广告制作需要更换不同的背景场景,都非常有效。 可以非常精确地把你不想要的背景“擦掉”。 模型使用超过12000张高质量、高分辨率、手工标记(像素级精度)、完全授权的图片进行训练。数据集中平衡考虑了性别、种族和不同类型的残疾人群,展示了模型的多…

    2024年2月10日