AI 共存派

  • ChatAvatar:Text-to-3D工具 仅需30秒,就能做出一张以假乱真的脸

    这款使用起来几乎零门槛的Text-to-3D工具名叫ChatAvatar,由国内AI初创公司影眸科技团队打造。 影眸科技(上海)有限公司孵化于上海科技大学,通过与国内顶尖人工智能、计算机视觉实验室合作,积极推动尖端实验室科研成果的民用化、商业化,探索前沿人工智能、计算机视觉技术在大众娱乐市场的推广应用。 体验地址: https://hyperhuman.deemos.com/c…

    2023年5月10日
  • AudioPen :一款通过录音将混乱的思维转化为清晰文本的工具

    https://audiopen.ai 自我介绍是: Audio Pen是录音笔的一款智能产品,它能像个私人助理一样记录、总结你的想法。如果你喜欢开口说话,它一定能满足你的需求。 这个目前收费,不便宜,永久要99美元。 但这个产品思路可以学习下,我体验了下,目前能听懂中文,但是记录的时候是英文,思路如下: 1,录音记录你说话。 2,转成对应的文字内容。 3,再通过ChatGPT…

    2023年5月10日 应用
  • kaleido.so:用 AI,把毫无头绪的用户反馈变成产品设计决策

    – Kaleido 是一款帮助产品团队收集和组织想法、见解和反馈的工具。– 它使用人工智能简化数据,将用户反馈转换成项目或功能。– 它还提供自动报告,以确定最重要的项目工作。– Kaleido 帮助团队成员理解每个产品任务的背后思想。 https://www.kaleido.so/ Kaleido 提供了一种四步骤的方法来提炼用户…

    2023年5月10日
  • 最简单的一键换脸 AI 工具-InsightFace,利用MidJourney,在Discord上轻松地进行一键换脸。

      InsightFace是一个基于PyTorch和MXNet的开源2D和3D深度面部分析工具箱,可有效实现用于面部识别、面部检测和面部对齐的最新算法。该项目的主要维护者是Jia Guo和Jiankang Deng。InsightFace提供了训练数据、网络设置和损失设计等支持,同时还提供了RetinaFace、SCRFD和blazeface_paddle等多种面部检…

    2023年5月10日
  • OpenAI发布炸裂研究:让AI解释AI黑箱,人类无法理解,语言无法描述

    就算在新产品满天飞,商业文明正在被 AI 重建的当下,我们仍然不知道,这些令人惊叹的技术是如何运作的。 AI,语言模型,它是个黑箱(black box),人类无法理解,我们甚至不知道怎样研究才能够理解。 但如果,研究这个黑箱的不是人类,而是 AI 自己呢? 这是一个令人好奇但又非常危险的想法。因为你甚至不知道,这一研究方法产生的结果,是否会彻底颠覆多年来人类对人脑和 AI 的理…

    2023年5月10日 ChatGPT
  • remove.bg:消除图片的背景并将图片快速转换为漂亮的设计

    该内容主要介绍了一个名为remove.bg的网站,可以使用它来消除图片的背景,并将图片快速转换为漂亮的设计,而且是免费的。同时,该网站也提供了关于捐助以训练人工智能等方式帮助改进该程序的选项。对于使用该网站的用户来说,需要注意下载文件后在60分钟内使用,否则将会自动废弃。 https://www.remove.bg/zh/upload

    2023年5月10日
  • pixian.ai:超级好用的去除背景图片的工具,速度快,质量高

    能轻松把背景去掉啦!只要上传一张图片,然后不到一分钟,AI就能帮我抠出来,而且还能下载高清图片。 质量上乘,价格低廉在测试版期间免费 https://pixian.ai/  

    2023年5月10日
  • 2023年5月生成式AI独角兽公司Top12名单及估值

    五层生成技术栈: 1. 通用 AI 模型   2. 特定 AI 模型   3. 超本地化   4. 操作系统或 API 层 AI 模型   5. 应用层 1. OpenAI – 估值290亿美元:研究并发布先进的人工智能模型,如GPT系列模型。 openai.com 2. Grammarly – 估值130亿美元:提供基于AI的在线写作辅助工具,包括语法…

    2023年5月10日
  • 交互式视觉框架 iChat 使用户能够直接操作屏幕上的图像或视频

    InternChat是一种基于指向语言的视觉交互系统,可以通过指向指令来提高用户与聊天机器人之间的沟通效率和聊天机器人在复杂视觉场景下的准确性。该系统还使用辅助控制机制来提高交互体验,并使用名为Husky的大型视觉语言模型进行高质量的多模态对话。用户可以通过在线演示和下载安装来使用该系统。  支持中文 支持MOSS 基于InternImage和InternVideo的更强大的基…

    2023年5月10日 应用
  • Meta 开源多感官人工智能模型,整合文本、音频、视觉等六种类型的数据

    ImageBind将多种数据流联系在一起,包括文本、音频、视觉数据、深度信息、温度和运动读数。 Meta公司公布了一个新的开源人工智能模型ImageBind,将多种数据流联系在一起,包括文本、音频、视觉数据、温度和运动读数等。 这个模型目前只是研究项目,没有直接的消费者用户或实际应用,但它指出了生成式人工智能系统的未来,可以创造沉浸式多感官体验,并表明在OpenAI和谷歌等竞争…

    2023年5月10日 行业/好文