AI 共存派

  • 1分钟语音即可训练一个自己的TTS模型:GPT-SoVITS

    GPT-SoVITS是一个声音克隆和文本到语音转换的开源 Python RAG框架。 只需5秒的数据,它就可以模仿你的声音,只需1分钟的声音数据,就可以训练出一个高质量的TTS模型,完美克隆你的声音! 根据演示来看,它似乎是目前中文支持比较好的模型。 界面也很易用。 主要特点包括: 1. 零样本TTS:只需5秒的声音样本即可体验即时的文本到语音转换。 2. 少量样本训练:只需1…

    2024年1月19日
  • 工信部发布AI产业建设指南草案

    人工智能标准体系结构包括基础共性、基础支撑、关键技术、智能产品与服务、行业应用、安全/治理等6 个部分,如图 1 所示。其中,基础共性标准是人工智能的基础性、框架性、总体性标准。基础支撑标准主要规范数据、算力、算法等技术要求,为人工智能产业发展夯实技术底座。关键技术标准主要规范人工智能文本、语音、图像,以及人机混合增强智能、智能体、跨媒体智能、具身智能等领域技术,推动人工智能技…

    2024年1月18日
  • 感受下图片精修师Magnific AI的强大,普通图片秒变高清画质

    相信很多朋友应该有听到过这个Magnific AI,最近在社交媒体上特别火,主要是它出图效果太炸裂了,分辨率提高后的细节好到吓人。 更神奇的是这么「伟大」的公司,人家员工就2个人,这是值得我们学习的。 今天这篇主要是发一些我体验过的效果对比图,有条件的可以亲自感受下这种「震撼」,目前有免费试用机会。 我参考了Nick St. Pierre的一个玩法,用Midjourney 的&…

    2024年1月18日 应用
  • 分享一个免费替代chatpdf等AI工具归纳总结pdf文档的方法

    几个月前,我们分享过很多pdf文档归纳总结的AI工具,如ChatPDF,chatdoc等。 再推荐两个可以读取 pdf 文件并进行对话的 ChatGPT 小应用 但有一个问题,都不便宜~最近有同学问我,有没有好用还不要钱的,我就想到了我自己最近「白嫖」比较多的方案。 那就是「Mistral-Medium」,在1224.AI日报上有提到:Mistral AI的最强大模型。支持32…

    2024年1月18日
  • Vanna是一个帮助用户更容易地与SQL数据库交互的工具

    它允许用户用自然语言来询问数据库,然后它会自动把这些话转换成SQL语句,去数据库里找到相应的数据。 这对于不太懂SQL语言的人来说非常方便,因为他们可以像跟人聊天一样跟数据库“聊天”,获取他们需要的信息。 Vanna主要功能特点: Vanna基于开源Python框架,使用检索增强生成(RAG)技术进行SQL生成和相关功能。其主要特点是通过与SQL数据库的交互,准确地通过大型语言…

    2024年1月17日
  • 智谱AI发布新一代模型:GLM-4

    GLM-4支持更长的上下文,具备更强的多模态能力。同时,它的推理速度更快,支持更高的并发。性能相较GLM-3 提升 60%。 智谱AI还推出了GLMs,类似GPTs的东西,并发布 GLM-4-All Tools。 智谱AI CEO张鹏表示,国内研发的大模型与世界先进水平差距约一年,但已逼近GPT-4性能。 GLM-4 All Tools能实现自主根据用户意图,自动理解、规划复杂…

    2024年1月17日
  • Stability AI发布 Stable Code 3B模型,专门用于辅助编程

    它可以在普通的笔记本电脑上运行,甚至包括那些没有专用GPU的型号,如MacBook Air。 相较于其前身CodeLLaMA 7b,体积减少了60%,但在多种编程语言上保持了同等的性能。 支持18种编程语言,上下文大小100K… 性能和特点: 1、体积小效率高: 相较于其前身CodeLLaMA 7b,虽然体积减少了60%,但在多种编程语言上保持了类似的高级性能。 2…

    2024年1月17日
  • 阿里巴巴的新项目 MotionShop:将视频中的角色替换为3D化身

    通过先进的视频处理和3D渲染技术,MotionShop能够高效地将视频中的某个角色替换为3D人物,同时不改变视频中的其他场景和人物。 被替换的3D人物能完整复刻原视频中人物的动作,保持动作一致。 MotionShop的技术原理: 1、视频处理和背景提取: 利用视频处理技术,从原始视频中分离出人物,留下无人的背景。这一步涉及复杂的图像分析和处理,以确保背景的完整性和连贯性。 角色…

    2024年1月17日
  • 照片级、真实感的图像着色工具DDColor,能实现高度真实的图像上色效果。

    使用双解码器技术,DDColor能够同时考虑色彩分布和像素级详细信息,能实现高度真实的图像上色效果。 不仅能给历史黑白照片上色,还能对动漫或游戏中的风景进行真实风格的上色。 将动画场景转化为现实生活风格。 DDColor使用了双解码器来处理图片:一个是恢复图片的结构,另一个是决定图片每个部分的颜色。 这项技术的创新之处在于它不需要像以前的方法那样依赖于人工设置的规则,而是能够自…

    2024年1月15日
  • 一个利用多张照片作为身份ID的工具:PhotoMaker,可以根据描述生成符合描述的人物照片

    PhotoMaker是一个利用多张照片作为身份ID的工具,可以根据描述生成符合描述的人物照片,并且能够将不同人的照片特征混合在一起,创造出全新的人物形象。此外,它还可以改变照片人物的性别、年龄,并生成多种风格的其他照片。PhotoMaker的效果快速逼真,效果自然。 PhotoMaker是一种使用”堆叠ID嵌入”技术的图像生成工具。它可以结合多张照片的特…

    2024年1月15日