AI 共存派

  • OpenAI发文《OpenAI与马斯克》邮件往来记录解释马斯克为何离开

    简单来说就是: OpenAI今日发布了一篇名为《OpenAI与马斯克》的长篇博客,通过邮件往来记录详细解释了OpenAI与马斯克之间的关系以及马斯克最终离开的原因。 OpenAI 最初作为非营利组织,总共从埃隆那里筹集了不到 4500 万美元,马斯克想要获得多数股权、初始董事会控制权并担任 CEO,然后马斯克建议将 OpenAI 并入特斯拉。 原文: https://opena…

    2024年3月6日
  • 和杨植麟聊国产大模型抢跑这一年:人类理想的增量、有概率的非共识和Sora

    如果所有人都觉得你正常,你的理想是大家都能想到的,它对人类的理想总量没有增量。 《张小珺Jùn|商业访谈录》是腾讯新闻一档专注做商业深度访谈的播客节目,试图描摹我们时代的商业、文化和新知(点击文章底部阅读原文跳转腾讯新闻收听)。 今天的嘉宾是大模型公司月之暗面的创始人兼CEO杨植麟,我们整理了音频和文字精华版,一起来听听这位92年出生、融资90亿的AI科学家的创业这一年。 (完…

    2024年3月6日 行业/好文
  • 朱啸虎讲了一个中国现实主义AIGC故事

    作者 | 张小珺 出品 | 腾讯新闻 《潜望》 金沙江创投主管合伙人朱啸虎很快对美版AIGC故事丧失了兴趣。他随即决定不再和美国同事开原定每周一次的远程例行会议,探讨两边大模型产业格局变化。“打了半年我不打了,没有意义。”他说。 中国科技界针对大模型的态度已分裂成两股阵营。一股是技术信仰派,他们大多技术出身,认为应该像OpenAI一样信仰AGI、信仰scaling law(规模…

    2024年3月6日 行业/好文
  • Stability AI 发布了他们最强的图片生成模型 Stable Diffusion 3 的技术报告

    Stability AI 发布了他们最强的图片生成模型 Stable Diffusion 3 的技术报告,披露了 SD3 的更多细节。 据他们所说,SD3 在排版质量、美学质量和提示词理解上超过了目前所有的开源模型和商业模型,是目前最强的图片生成模型。 技术报告要点如下: ◆根据人类偏好评估,SD3 在排版质量和对提示的理解程度上,均优于目前最先进的文本生成图像系统,例如 DA…

    2024年3月5日
  • 一个高质量的多语言文本到语音(TTS)库:MeloTTS(完美支持中文)

    1、MeloTTS支持多种语言的文本转语音,包括英语(包括美国、英国、印度、澳大利亚等口音)、西班牙语、法语、中文、日语和韩语。这使得它适用于全球各种语言环境的应用场景。 2、特别是对于中文,MeloTTS支持中英文混合的发音,这在多语言交流中非常实用,可以处理包含英文单词的中文文本。 3、MeloTTS经过优化设计,能够在没有GPU加速的情况下,在CPU上实现实时语音合成,提…

    2024年2月27日
  • 一个开源的「贴纸生成器」StickerBaker

    开源贴纸制作工具StickerBaker,傻瓜式操作即可,输入关键词就能生成卡通贴纸,支持批量制作多样化贴纸。 StickerBaker是一个使用fofr/sticker-maker强大功能的应用,为用户提供高效、便捷的贴纸制作体验。它不仅支持批量制作贴纸,还能一次性创建多个独特的贴纸,为聊天和分享增添更多乐趣。 无论你想制作具有地域特色的贴纸,如乌克兰国旗色的豹子,还是创造出…

    2024年2月27日
  • 出门问问发布“序列猴子开源数据集1.0”

    出门问问昨日在其微信公众号宣布,将向公众开放其超大规模语言模型“序列猴子”的部分训练数据集,命名为“序列猴子开源数据集1.0”。本次开源的“序列猴子数据集1.0”包含了中文通用文本语料、古诗今译语料以及文本生成语料,这些数据资源经过精心挑选和整理,确保了数据质量和数据格式。同时,出门问问采用宽松的许可协议,为广大开发者和研究人员提供了便捷的使用条件。 序列猴子是出门问问提供的超…

    2024年2月23日
  • Suno 发布AI音乐生成模型V3 Alpha 版本

    更好的音质和更高的表现力+其他强烈要求的功能:– 提升音质和表现力– 加强其他重要功能 最大生成长度增加到两分钟– 将生成音乐的最大长度延长至两分钟 更快的生成速度– 加快音乐生成的速度 特定乐器的专门支持– 提供对特定乐器的专业支持 扩大语言覆盖范围– 增加支持的语言种类 从任何地方继续– 允…

    2024年2月23日
  • Stability AI 发布Stable Diffusion 3模型,多主题提示、图像质量和拼写能力方面的性能得到了极大的提高

    Stable Diffusion 3是一种文本到图像模型,具有改进的性能和安全性。该模型尚未广泛推出,但现在可以加入早期预览的等待列表。该模型提供多种参数范围,旨在满足用户的创作需求。在训练和测试过程中,我们采取了多种保护措施,并与研究人员和社区合作以进一步创新。我们致力于确保生成AI的开放、安全和普遍可访问。 Stability AI 发布Stable Diffusion 3…

    2024年2月22日
  • 剪映海外版CapCut推出了文字生成视频功能

    剪映海外版CapCut推出了文字生成视频功能,每个用户每天可免费生成五次。该功能支持中文提示词,但生成的内容质量目前较低。 可以通过文本生成4秒的视频支持多种4:3、9:16等多种比例的视频类型。 体验地址: https://www.capcut.com/editor-tools/ai-video-generator

    2024年2月22日