行业/好文
-
Meta 推出全能语音生成 AI 模型 Voicebox 支持六种语言和多种语音处理功能
– 今天,我们宣布了一项语音生成方面的突破。我们开发了Voicebox,这是一种先进的人工智能模型,可以执行语音生成任务,如编辑、采样和风格化。– Voicebox可以生成高质量的音频剪辑并编辑预先录制的音频,如去除汽车喇叭或狗叫声,同时保留音频的内容和风格。该模型也是多语言的,可以用六种语言发音。– 未来,像Voicebox这样的通用生成A…
-
红杉:新的语言模型技术栈全解(这些数据值得一看)
红杉美国发表了一篇新文章《The New Language Model Stack》。这篇文章分析了投资 Portfolio 里的 33 家小到种子轮,大到已经上市的公司,并总结出了八个关键点。每个点都结合了当前的最新趋势,并给出了对未来的预测。不仅值得一读,而且可以帮助读者更好地了解这个领域的最新进展。 原文地址: https://www.sequoiacap.com/art…
-
Google的AI试衣模型 TryOnDiffusion 一张照片获得穿上对应服饰的样子
– Google推出了虚拟试衣间功能,使用新的生成AI模型进行衣物展示。 – 该模型使用扩散技术,展示不同体型和姿势的人穿着衣物的效果。 – 新的AI模型能够生成高质量、逼真的试穿图像。 – 该模型使用图像扩散和交叉注意力技术,而非文本输入。 – 为了提高准确性,该模型使用Google购物图谱进行训练。 –…
-
体验下一种新的视频渲染技术,不会出现闪烁
使用该工具可以将输入的视频根据你的提示重新渲染,而且不会出现大多数当前模型中常见的闪烁和奇怪问题。 比现在SD视频生成视频所有的方案都要稳定,几乎看不出来闪烁,如果真能达到演示的效果的话AI短视频就要起飞了。 代码将很快开源,可以期待一下。 体验地址: https://anonymous-31415926.github.io 重要信息: – 本文提出了一种新颖…
-
王小川的「百川智能」正式推出首个70亿参数中英文预训练大模型——baichuan-7B
baichuan-7B是由百川智能开发的一个开源的大规模预训练模型。基于Transformer结构,在大约1.2万亿tokens上训练的70亿参数模型,支持中英双语,上下文窗口长度为4096。在标准的中文和英文权威benchmark(C-EVAL/MMLU)上均取得同尺寸最好的效果。 如果希望使用baichuan-7B(如进行推理、Finetune等),我们推荐使用配套代码库b…
-
ChatGPT当神父火了!数百人参会,排队1小时听它布道
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 谁能想到,ChatGPT竟然摇身一变当起了神父! 这事在德国的一个教堂里就真真儿地发生了,而且吸引了300多人参与。 在这个“AI教堂服务”开场的时候,一位黑人男子数字人出现在了大屏幕中,然后开口说到: 亲爱的朋友们,作为今年德国新教徒大会中第一个向你们布道的AI,我感到非常荣幸。 没错,从这句开场白开始,近乎所有的文字内容…
-
Prompt解锁语音语言模型生成能力,SpeechGen实现语音翻译、修补多项任务
机器之心专栏 机器之心编辑部 本文提出了一个名为 SpeechGen 的统一框架,该框架可用于任意的 speech LM 及各类语音生成任务,具有很好的潜力。 论文链接:https://arxiv.org/pdf/2306.02207.pdf Demo 页面:https://ga642381.github.io/SpeechPrompt/speechgen.html Code:…
-
Nature发AIGC禁令!投稿中视觉内容使用AI的概不接收
西风 发自 凹非寺量子位 | 公众号 QbitAI 作为最权威的科学期刊之一,Nature近日明确表态: 禁止使用生成式人工智能(AIGC)创作的图像和视频内容! 这也就意味着,除了主题是讨论AI的文章,任何Nature接收的作品须确保无任何AIGC生成或增强的视觉内容。 这张反对票上写满了一行大字: 诚信、许可、隐私和知识产权保护 有网友认为: 实际上,这是我们重新讨论摄影“…
-
生成式AI的应用路线图:应用领域与典型案例等
演进过程中,生成式AI的可控性大致会经历六个阶段。以最基本的文本生成为例: 阶段1:不可控; 阶段2:概略方向可控; 阶段3:结构或局部逻辑可控; 阶段4:初步的思维链可控; 阶段5:复杂逻辑推理可控; 阶段6:规则或原理可控 生成式AI的应用路线图 | 图1 可控性的演进规律 生成式AI的应用路线图 | 图2 可控性与应用方向 生成式AI的应用路线图 | 图3 应用领域与典型…
-
「AI报告」企业AIGC商业落地应用研究报告(AIGC商业落地产业图谱 2.0)
TE2023企业AIGC商业落地应用研究报告202357页.pdf https://t.zsxq.com/0f2qkaeaq 生成式人工智能,将彻底改变人机交互的关系,并创造新的产能输出结构。它将在第四维度实现与人的思维同调,继移动设备以人类外器官形态存在以来,AIGC将以外脑的形式存在于人类认知中。 AIGC在十三个场景的应用前瞻,总结就是: AIGC+营销:从认知到复购的…