Kimi浏览器插件;可灵网页端;可图Kolors开源;还有阿里通义音频生成大模型 FunAudioLLM

今日简讯 2024.7.8

– Anthropic 首席执行官最新访谈中提及，未来三年内，AI 大模型的训练成本将上升至 100 亿美元甚至 1000 亿美元。

– 有了ChatGPT，还需要人类程序猿编码吗?IEEE 35页论文显示，ChatGPT生成可用代码的能力差异很大。其成功率从0.66%到89%不等，这主要取决于任务的难度、编程语言等多种因素。

– 日本《信息通信白皮书》数据显示日本国内仅有 9.1% 的个人使用生成式 AI，与中国的 56.3%、美国的 46.3%、英国的 39.8% 和德国的 34.6% 存在较大差距。

– 独立应用程序研究者 Nima Owji 表示，X 社交平台正在开发多项基于 xAI Grok 模型的功能，其中之一便是类似于其他生成式 AI 聊天机器人的 Grok 侧面板，用户可在使用 X 平台任意功能时同 Grok 机器人交流。

– 谷歌 DeepMind 研究团队提出了一种加快 AI 训练的新方法，训练提效 13 倍，能耗暴降 10 倍。

– YouTube 发布了更新的“橡皮擦”工具，创作者可以轻松地从视频中移除任何受版权保护的背景音乐，而不会影响包括对话或音效在内的任何其他音频。

– 阿里达摩院推出一站式 AI 视频创作平台“寻光”：集成分镜设计、图层可控编辑等功能（需申请体验）。

地址：https://xunguang.damo-vision.com/

– 冲锋在AI辅助数学研究第一线的陶哲轩最新言论：ChatGPT提升的，是我们在编码、图表等次要任务上的能力;而真要搞好数学研究，基础不扎实的话，AI也是没用的。

– 书⽣·浦语2.5——InternLM2.5-7B模型宣布开源。

地址：

https://github.com/InternLM/InternLM

– Open-TeleVision项目实现了远程操控机器人的高科技场景，让人仿佛置身于电影《阿凡达》中。

项目地址：

https://github.com/Improbable-AI/VisionProTeleop

可灵视频模型网页端平台及全新功能上线，支持文生视频，图生视频等

体验地址：

https://klingai.kuaishou.com/

同时，快手文生图大模型“可图”宣布开源，现已上线微信小程序和网页版。

地址：

https://github.com/Kwai-Kolors/Kolors

推荐一个网站，可以分析各大模型的输出速度、价格、质量等信息

它对不同的 LLM API 提供商的速度进行了基准测试，以帮助开发人员选择要使用的模型。这很好地补充了 LMSYS Chatbot Arena、Hugging Face 开放 LLM 排行榜和斯坦福的 HELM，后者更注重输出的质量。

地址：

https://artificialanalysis.ai/

清华大学的一名人工智能博士生王慎执推出了一款微调模型 Gemma-2-9B-Chinese-Chat

是第一个为中文和英文用户量身定制的 Gemma-2 模型，针对超过 100K 的偏好对进行了微调！模型在中文提示方面表现出色，并显示出更好的逻辑、编码、数学和写作技能。

地址：

https://huggingface.co/shenzhi-wang/Gemma-2-27B-Chinese-Chat

Moonshot AI推出的Kimi浏览器插件

用户提供了点问笔和总结器两大功能，优化了用户在网页和应用中的体验。插件支持全局浮窗和侧边栏模式，方便用户在写作时进行持续对话和搜索。

地址：

https://kimi.moonshot.cn/extension/download

阿里通义音频生成大模型 FunAudioLLM

该项目包括两个核心模型: SenseVoice和CosyVoice，分别致力于语音生成和语音识别。FunAudioLLM支持多种人机交互应用场景，如多语言翻译、情绪语音对话、互动播客和有声读物等。

地址：

https://fun-audio-llm.github.io/

在线体验地址：

https://www.modelscope.cn/studios/iic/CosyVoice-300M

清华大学开源CodeGeeX4-ALL-9B

该模型是在 GLM-4-9B 基础上持续训练的多语言代码生成模型，显著提升了代码生成能力。使用单个 CodeGeeX4-ALL-9B 模型，可以支持代码补全与生成、代码解释、联网搜索、函数调用、仓库级代码问答等多种功能，覆盖了软件开发的各个场景。

地址：

https://huggingface.co/THUDM/codegeex4-all-9b/blob/main/README_zh.md

Xinsir 开源了 Controlnet ++ 模型

可以通过一个模型实现十多种条件的控制。

地址：

https://huggingface.co/xinsir/controlnet-union-sdxl-1.0

来源：https://mp.weixin.qq.com/s/CV4VPEsOhI39TQJDc0flRA

本文地址：https://www.163264.com/8711

Kimi浏览器插件;可灵网页端;可图Kolors开源;还有阿里通义音频生成大模型 FunAudioLLM

相关推荐