Kimi浏览器插件;可灵网页端;可图Kolors开源;还有阿里通义音频生成大模型 FunAudioLLM

Kimi浏览器插件;可灵网页端;可图Kolors开源;还有阿里通义音频生成大模型 FunAudioLLM

今日简讯 2024.7.8

– Anthropic 首席执行官最新访谈中提及,未来三年内,AI 大模型的训练成本将上升至 100 亿美元甚至 1000 亿美元。

– 有了ChatGPT,还需要人类程序猿编码吗?IEEE 35页论文显示,ChatGPT生成可用代码的能力差异很大。其成功率从0.66%到89%不等,这主要取决于任务的难度、编程语言等多种因素。

– 日本《信息通信白皮书》数据显示日本国内仅有 9.1% 的个人使用生成式 AI,与中国的 56.3%、美国的 46.3%、英国的 39.8% 和德国的 34.6% 存在较大差距。

– 独立应用程序研究者 Nima Owji 表示,X 社交平台正在开发多项基于 xAI Grok 模型的功能,其中之一便是类似于其他生成式 AI 聊天机器人的 Grok 侧面板,用户可在使用 X 平台任意功能时同 Grok 机器人交流。

– 谷歌 DeepMind 研究团队提出了一种加快 AI 训练的新方法,训练提效 13 倍,能耗暴降 10 倍。

– YouTube 发布了更新的“橡皮擦”工具,创作者可以轻松地从视频中移除任何受版权保护的背景音乐,而不会影响包括对话或音效在内的任何其他音频。

– 阿里达摩院推出一站式 AI 视频创作平台“寻光”:集成分镜设计、图层可控编辑等功能(需申请体验)。

地址:https://xunguang.damo-vision.com/

– 冲锋在AI辅助数学研究第一线的陶哲轩最新言论:ChatGPT提升的,是我们在编码、图表等次要任务上的能力;而真要搞好数学研究,基础不扎实的话,AI也是没用的。

– 书⽣·浦语2.5——InternLM2.5-7B模型宣布开源。

地址:

https://github.com/InternLM/InternLM

– Open-TeleVision项目实现了远程操控机器人的高科技场景,让人仿佛置身于电影《阿凡达》中。

Kimi浏览器插件;可灵网页端;可图Kolors开源;还有阿里通义音频生成大模型 FunAudioLLM

项目地址:

https://github.com/Improbable-AI/VisionProTeleop

可灵视频模型网页端平台及全新功能上线,支持文生视频,图生视频等

体验地址:

https://klingai.kuaishou.com/

同时,快手文生图大模型“可图”宣布开源,现已上线微信小程序和网页版。

地址:

https://github.com/Kwai-Kolors/Kolors

推荐一个网站,可以分析各大模型的输出速度、价格、质量等信息

Kimi浏览器插件;可灵网页端;可图Kolors开源;还有阿里通义音频生成大模型 FunAudioLLM

Kimi浏览器插件;可灵网页端;可图Kolors开源;还有阿里通义音频生成大模型 FunAudioLLM

它对不同的 LLM API 提供商的速度进行了基准测试,以帮助开发人员选择要使用的模型。这很好地补充了 LMSYS Chatbot Arena、Hugging Face 开放 LLM 排行榜和斯坦福的 HELM,后者更注重输出的质量。

地址:

https://artificialanalysis.ai/

清华大学的一名人工智能博士生王慎执推出了一款微调模型 Gemma-2-9B-Chinese-Chat

Kimi浏览器插件;可灵网页端;可图Kolors开源;还有阿里通义音频生成大模型 FunAudioLLM

是第一个为中文和英文用户量身定制的 Gemma-2 模型,针对超过 100K 的偏好对进行了微调!模型在中文提示方面表现出色,并显示出更好的逻辑、编码、数学和写作技能。

地址:

https://huggingface.co/shenzhi-wang/Gemma-2-27B-Chinese-Chat

Moonshot AI推出的Kimi浏览器插件

Kimi浏览器插件;可灵网页端;可图Kolors开源;还有阿里通义音频生成大模型 FunAudioLLM

用户提供了点问笔和总结器两大功能,优化了用户在网页和应用中的体验。插件支持全局浮窗和侧边栏模式,方便用户在写作时进行持续对话和搜索。

地址:

https://kimi.moonshot.cn/extension/download

阿里通义音频生成大模型 FunAudioLLM

Kimi浏览器插件;可灵网页端;可图Kolors开源;还有阿里通义音频生成大模型 FunAudioLLM

该项目包括两个核心模型: SenseVoice和CosyVoice,分别致力于语音生成和语音识别。FunAudioLLM支持多种人机交互应用场景,如多语言翻译、情绪语音对话、互动播客和有声读物等。

地址:

https://fun-audio-llm.github.io/

Kimi浏览器插件;可灵网页端;可图Kolors开源;还有阿里通义音频生成大模型 FunAudioLLM

在线体验地址:

https://www.modelscope.cn/studios/iic/CosyVoice-300M

清华大学开源CodeGeeX4-ALL-9B

Kimi浏览器插件;可灵网页端;可图Kolors开源;还有阿里通义音频生成大模型 FunAudioLLM

该模型是在 GLM-4-9B 基础上持续训练的多语言代码生成模型,显著提升了代码生成能力。使用单个 CodeGeeX4-ALL-9B 模型,可以支持代码补全与生成、代码解释、联网搜索、函数调用、仓库级代码问答等多种功能,覆盖了软件开发的各个场景。

地址:

https://huggingface.co/THUDM/codegeex4-all-9b/blob/main/README_zh.md

Xinsir 开源了 Controlnet ++  模型

Kimi浏览器插件;可灵网页端;可图Kolors开源;还有阿里通义音频生成大模型 FunAudioLLM

可以通过一个模型实现十多种条件的控制。

地址:

https://huggingface.co/xinsir/controlnet-union-sdxl-1.0

来源:https://mp.weixin.qq.com/s/CV4VPEsOhI39TQJDc0flRA

本文地址:https://www.163264.com/8711

(0)
上一篇 6天前
下一篇 3天前

相关推荐