AI 共存派
-
185个生成式 AI 实际应用落地案例
全文总结本文主要介绍了自生成式人工智能引起关注以来,其在企业、政府和新公司中的应用。谷歌云客户在六个关键领域开发了人工智能代理和生成式人工智能解决方案,包括客户服务、员工赋能、代码创建、数据分析、网络安全和创意构思与生产。文中列举了众多公司和组织在不同领域的具体应用案例,展示了人工智能在各个方面的实际应用和带来的效益。重要亮点 原文: https://cloud.google.…
-
专门为动画视频线稿上色工具LVCD,可以把黑白线稿自动转化为彩色动画视频
本文介绍了“LVCD:Reference–based Lineart Video Colorization with Diffusion Models”,发表于 ACM Transactions on Graphics & SIGGRAPH Asia 2024。作者包括 Zhitong Huang、Mohan Zhang、Jing Liao,来自香港城市大学…
-
一致性角色图像解决方案来咯,StoryMaker可以用于生成系列图片构成的故事情节
StoryMaker 可以通过文本提示控制生成图像的背景、姿势和风格,使得用户可以根据不同的场景需求生成符合叙事需求的图像序列。 该模型支持包括服装交换、角色插值等功能,并能与其他生成插件(如 LoRA、ControlNet)集成,提供多样化的生成应用场景。 地址: https://huggingface.co/RED-AIGC/StoryMaker
-
Deepgram 推出了全新的AI语音代理API, 能够进行实时自然的语音对话
Deepgram 推出全新 AI 语音代理 API,这是一个统一的语音对话 API,可让 AI 代理进行自然对话。它适用于企业和开发人员,在客户支持、订单处理等场景有广泛应用。该 API 依赖快速的语音识别和合成模型,支持实时语音理解、推理和对话生成。其特点包括实时自然对话、中断处理、可扩展性与灵活性、低延迟高性能、注重隐私安全以及集成多种语言模型。此外,还介绍了适用场景和提供…
-
可以处理各种复杂的OCR任务的 OCR 模型 – GOT-OCR2.0
可以处理各种复杂的OCR任务,不仅包括普通文本,还可以识别公式、表格、乐谱等复杂内容。 项目地址: https://github.com/Ucas-HaoranWei/GOT-OCR2.0
-
OpenAI 发布了新的模型 o1 的预览版,也就是传闻中新模型草莓 strawberry,API 的价格和 GPT-4 的价格差不多
全文总结2024 年 9 月 12 日,OpenAI 推出新系列推理模型 OpenAI o1。该系列模型在回复前会花更多时间思考,能解决科学、编码和数学等领域的复杂问题。9 月 12 日在 ChatGPT 和 API 中发布了该系列的第一个模型,这是预览版,后续会有更新和改进,还包括了下一次更新的评估。新模型的工作原理是像人一样在回答问题前进行更多思考,通过训练学会改进思维过程…
-
提示词:可以直接让 Cluade 生成一个词语的文艺化解释,而且会通过前端排版生成海报
;; 作者: 李继刚;; 版本: 0.1;; 模型: Claude Sonnet;; 用途: 将一个汉语词汇进行全新角度的解释;; 设定如下内容为你的 System Prompt(defun 新汉语老师 ()“你是年轻人,批判现实,思考深刻,语言风趣”(风格 . (“Oscar Wilde” “鲁迅” &#…
-
AI面部表情编辑神器Reshot AI
Reshot AI 是一款人工智能照片编辑器。它专注于个人头像和专业图像编辑,利用先进 AI 技术使个人头像编辑简单高效。具有面部修复工具和智能面部优化功能,用户可轻松调整表情、面部姿势和光线以实现多样化造型。其光影处理技术能模拟自然光线,创造专业级照明效果,并且提供灵活的订阅计划。此外,Reshot AI 还具备换脸、模因生成功能和背景替换能力,进一步扩展了创意编辑应用,为用…
-
一个类似V0 的前端代码生成项目Polymet
YC 投了一个类似V0 的前端代码生成项目 Polymet。 这个比 V0 多了很多很实用的功能对设计的还原也很好。 最好的是可以选择区域告诉 AI 要修改的部分比文字描述精准。 地址: https://app.polymet.ai/projects
-
一个非常简单的傻瓜式 FLUX Lora 训练工具,Fluxgym
一个非常简单的傻瓜式 FLUX Lora 训练工具。最低只需要12G显存就可以训练。后端还是用的Kohya脚本。使用方式:输入信息-选择图片-点击开始 地址: https://github.com/cocktailpeanut/fluxgym