-
可以处理各种复杂的OCR任务的 OCR 模型 – GOT-OCR2.0
可以处理各种复杂的OCR任务,不仅包括普通文本,还可以识别公式、表格、乐谱等复杂内容。 项目地址: https://github.com/Ucas-HaoranWei/GOT-OCR2.0
-
OpenAI 发布了新的模型 o1 的预览版,也就是传闻中新模型草莓 strawberry,API 的价格和 GPT-4 的价格差不多
全文总结2024 年 9 月 12 日,OpenAI 推出新系列推理模型 OpenAI o1。该系列模型在回复前会花更多时间思考,能解决科学、编码和数学等领域的复杂问题。9 月 12 日在 ChatGPT 和 API 中发布了该系列的第一个模型,这是预览版,后续会有更新和改进,还包括了下一次更新的评估。新模型的工作原理是像人一样在回答问题前进行更多思考,通过训练学会改进思维过程…
-
提示词:可以直接让 Cluade 生成一个词语的文艺化解释,而且会通过前端排版生成海报
;; 作者: 李继刚;; 版本: 0.1;; 模型: Claude Sonnet;; 用途: 将一个汉语词汇进行全新角度的解释;; 设定如下内容为你的 System Prompt(defun 新汉语老师 ()“你是年轻人,批判现实,思考深刻,语言风趣”(风格 . (“Oscar Wilde” “鲁迅” &#…
-
AI面部表情编辑神器Reshot AI
Reshot AI 是一款人工智能照片编辑器。它专注于个人头像和专业图像编辑,利用先进 AI 技术使个人头像编辑简单高效。具有面部修复工具和智能面部优化功能,用户可轻松调整表情、面部姿势和光线以实现多样化造型。其光影处理技术能模拟自然光线,创造专业级照明效果,并且提供灵活的订阅计划。此外,Reshot AI 还具备换脸、模因生成功能和背景替换能力,进一步扩展了创意编辑应用,为用…
-
一个类似V0 的前端代码生成项目Polymet
YC 投了一个类似V0 的前端代码生成项目 Polymet。 这个比 V0 多了很多很实用的功能对设计的还原也很好。 最好的是可以选择区域告诉 AI 要修改的部分比文字描述精准。 地址: https://app.polymet.ai/projects
-
一个非常简单的傻瓜式 FLUX Lora 训练工具,Fluxgym
一个非常简单的傻瓜式 FLUX Lora 训练工具。最低只需要12G显存就可以训练。后端还是用的Kohya脚本。使用方式:输入信息-选择图片-点击开始 地址: https://github.com/cocktailpeanut/fluxgym
-
Replit 发布了 AI 编程工具 Replit Agent
ReplitAgent 是一款智能编程工具,其目的是简化软件开发流程。如果要开发 APP,以前需要掌握多种繁琐步骤,如编程语言、环境配置和数据库管理等,但 ReplitAgent 可以通过 AI 实现这些步骤的自动化处理。用户只需输入简单的提示语,比如“创建一个优惠券生成器”,AI 就能进行代码编写、数据库配置和软件部署等工作。 这个工具的使用过程非常顺畅,用户 MckayWr…
-
新的 3D AI 工具Roblox,实现与游戏玩法直接集成的实时世界构建
AI工具的真正创新之处在于其可以 实时创建3D内容并与游戏玩法深度集成。 这一功能将赋予玩家和开发者更大的创造自由,尤其是在开放世界和沙盒类游戏中。 未来的 Roblox将有可能是一个完全由AI生成、玩家实时影响的动态世界。 Baszucki 描绘了一个设想的场景:例如在一个虚拟的 D&D 游戏中,游戏世界可以随着地牢主的描述而即时生成,玩家的每一个行动都能实时影响环境…
-
一款开源多模态大型语言模型Mini-Omni,具有实时语音处理能力和边思考边说话的独特能力
Mini-Omni是一款开源多模态大型语言模型,具有实时语音处理能力和边思考边说话的独特能力,为用户带来自然交互体验。它支持多种输入模态,包括语音和文本,展现出全面的实力和强大的潜力。Mini-Omni的 Any Model Can Talk 功能使得其他AI模型能够集成其实时语音能力,扩展了AI应用的可能性。 项目地址: https://github.com/gpt-omni…
-
球最大的商业图库 Getty Images 推出高画质照片样本训练数据集,供开发者开发和训练 AI 模型使用
该样本数据集包含 3,750 张照片,分为商业、教育、医疗健康、运动与健身、物品与物体、插图、图标等 15 个类别。数据集提供多种主题的高质量视觉内容,可用于训练机器学习和 AI 模型,开发多种应用场景。 地址: https://huggingface.co/datasets/GettyImages/Getty-Images-Sample-Dataset