AI 共存派
-
midjourney 提示词分享:精选–sref 代码(动漫人物)
–sref 2346751805 –sref 1594472214 –sref 2866847832 –sref 1505298354 –sref 836374222 –sref 2765975532 –sref 292455562 来源:https://mp.weixin.qq.com/s/Q…
-
Kyutai 发布的全新开源 AI 语音助手 Moshi ,平替 OpenAI 的GPT 4o
Moshi能够进行自然、流畅且富有表现力的语音对话,模拟人类的语音交流方式。可以匹敌OpenAI 的GPT 4o的语音能力。 其文本转语音能力在情感表达方面非常出色,能模拟多种情绪。 该语音助手由法国Kyutai研究团队8人团队经过6个月的时间开发,具备独特情感和AI互动能力。 Moshi 可以本地安装和运行,在无网络环境下也能运行,确保其的安全性和稳定性。 Kyutai将公开…
-
Retool 刚刚发布了最新2024上半年《人工智能现状报告》
AI行业发展迅速,技术不断涌现,带来了炒作、怀疑、焦虑和好奇。调查了大约750名技术人员,发现大多数认为AI有些被高估,尤其在开发者和企业中。大多数人认为公司在AI方面还有很长的路要走,但使用AI工具的人报告了提高生产力的情况。AI聊天机器人是常见的应用,但开发AI应用仍面临数据安全、资源和成本等挑战。企业需要适当的资源和数据治理来成功开展AI项目。 报告全文: https:/…
-
ElevenLabs消除背景噪音功能效果不错;艺术家“出逃”让一款反AI应用火了
prompt:abstract concept art of ideas colliding, creative thinking (点击图片进入小程序,感谢捧场~) 今日简讯 2024.7.4 – 泡沫?AI 基础设施的巨额投资,和实际的 AI 生态系统实际收入之间,差距已经到了不可思议的地步。曾经全球 AI 面临的 2000 亿美元难题,如今已经翻成了 6000…
-
完美支持中英日语言的开源TTS模型来了
prompt:A miniature baby zebra walking on a fingertip 今日简讯 2024.7.3 – 因生成的设计太像苹果天气 App,Figma AI 设计工具被迫下线(上线了还没几天~) – 苹果公司高管 Phil Schiller 加入 OpenAI 董事会,担任观察员角色,有助于加深对 OpenAI 的了解。 …
-
AI素材生成器:Whee.com ,文生图、图生图、AI改图编辑器等
WHEE是一个高品质的AI素材生成器,提供各种风格的创作灵感,包括抽象绘画、传统中国风景、幻想、科幻等。用户可以根据需求选择不同风格的图片和插图。提供的素材具有高清晰度、3D效果、生动色彩和专业插图风格。 体验地址: https://www.whee.com 创作工具文生图图生图AI模特图风格模型训练创作词库AI 修图AI 改图内测AI扩图AI超清上新AI无痕消除局部修改AI …
-
一款使用AI来解析PDF的开源工具:gptpdf
1、使用 PyMuPDF 库,对 PDF 进行解析出所有非文本区域,并做好标记 2、使用视觉大语言模型(如 GPT-4o)将 PDF 解析为 markdown。 我们的方法非常简单(只有293行代码),但几乎可以完美地解析排版、数学公式、表格、图片、图表等。 每页平均价格:0.013 美元 项目地址: https://github.com/CosmosShadow/gptpdf
-
一款PDF解析工具:doc2x,每天可以”白嫖:500页
doc2x可以将 PDF 文件转换为 Markdown、LaTeX、DOCX 等格式 可以解析排版、数学公式、表格、图片、图表等,对包含表格和公式的文档处理效果比较好,支持多语言翻译(基于glm4和deepseek) 体验地址: https://doc2x.noedgeai.com
-
微软在官网开源了基于图的RAG(检索增强生成)——GraphRAG
微软在官网开源了基于图的RAG(检索增强生成)——GraphRAG,通过构建知识图谱来增强大模型的搜索、问答、摘要、推理等能力。Graph RAG的核心是通过两阶段构建基于图谱的文本索引,帮助大模型更好地捕捉文本中的复杂联系和交互。该方法在处理大规模数据集时表现出色,提升了信息检索和生成的协同工作,适用于处理复杂问题和解读PDF、Word等文档。 项目地址: https://g…
-
Meta 发布名为 Meta 3D Gen(3DGen)的全新 AI 模型:1 分钟内生成高质量 3D 内容
第一阶段 根据用户提供的文本提示,第一阶段使用 Meta 的三维资产生成模型(AssetGen)创建初始 3D 资产。该步骤生成一个带有纹理和 PBR 材质贴图的 3D mesh。推理时间约为 30 秒。 第二阶段 根据阶段 1 生成的三维资产和初始文本提示,阶段 2 将为该资产生成更高质量的纹理和 PBR 贴图。它使用 Meta 的文本到纹理生成器 Meta 3D Textu…