ChatGPT/AI 第2页

Imagine Yourself – Meta公司推出的个性化AI图像生成模型

FGJ博客 发布于 2024-08-29

Imagine Yourself 是Meta公司推出的个性化AI图像生成模型,突破了传统方法的局限,无需对每个用户进行单独调整,通过单一模式即可满足不同用户需求。模型采用合成配对数据生成和并行注意力架构,有效提高图像质量和多样性,同时保持身份保护和文本对齐。在复杂提示词处理上,其...

Sapiens – Meta推出的AI视觉模型,能理解图片和视频中的人类动作

FGJ博客 发布于 2024-08-28

Sapiens是Meta实验室推出的AI视觉模型,专为理解图片和视频中的人类动作设计。支持二维姿势预估、身体部位分割、深度估计和表面法线预测等任务,采用视觉转换器架构。模型参数从3亿到20亿不等,原生支持1K高分辨率推理,易于针对不同任务调整。即使在标注数据稀缺的情况下,Sapi...

GaussianEditor – 一种3D编辑算法,支持快速且精确地修改3D场景

FGJ博客 发布于 2024-08-28

GaussianEditor 是一种基于高斯飞溅(Gaussian Splatting)的3D编辑算法,支持用户快速而精确地修改3D场景。通过高斯语义跟踪和分层高斯飞溅,提供了高度的编辑控制和稳定性,同时保持了渲染质量。编辑过程通常只需5-10分钟,显著提高了3D编辑的效率。这项...

mPLUG-Owl3 – 阿里巴巴推出的通用多模态AI模型

FGJ博客 发布于 2024-08-27

mPLUG-Owl3是阿里巴巴推出的通用多模态AI模型,专为理解和处理多图及长视频设计。在保持准确性的同时,显著提升了推理效率,能在4秒内分析完2小时电影。模型采用创新的Hyper Attention模块,优化视觉与语言信息的融合,支持多图场景和长视频理解。mPLUG-Owl3在...

Lingo – 西湖心辰推出的端到端语音大模型,媲美GPT-4o

FGJ博客 发布于 2024-08-27

Lingo 是西湖心辰推出的国内首个端到端语音大模型,在技术上具备实时打断、实时指令控制、超级拟人、能说会唱等能力,拥有比 GPT-4o 更出色的中文语音效果。心辰 Lingo 语音模型已于 2024 年 8 月 24 日开启内测预约,预计将在 9 月 5 日的外滩大会上正式发布...

山海大模型 – 云知声推出的多模态AI大模型

FGJ博客 发布于 2024-08-27

山海大模型是云知声推出的多模态AI大模型,具备丰富的知识储备和多模态交互能力。山海大模型能通过文本、音频、图像等多种形式与用户进行实时互动,提供信息查询、知识学习、灵感激发等服务。山海大模型特点包括实时响应、情绪感知、音色切换和视觉场景理解,最新推出的山海多模态大模型,能实现实时...

AI写作提示词:从入门到精通,快速提升写作效率

1

FGJ博客 发布于 2024-08-24

在现代社会,AI已经渗透到我们的日常工作和生活中。然而,许多人对AI有一种天然的畏惧心理,觉得AI复杂难懂。其实,AI并不像想象中那么高深莫测,它更像是一个可以高效处理各类事务的智能助手。当你觉得工作任务繁琐无从下手时,AI可以帮你理顺思路,提升效率。 工作中的AI应用 在繁忙的...