当前位置:CRM > 图像 第2页

单张图片引导,保留主体,风格百变,VCT帮你轻松实现(如何制作图片引导)

2023-08-23 00:04:01
单张图片引导,保留主体,风格百变,VCT帮你轻松实现(如何制作图片引导)
最近,来自网易互娱 AI Lab 的研究人员提出了一种基于单张图像引导的图像到图像编辑方案,给定单张参考图像,即可把参考图中的物体或风格迁移到源图像,同时不改变源图像的整体结构。研究论文已被 ICCV 2023 接收,相关代码已开源。...

拖拽下图像就能生成视频,中科大、微软等DragNUWA属实惊艳(如何制作可以拖动的图片)

2023-08-23 00:03:22
拖拽下图像就能生成视频,中科大、微软等DragNUWA属实惊艳(如何制作可以拖动的图片)
来自中国科学技术大学、微软亚研和北京大学的研究者提出了一种基于开放域扩散的新型视频生成模型 ——DragNUWA。DragNUWA 从语义、空间和时间三个角度实现了对视频内容的细粒度控制。...

你在直播间看到的高清1080P,可能还没720P画质好

2023-08-02 18:01:40
你在直播间看到的高清1080P,可能还没720P画质好
目前业内很多主流的终端实时超分算法更集中在PC端,PC端的设备相对可以提供更强的算力,实现高性能的视频画质实时增强。...

AI「心灵之眼」被看透!大改神经网络,模型生成背后逻辑首现(心灵之眼是什么意思)

2023-07-25 12:01:02
AI「心灵之眼」被看透!大改神经网络,模型生成背后逻辑首现(心灵之眼是什么意思)
许多图像都具有某种艺术特质——让人感觉它们是对世界上也许是平凡的事物或简单、本质上是数学模式的某种「心灵诠释」。...

斯坦福博士一己之力让Attention提速9倍!FlashAttention燃爆显存,Transformer上下文长度史诗级提升

2023-07-18 18:00:57
斯坦福博士一己之力让Attention提速9倍!FlashAttention燃爆显存,Transformer上下文长度史诗级提升
速度上快2倍,意味着研究人员可以用与之前训练8k上下文模型相同的成本,来训练16k上下文长度的模型。这些模型可以理解长篇书籍和报告、高分辨率图像、音频和视频。...

无需点跟踪,克服DragGAN缺陷!中科大联合上海AI Lab发布FreeDrag:可稳定拖动语义内容

2023-07-14 18:01:08
无需点跟踪,克服DragGAN缺陷!中科大联合上海AI Lab发布FreeDrag:可稳定拖动语义内容
FreeDrag无需点跟踪,即可实现更高质量的拖动编辑效果!...

用SAM做零样本视频对象分割!港科大等开源首个「稀疏点传播」方法SAM-PT,性能直追有监督SOTA

2023-07-10 18:01:30
用SAM做零样本视频对象分割!港科大等开源首个「稀疏点传播」方法SAM-PT,性能直追有监督SOTA
把图像分割模型SAM扩展到视频,用SAM-PT做视频对象分割也能实现零样本、高性能!...

图像生成过程中遭「截胡」:稳定扩散的失败案例受四大因素影响

2023-06-12 12:00:56
图像生成过程中遭「截胡」:稳定扩散的失败案例受四大因素影响
稳定扩散(Stable Diffusion)并不稳定?...

用GPT-4实现可控文本图像生成,UC伯克利&微软提出新框架Control-GPT

2023-05-31 18:00:58
用GPT-4实现可控文本图像生成,UC伯克利&微软提出新框架Control-GPT
扩散模型虽好,但如何保证生成的图像准确高质量?GPT-4或许能帮上忙。...

Midjourney与Stable Diffusion大比拼

2023-05-26 18:01:47
Midjourney与Stable Diffusion大比拼
虽然这两款AI图像生成器都非常出色,但它们在自定义功能、美术风格、易用性、定价等方面存在明显差异。因此,在本文中,我们介绍了如何将二者区分开,以及您应该使用哪一款。...