达摩院视觉AI训练营-视觉AI技术应用探索-学习笔记
一、视觉生产定义
定义:
通过一个/一系列视觉过程,产出新的视觉表达
分类:
生成:从0到1
拓展:从1到N
摘要:从N到1
升维:从An到An+1
增强/变换:从A到B
插入/合成:A+B=C
擦除:A-B=C
通用基础框架
五个关键维度
二、精细理解—寻微入里
分割抠图—难点:
分割抠图—解题思路:
分割抠图—模型框架:
分割抠图—人像抠图拓展:
分割抠图—物体抠图拓展:
分割抠图—场景抠图拓展:
三、视觉生成—从无到有
视觉生成—鹿班
鹿班是是视觉生成邻域在业界落地的先行者,对外提供大规模在线的AI设计服务
视觉生成—框架流程
视觉生成—鹿班电商设计
照图生图
个性化设计
视觉生成—鹿班场景智能美工
视觉生成—AlilibabaWood短视频设计生成
视觉生成—框架流程
视觉生成—视频摘要
视觉生成—视频封面
四、视觉编辑—移花接木
视觉编辑—视频植入
其他视觉编辑功能
动态检测分割、植入位检测与定位、视频内容擦除、文字擦除、Logo擦除、画幅变化、图像尺寸变化等。
五、视觉增强—修旧如新
视觉增强—视频增强
视觉增强—人脸修复增强
人脸是最重要的目标对象,对人像进行细节修复增强,有很重要的意义和价值
其他视觉增强功能
渲染图超分、视频超分、视频插帧、HDR色彩扩展、风格迁移、颜色拓展等。
六、视觉制造—由虚入实
视觉制造—核心逻辑
其他视觉制造功能
包装几何生成、服装几何生成、材质工艺、视觉迁移及融合、多样性拓展2D3D融合等。
七、视觉智能开放平台—万剑归宗
视觉智能开放平台—定位
视觉智能开放平台—官网
vision.aliyun.com
视觉智能开放平台—能力分布
视觉智能开放平台—特点
八、 总结
通过达摩院视觉AI训练营,进一步对视觉AI技术进行了了解。笔记自用,详细学习请访问阿里视觉智能开放平台。