阿里云视觉Al笔记1

前言

阿里云提供了多个API可以进行人脸人体、文字识别、商品理解、内容安全、图像识别、图像生产、分割抠图、视觉搜索、目标检测、图像分析处理、视频理解、视频生产、视频分割13个类目,降低了使用难度。

1.视觉生产

视觉生产分类:
生成:0->1
扩展:1->N
摘要:N->1
升维:An->An+1
增强/变换:A->B
插入/合成:A + B -> C
擦除:A - B -> C

主要定义:
输入 -> 视觉生产 -> 产物

基础框架:
阿里云视觉Al笔记1

2.精细理解

原理 识别:首先需要啊知道是什么,方能根据分类进行处理。
阿里云视觉Al笔记1

而识别有许多难点 画面质量,光线,画面精度,边缘色
阿里云通过复杂问题拆解:
粗mask估计+精准matting
丰富数据样本:设计图像mask统一模型
阿里云视觉Al笔记1

3.阿里云视频处理

视频广告植入,植入位检测与定位,动态检测分割,视频内容擦除,文字擦除视频,高清划
HDR视频
阿里云视觉Al笔记1
阿里云视觉Al笔记1
在疫情期间阿里视觉的贡献:公共场所口罩佩戴监测系统-神荼
阿里云视觉Al笔记1