奇虎360首席科学家颜水成讲座——人工智能杂谈
现场讨论:如果给你足够投资,你准备做款什么样的爆款AI-APP?
- 刚需
- 技术可行
- 形成技术壁垒
- 商业变现
理想与现实
在AI中成功的标志?
- 研究者:拥有单篇引用量很高的论文(Phd:100+,AI研究者:1000+)
- 创业者:DAU达到五千万
自动驾驶:目前还不是很现实,还有问题,如Uber的自动驾驶车车祸事件
情感机器人之梦
- 目前的技术与人的思维方式太远
人工智能的四个主要方向
- 视觉分析
- 语音分析
- 语义分析(对话)
- 大数据分析
工业界中AI的三种状态
- 初创级:专注于一个方向
- 百亿美金级
- 千亿美金级
人工智能的四元分析
- 场景
- 算法
- 算力
- 数据
学术界的人工智能:针对特定问题,探索新算法,追逐精度极限
工业界的人工智能:人工智能不是模板,和具体业务/场景结合才能有价值
- 中心:核心算法
- 前端:产品工程化,产品外观设计,产品市场营销
- 后端:训练系统架构,后台服务系统,AI硬件化
算法科学家与产品工程师的协调:算法虽然不完美,但可以做出无瑕疵的用户体验。
学术界:精度极限
工业界:产品体验。用户在使用中产生数据,数据推动算法迭代,从而提升用户体验。
深度学习模型
传统机器学习:特征设计、SVM
神经网络:学习特征
深度学习模型
- GAN:Generative Adversarial Network生成对抗网络
- Cycle-GAN:图像风格转换(油画-真实、黄种人-黑种人、橘子-苹果)
手机上目前还不能实时的运用这些模型
- Star-GAN
深度学习应用
图像
- 人脸特征点定位:在人脸检测的基础上,进一步定位出鼻子、眼睛、嘴巴等
- 人脸识别
- 人脸属性分析:年龄、性别、表情等
- 图像翻译成自然语言(Image Captioning)
文字
语音
大数据
- 大数据金融——信贷(风险控制、反欺诈、信用评价)。公司:宜信
深度学习:技术趋势
- 自学习【Learning from Invariances】
360的使命——安全
业务场景:安全+智能
AI布局
- 泛安全智能:家庭安全
- 短视频智能:海量视频管理;精细内容分析
- 端上智能(高效能AR特效套件):3D人脸特效;抠图;手势特效
- 大数据智能:
AI vs 安全
智能体的安全问题
- 传感器:被误导、失效。激光、图像让自动驾驶自盲或被误导
- 数据:隐私泄露、对抗样本的威胁
- 底层库(如tensorflow):(依赖)库、框架可能存在漏洞。Caffe平台攻击并劫持实例
- 联网:网络攻击
AI+区块链
代表公司
- Ocean:利用区块链数据交易与共享($3.4亿)
- CORTEX:在线inference,分布式运行用户上传模型(估值:$1.2亿)
- RAVEN PROTOCOL:利用闲置资源进行分布式计算
AI+区块链如何能高频刚需和无ICO运转?
QA
雷:AI+视频有什么令人振奋的突破吗?
颜:数据很有限。不知道要标记什么,标记的成本也很高。视频分析归根到底是图像,然后再推动视频级别研究的发展。还需要降低复杂度。【数据+速度】
雷:AR与AI的联系
颜:(互动:谁用过这【AR眼镜】东西)手机有一些瓶颈:得拿在手上。AR眼镜能解决。博物馆的电子展览。AR的应用会有很多。发展趋势:2B->2C,有线->无线
雷:AR有前景。旅行、教育、社交等等,将虚拟带入现实。技术一突破,内容与软件将会爆发。
雷:从科研到产业界,挑战与不同点?
颜:总结为几点:设计新的模型时,相比于学术界的精度,更多的去思考效率;最重要的一点,一开始不要想自己可以解决公司的所有的问题,先从一个重要的应用场景出发,融合算法和数据,让模型落地。对于用户体验,算法的提升没有数据带来的提升大。虽然数据很重要,算法可以带来颠覆性的变化。
数据和算法要齐飞。
同学:未来的3、5年,AI有什么落地的机会?
颜:数据分公有数据与私有数据。每个公司有自己特定的数据,为公司提供AI的服务,是一个机会。
同学:给学生步入AI的建议?
颜:不追求量,做有价值的工作。什么是有价值的工作?做的东西有没有通用性;做出的东西提升大(10%的提升)。花1年的时间踏踏实实、认认真真地去研究。