入坑就对了!如何用机器学习甄别真假美猴王?
引言
文章开篇,给大家分享个对机器学习有意思的解释:
- 孙悟空(Real data):我是孙悟空。
- 如来(D net):你是真的。
- 六耳猕猴(G net):我是孙悟空。
- 如来:你是假的。
- 孙悟空:我是孙悟空。
- 如来:你是真的。
很多很多次以后......
- 六耳猕猴:我是孙悟空。
- 如来:你是真的。
所谓机器学习是一种新的编程方式,它不需要人类来总结经验、输入逻辑,人类只需要把大量数据输入给计算机,然后计算机就可以自己总结经验归纳逻辑,这个过程就叫训练,训练过后得到一个模型,这个模型就可以用来代替人去做判断了,训练得比较好的模型甚至可以达到超过人类的判定准确度。
本次数据技术大会,我们邀请到了来自百度、微软、链家、苏宁、58集团等5位高级技术专家,通过对自己平台的实践经验的分享,主要针对以下5个议题展开讨论:
基于深度学习的图片检索应用
会话系统实战-苏宁聊商平台
机器学习技术在房屋估价中的应用
基于Azure云计算的人工智能和机器学习平台
…………
2017第八届中国数据库技术大会(DTCC2017)将于2017年5月11-13日,历时3天,汇集来自互联网、电子商务、金融、电信、政府、行业协会等20多个领域的120多位技术专家,共同探讨Oracle、MySQL、NoSQL、云端数据库、智能数据平台、区块链、数据可视化、深度学习等领域的前瞻性热点话题与技术。
其中,5月12日,特设专场11: 机器学习,邀请各大互联网公司顶级专家,分享内容涵盖: 图片数据的检索、机器学习技术在房屋估价、基于Azure云计算的人工智能、机器学习在二手交易平台等技术方向。
专场11: 机器学习
5月12日 下午13:30-18:00
朱剑锋
百度深度学习研究院高级研发工程师
基于深度学习的图片检索应用
5月11日下午13:30-14:20
演讲简介:
传统的图片检索技术主要基于文本query和图片周边文本的匹配,而对图片本身的语义信息利用相对较少。近年来,受益于深度学习的快速发展,计算机视觉及自然语言理解等技术不断进步。对于文本和图片,我们可以提取出精准、丰富的语义信息,从而实现比传统方法更加准确的图文匹配。使用百度开源的PaddlePaddle深度学习平台,我们可以在亿级规模的文本和图片数据上轻松训练模型。我们使用深度图文语义模型,在正版图片检索引擎——百度像素上取得了很好的效果。
李伟
苏宁技术研究院北京分院负责人
会话系统实战-苏宁聊商平台
5月11日下午14:20-15:10
演讲简介:
随着人工智能、大数据和云计算的飞速发展,人机会话已经无处不在,并成为研究和工业界的热点问题,各种闲聊陪伴和专业助理等智能聊天机器人已经在线上和线下广泛应用,取得不错效果。本次分享会介绍会话系统的演进、基本构成、相关架构,涉及的模型、算法等,并结合实际案例,分享苏宁的聊商平台是如何实现人机沟通和交互的。
宋鑫
链家网数据挖掘资深研发工程师
机器学习技术在房屋估价中的应用
5月11日下午15:10-16:00
演讲简介:
房屋估价是链家网为买家、卖家、经纪人三方提供议价基础的工具,目前日均调用量8W次,超过链家网每日电话+IM数量。房屋估价为早期用户提供与平台发生交互的入口,为潜在买房者和卖房者提供价格预估,有效增大用户粘性。目前,北京平均准确率80%(估价误差在5%以内认为估价准确),平均误差4.3%.
刘士君
微软(中国)有限公司云平台技术顾问
基于Azure云计算的人工智能和机器学习平台
5月12日下午16:20-17:10
演讲简介:
人工智能最近成为了各个行业炙手可热的话题,不论是互联网行业还是传统行业,都在通过机器学习和深度学习寻求业务转型和业务创新。微软提供了与机器学习和人工智能相关的不同平台不同层次的工具和算法,从API层的认知服务,到模块化的Machine Learning Studio,再到Azure Spark和R服务,甚至是构建深度学习架构的底层CNTK服务等,一应俱全。本次演讲将涵盖微软提供的各种机器学习和人工智能服务,介绍如何通过它们快速搭建自己的机器学习算法服务,并展示相关应用案例。
孙玄
58集团技术委员会主席
机器学习在二手交易平台中的应用实践
5月12日下午17:10-18:00
演讲简介:
机器学习是人工智能的一个重要分支,近几年发展非常迅速,各种算法不断革陈出新,各行业应用也层出不穷,机器学习也被认为人工智能的未来。本文结合二手交易平台的特点,深入探讨机器学习的应用实践,包括用户画像建设实践、知识图谱建设实践、机器学习算法实践以及如何综合利用上述技术大幅度提升CTR、CVR。
5月12日大会议程预告
扫码查看,大会3天完整议程