本周AI热点回顾:你家的猫也能来段东北话了:三种方言随意换、算法战争:美国国家AI安全委员会要建立AI大学...
01
你家的猫也能来段东北话了:三种方言随意换,还能配出《舌尖》风
日常想给家里的蠢猫拍个视频配个音,需要几步?
不不不,现在有了AI的加持,只需打开App,输入文本,秒秒钟就能搞定。
不只是四川话配音,东北老妹音也可以整起来:
文字转语音,其实并不是什么新鲜事。
不过,在此之前,此类语音合成技术主要面向B端用户,应用场景主要是资讯播报、订单播报、朗读听书等。
而对于C端用户,特别是有视频配音需求的用户而言,AI配音只有更生动、更自然、更具韵律,才能真正满足他们的需求。
另外,面向B端的产品,可以对文本的规律、意义进行限定。面向C端用户时,则无法预测用户的输入情况。
而端到端的深度神经网络语音参数生成算法,可以让生成的语音参数连续性和稳定性得到较大幅度的提升,体现在听感上会使得语音更加真实和自然。
同时,为了能够最大限度保留配音角色的说话韵律风格,在生成算法中还加入了风格控制自回归编码网络,使得每一个配音音色的说话韵律特点都能体现出来。
信息来源:量子位
02
Python继续霸榜,上古语言Cobol重获关注,IEEE 2020编程语言榜单揭晓
IEEE 发布了最新的编程语言排行榜。与 2019 年相比,Python、Java、C 和 C++ 依然分列总榜单前 4,而 JavaScript 取代了 R 语言成了榜单的第 5 名。此外,在趋势、需求和开源等其他子榜单中,Python 持续领先,Java 和 C 语言同样表现优异。
近日,IEEE Spectrum 发布了第七届编程语言排行榜。Python 再次名列第一,top 5 中的其他几种语言分别是 Java、C、C++ 和 JavaScript。去年的第五名 R 语言这次排名下滑到第 6,与 JavaScript 调换了位置。
根据介绍,IEEE 2020 编程语言排行榜从 8 个信息源按照 11 个指标收集数据,进而得到编程语言流行度的整体排名。
信息源包括:Google Search、Google Trends、Twitter、GitHub、Stack Overflow、Reddit、Hacker News、CareerBuilder 等,涵盖社交网站、开源代码网站和求职网站。
该调查从 GitHub 上收集了 300 多种编程语言,经过筛选后最终留下 55 种。其中包括大多数计算机用户熟悉的语言(如 Java),老牌编程语言 Cobol 和 Fortran,小众编程语言 Haskell 等。
IEEE 2020 编程语言排行榜涵盖 4 种不同的编程语言类型,分别是用于开发网站和应用的语言,用于企业、桌面和科学应用的语言,用于移动设备端的语言以及用于嵌入式环境的语言。
排名类型分为整体排名、趋势排名、工作、开源、自定义五种。
在该排行榜中,top 10 编程语言的整体排名如下:
在这一新设置下,我们仍然可以看到 Python 继续保持领先地位,其次是 Java 和 C 语言,分列榜单二、三名。与去年相比,前两名 Python 与 Java 的距离继续拉大,Python 依然保持强劲的上升势头。
信息来源:机器之心
03
AI数据获取难?飞桨PaddleFL开源纵向联邦学习方案,进一步降低企业AI应用门槛
飞桨PaddleFL意在帮助联邦学习的探索者更方便地实现不同的策略及算法,在较短的时间内完成框架搭建、算法实现和业务调研等工作。本次PaddleFL 1.0版本主要开源了MPC安全共享计算方案,支持横向、纵向、迁移等多个联邦学习场景,进一步降低企业联邦学习的门槛,使更多数据获取难的企业可以通过联邦学习受益。
在ABY3协议中,参与方可分为:数据拥有方(以下简称:输入方)、计算方和结果方,三者关系如下图所示:
输入方:为训练数据及模型的持有方,负责加密数据和模型,并将其发送到计算方。根据ABY3要求,数据输入方数据量≥2个。
计算方:模型训练的执行方,基于ABY3协议完成训练任务,计算方只能得到加密后的数据及模型,以保证数据隐私,根据ABY3要求,计算方的数量为3个。
结果方:计算结束后,结果方获取到计算结果并恢复出明文数据。
值得注意的是,在这个过程中每个参与方都可以充当多个角色。只要参与方具有计算能力,即可作为计算方参与训练,在这个过程中,数据都以密文形式传输。
这类似狼人杀游戏,游戏中有三个角色,每个角色可以有多个充当(大于等于X)。在打牌过程中,我们会根据牌面信息给予其他参与方提示,保证牌局顺利进行,但是会尽力而为直接不暴露角色信息,直到游戏结束。下一轮游戏中,个人角色可能会变化,但是游戏规则不变。
那么在这个过程中PFM如何
保障各角色之间的数据安全呢
PFM的整个训练及推理过程主要由如下三个部分组成:数据准备、训练/推理和结果解析,三者关系如下图所示:
-
数据对齐:PFM允许输入方在不泄露数据的情况下,基于同样的User ID,找出多个输入方的样本集合,在此过程中保证数据加密。这个功能在纵向联邦学习中非常必要。为啥这么说呢?因为在纵向联邦学习中,不同输入方拥有不同的Feature Space,所以需要找到多个数据集中相同的用户。
例如:三个做商品推荐的公司做联邦学习,一个公司持有歌曲相关的数据;一个持有电影相关的数据;一个公司持有用户点击相关的数据。在进行联邦学习之前,三家公司需要找出相同用户的集合,并且保证相同位置(第n条)对应相同的用户。数据对齐后,输入方将数据和模型用Secret Sharing方式加密,并传递给计算方。因为每个计算方只拿到数据的一部分,因此任意一方都无法还原真实数据。
训练/推理: PFM 拥有与飞桨相同的运行模式。在训练前,用户需要定义MPC协议、训练模型以及训练策略。PFM中提供了可以操作加密数据的算子,在运行时算子的实例会被创建并被执行器依次运行。
结果解析:安全训练和推理工作完成后,模型(或预测结果)将由计算方以加密形式输出。结果方收集到加密的结果后,使用PFM中的工具对其进行解密,并将明文结果传递给用户。
信息来源:飞桨PaddlePaddle
04
算法战争:美国国家AI安全委员会要建立AI大学,「数字服务学院」为政府培养AI人才
中国在经济与军事方面的崛起,以及AI更多地渗入商业与政府。在时代引发的担忧下,美国国会于2018年成立美国国家AI安全委员会(NSCAI),旨在为涉及国防、研究投资和战略规划的国家AI战略提供咨询。
委员会成员多为科技高管,包括亚马逊云服务首席执行官Andy Jassy、谷歌云计算首席AI科学家Andrew Moore和微软首席科学家Eric Horvitz等。谷歌前首席执行官埃里克·施密特(Eric Schmidt)担任董事长。
该小组的建议可能会对美国政府和世界产生长期影响。去年秋天,NSCAI就如何保持国家在AI方面的优势向国家领导人提供建议。包括建立公私合作关系和政府资助半导体发展,以及使用ASVAB军事入学考试来识别具有「计算思维」的新兵。
本周,NSCAI就如何美国维持AI霸权提供了35条建议。下周,科技公司的CEO们或将前往华盛顿参加反垄断听证会。
另外,建议还包括建立以军事后备队为模型的国家后备军。AI人才们可以兼职为政府做出贡献。但与要求技术人员服务一年的美国数字服务不同,NRDC只要求每年工作至少38天。
虽然许多委员在会议上强调了捍卫人工智能在其他民族国家的霸权的必要性,但微软的Horvitz表示,「说实话,我们最大的竞争对手是现状和创新。」
NSCAI是一个临时组织,定于明年春天向国会提交最终报告,并将于2021年10月解散。
信息来源:新智元
05
本周论文推荐
【ACL 2020 | 百度】:AI 辅助临床诊断
Towards Interpretable Clinical Diagnosiswith Bayesian Network Ensembles Stacked on Entity-Aware CNNs
论文介绍:
基于电子病历(EMR)的智能化诊断算法是 AI 医疗研究领域最重要、最活跃、应用最广泛的问题之一。
传统的诊断算法或者直接使用端到端分类模型,丢失了可解释性,或者仅基于知识关系和规则进行推理,可迁移、可扩展性低。本研究提出一种新的诊断算法框架,该框架针对EMR具有无结构化文本和结构化信息并存的特点,结合医疗NLU,以深度学习模型实现EMR的向量化表示、诊断预分类和概率计算。
结合医疗知识图谱增强的多种贝叶斯网络的组合模型,实现具有可解释性的诊断推理。该框架能同时兼顾高诊断准确率和强可解释性的特点,并可应用于面向基层医师的辅助临床诊断产品中。
END