方向

如果人工智能是一块蛋糕,那么强化学习是蛋糕上的一粒樱桃,监督学习是外面的一层糖霜,无监督/预测学习则是蛋糕胚。目前我们只知道如何制作糖霜和樱桃,却不知如何制作蛋糕胚。

————Yann LeCun

强化学习从要完成的任务提取一个环境,从中抽象出状态(state) 、动作(action)、以及执行该动作所接受的瞬时奖赏(reward)。

 方向

【简介】https://blog.csdn.net/trillion_power/article/details/70992333

【应用】以前识别图片的AI,就只能干识别图片这一个事情,而通过强化学习,模型只要输入规则就可以干不同的事情。

            ①给出了学习算法的实际充分条件,以便在联合行动学习者的情况下实现动态安全可中断性,但表明这些条件对于独立

学习者是不够的。然而,我们表明,如果代理可以检测到中断,那么即使对于独立学习者,也可以修剪观察以确保动态安全中断。【14】

            ②神经机器翻译+强化学习,提高机器翻译准确率。【11】

              ③提出了一个明确考虑安全性的学习算法,用稳定性保证来定义。具体而言,我们扩展了Lyapunov稳定性验证的控制理论结果,并展示如何使用动态统计模型来获得具有可证明稳定性证书的高性能控制策略【15】

自然语言处理neural lauguage processing。以智能高效的方法分析文本数据中潜藏的信息。

NLP研究中的深度学习方法【17】

【应用】文本分类,情感分类,机器翻译,文档摘要,阅读理解等等。

            ①基于无监督训练,可直接调控生成文本情感。模型是在一个有 8200 万条亚马逊评论的语料库上训练了一个有 4096 个单元的乘法 LSTM(multiplicative LSTM),以用来预测一段文本中的下一个字符。论文最突出的地方是发现一个情感神经元(sentiment neuron),能很好的预测情感值,只要修改情感神经元的值就能控制生成文本的情感。【16】

            ②自动摘要。自动摘要系统有两个主要的方法:抽取式——从源文本中抽取最重要的部分来创建摘要;生成式——通过生成文本来创建摘要。从历史角度来看,抽取式自动摘要方法最常用,因为它的简洁性优于生成式自动摘要方法。

            ③机器翻译。【18】结合GAN网络提出了一种很有前景的方法,该方法不依赖于任何特定资源,且在多个语言对的词翻译、句子翻译检索和跨语言词汇相似度任务上优于顶尖的监督方法。

                                【11】神经机器翻译+强化学习,提高机器翻译准确率。

                                

GANGenerative Adversarial Nets,直译为生成式对抗网络。概率生成模型。可以用于自然图像的生成。假设给定1000万张图片之后,生成模型可以自动学习到其内部分布,能够解释给定的训练图片,并同时生成新的图片。方向

简介https://www.leiphone.com/news/201701/Hrv1qUS6GYl1vl7O.html

【应用】

            ①单张人脸(正面)合成不同姿态下的不同人脸,来解决在实际的人脸识别数据集中,侧面人脸训练样本分布不平衡导致人脸识别模型对于具有少量样本的姿态下的人脸识别失败的问题。【1】

            ②网络允许基于该人的图像和新姿势合成任意姿势的人物图像。【2】

            ③图片与图片之间的转换。【3】

            ④图像到图像的翻译。【4】

            ⑤提出了一种协议,可以与GAN训练相结合【5】

            ⑥从文本描述生成图像【6】

            ⑦将一个低分辨率的图片转化为一个高分辨率的图片。【7】

            ⑧GAN也逐渐被扩展到了视频处理领域,可以同时生成和预测下一视频帧【8】

             论文【9】从历史帧中学习来生成未来图像,利用RNN。

                论文【10】从图像对象识别到视频动作识别的转换学习。

                论文【12】GRCNN与BLSTM结合识别自然图像中的文字。

                论文【13】为图像生成字幕。比如:一只黄色的鸭子