29 周刊 | 这周我看到的
HackPython 致力于有趣有价值的编程教学
用 GPT-2 编个故事吧
有关注自然语言处理 (NLP) 领域的朋友肯定听闻过 OpenAI 弄出的 GPT-2 模型????,在 2018 年至今,NLP 的大新闻不断,那段时间我主要在研究生成对抗网络 (GAN),对 NLP 也有关注,但并没有去详细研究模型的具体结构以及相应的数学原理????,可一个趋势是,训练模型需要的数据以及算力越来越大,模型的参数越来越多。
当下效果非常优秀的模型其参数量是巨大的,个人玩家就算有大量的数据以及模型算法也难以复现出 (算力就是钱????)。
周刊中就不讲的太过学术,简单来说,使用 GPT-2 就可以让计算机写出堪比真实文章 (人类写的) 一样流畅的文章????,但因为人类语言本身的高度复杂性,存在歧义以及不同语境下相同词汇可能不同含义等各种问题,GPT-2 也难以完美驾驭这些问题,但已经非常优秀了,写一下类似新闻这样语境不复杂的文章还是可以的????。
GPT-2 模型的代码是完全开源的,但就像前面提及的,个人玩家或者小公司因为缺少数据以及算力,难以复现,而且 OpenAI 声称完整的 GPT-2 模型具有 15 亿的参数,该模型力量过于强大,可以产生各种足以以假乱真的文章????,所以不将训练好的模型完全开源,只开源了部分,目前官方开源的最大的就是 345M 的 GPT-2,我们可以拉下来玩一下????。
但现在不用去拉也可以感受 GPT-2 的魔力,如下????
上面,我只输入了 'I feel',然后就一直按 Tab 键去生成文章,简单点几下,文章就生成好了,仔细看文章中的英文,单独的每句都是流畅的,但从整体上看,这个故事有点无厘头,不知道在讲什么...
可以体验一下,网址为:
https://transformer.huggingface.co/
阿波罗 11 号代码开源
阿波罗 11 号 (Apollo 11) 是美国国家航空航天局阿波罗计划的第五次载人任务,也是人类史上第一次的登月任务,发射时间为 1969 年 7 月 16 日从弗罗里达州肯尼迪航天中心 LC 39A 发射,就是下面的这个大家伙????
那个年代,计算机刚出现不久,一个计算机跟一个房间那样大????,在那个年代使用这样的计算机实现登月任务毫无疑问是一次壮举????,那时计算机的运算能力还不如当下的一部智能手机。
虚拟 AGC 和麻省理工科学博物馆将阿波罗 11 号的导航计算机 (简称:AGC) 中的指令模块 Comanche 055 以及登月模块 Luminary 099 的原始代码开源在了 github 上,任何人都可以浏览下载并使用????,如果你不是极具热情,就不要运行了,因为那个年代的代码是针对那个电脑计算机的架构设计的,当下的电脑可能都无法编译更别说运行了????。
Github 地址:https://github.com/chrislgarry/Apollo-11
但世界上从不缺少极具热情的人,他们使用这些开放的源码,尝试让 50 年前的登月系统跑起来,因为计算机架构的不同,所以他们就动手自制需要的设备,从第一集就开始就在制作设备了????。
在上一周,第 19 集,终于将 Apollo11 运行起来了,真的是非常酷????。
全程看下来,大多数需要专业知识的地方我都是看不同的,电路图在我看来也非常复杂,知识涉及的非常底层,而且人家也不是教程,不会解释的特别详细,但还是非常佩服????。
对了这个视频是没有字幕的,但 youtube 可以自动生成字幕并翻译,有兴趣的话可以 Google: AGC Restoration 来看看,996 的朋友就算有兴趣也难以有时间去做这样的事情????。
使用 mycli 来操作 MySQL
很多人在本地会使用 Navicat 等软件来操作 MySQL 数据库,但在服务器上使用 Navicat 就比较麻烦了,你可能需求上服务器上修改 MySQL 数据库的配置,让本地的 Naicat 可以远程链接,但这并不特别安全。
这里可以使用 mycli,一个使用 Python 开发的 MySQL 终端,亮点是可以给出相应的命令提示并且搜索的内容会以比较漂亮的格式显示出来????。
直接 pip install mycli 则可,如果是 ubuntu,也可以使用 apt-get 来安装。
本周金句
人情似纸张张薄,世事如棋局局新。--- 《增广贤文》
结尾
个人阅读以及精力有限,欢迎大家留言将有趣的内容分享出来,最后欢迎学习 HackPython 的教学课程并感觉您的阅读与支持。
????????