手把手入门lenskit(1)
一、lenskit入门
1、lenskit介绍与开发环境搭建
这篇文章是入门lenskit推荐系统引擎库。
下面,我将要抒发下心情,之所以要写这样的文章,是源于自己一直以来的一个念头。之前的每天都被琐碎的事情牵住,今天中午在寝室睡觉的时候,突然冒起这个念头,择日不如撞日。另外一方面,学生生涯马上就要结束了,接下来进入工作,对推荐系统可能会有些远离。因此今天就认真的把这一切都给记录下来。
LensKit 是开源的推荐系统,这个系统是 Java开发的,来自美国的明尼苏达大学,也是推荐领域知名的测试数据集Movielens的作者,他们的推荐系统团队,在学术圈内的影响力很大,很多新的学术思想会放到这里。http://lenskit.org/。
Lenskit主要实现了协同过滤算法,它实现的算法包括基于项目的协同过滤算法Item-based CF、基于用户的协同过滤算法User-based CF、矩阵因子分解算法(Matrix factorization)以及Slope-One。
下面我将手把手的入门学习lenskit-hello-master,这个程序是官方提供的Lenskit入门程序https://github.com/lenskit/lenskit-hello。
好了,先介绍开发环境,开发IDE为IntelliJIDEA 14.0.2,IntelliJ是lenskit官方开发人员使用的开发IDE,如果想要使用eclipse,也是可以的。Jar包管理工具为gradle。
在这边插上一句,由于lenskit,仍然处于开发状态,因此lenskit版本之间的问题是要注意的。其官方介绍的文档(http://lenskit.org/documentation/)是基于lenskit 2.2.1。而我这边为了开发的方便,使用的版本为(milestone 3.0-M2)。
Lenskit-milestone3.0-M2是由Gradle管理jar包,因此需要安装、配置Gradle。具体安装、配置百度之。
小结开发环境为:IntelliJ IDEA14.0.2+ Lenskit milestone3.0-M2+ Gradle 3.2.1+jdk 1.7.0_79。
2、运行lenskit-hello
在搭建环境变量之后,可以运行Gradle命令,进行依赖jar的下载以及运行lenskit-hello产生推荐。
下面操作的前提条件是已经完成下载、解压lenskit-hello-master。
可以通过两种方式运行,一种是命令行,一种是IDE。下面我将分别介绍两种方法。
命令行方式:1、进入到lenskit-hello-master目录
2、查看(dir)文件夹下文件和目录。验证是否为lenskit-hello-master的根目录。
3、运行gradlewbuild编译命令。如果第一次运行,系统会自动下载所依赖jar包。(提示:第一次请选择网络较好的地方,或者在IDE下运行build命令)
4、运行成功标志位buildsuccess。提示:如果出现build failed原因一般为缺失jar包。
5、运行程序,产生推荐结果。(.\build\install\lenskit-hello\bin\lenskit-hello.bat <userid>)
IDE中:在IDE中需要配置build。具体配置如下:
1、打开run
2、第一次打开run,需要配置。即打开editconfiguration。
3、打开加号
4、找到gradle,打开配置界面
5、一般是什么操作就叫什么名称。如我是编译就叫build。Gradle project一定要选择到build.gradle那个文件。
Tasks:一定不能出错,这边对应gradle命令。
6、配置成功之后,就可以选择OK或者apply。
7、之后运行run》build。就可以自动编译。
8、运行可在dos窗口下产生推荐,IntelliJ提供一个终端,也可以在那里运行。
下一篇文章将要分析lenskit-hello源码