5/28 修改访问记录方式
最近这两周考试有点忙,博客更新的不怎么勤,完成的工作也比较少。
今天仔细看了一下序列挖掘的原理,发现我上次写的那个访问记录方式完全不够用的啊,那样的就没有时间序列的感觉了。但是这样抛弃掉计数加一的方法,直接多一次访问多一条记录也不行,相当于记录下来全部的访问,这样上线没几天访问量就会爆炸。考虑到如果我最近在学某一门课,那么可能会频繁的访问同一门课,而连续的多次访问对于序列来说是和一次访问等价的,这样我就有了新思路:
以用户为主体,如果这个用户的上次访问和这次访问是同一个课程,那么数据库里这一用户的最后一条记录计数加一;如果不是同一个课程,认为开始学某个新的课程了,创建一条新纪录。