基于图书馆进馆和外借记录的分析
引 言
当前,传统的图书馆借阅服务模式正在向以读者为中心的智慧型知识服务模式转变,这正成为图书馆服务模式未来发展的必然趋势。 随着信息技术水平的发展和用户个性化阅读服务需求的提升,图书馆在其服务建设上必须突出“智慧性”以满足读者的阅读体验和满意度。在当前泛在信息环境下,知识弥漫对图书馆的知识服务能力和水平提出了更高的要求,用户关注的重点已从简单发现信息转变为以最高效的方式获取满足自身个性化需求的知识资源。图书馆个性化推荐则是指以读者的个人背景、专业、习惯、爱好和提出的特别要求等为依据,对每一个读者提供个性化的推荐服务。为此,我们根据已有的可靠数据,以SPSS为辅助工具,分析学生们在大学期间利用图书馆的习惯变迁,其中包括对学院,专业,外借书籍类别等特征的分析并提出相应的书籍推荐服务。
一、挖掘目标
本文的目标是通过挖掘图书馆2020年~2024年统计的进馆与外借记录数据,分析包括外借书籍的类别,进馆与外借的频度与关联,学院、专业或班级的差异等特征,刻画描述该年级同学在大学四年间利用图书馆的习惯及其伴随时间的迁移,并进行可视化的展示。
二、数据来源
本次数据源自官方提供的某个年级学生的图书馆进馆和外借记录。其中进馆记录包含两个字段,学号和进馆时间,比如160109 20200906105603记录表示学号为160109的学生在2020年09月06日10时56分03秒刷卡进馆,共计233384条记录。外借记录包含三个字段,分别是学号,外借时间和索书号,比如160104 20240605191803 O342/6-2 记录表示学号为160104的学生在2024年06月05日19时18分03秒外借了索书号为O342/6-2的图书。共计23963条记录。进一步,学号由学院,专业班级编号和班内顺序号组成,比如160109表示学院编号为16,专业编号为0,同专业班级序号为1,该生在班内的编号为09。索书号依据《中国图书馆图书分类法》取号,比如O342/6-2表示固体力学类的图书。我们将运用SPSS,对变量进行频数统计、相关分析等手段,旨在了解该年级同学们在大学四年间利用图书馆的习惯及其伴随时间的迁移。
三、数据处理
在数据分析之前我们首先对进馆记录和外借记录进行质量检验,其中进馆时间存在重复记录,我们对其进行去重操作。
进馆时间原始数据:
去重后有效数据:
四、数据分析
1、各学院2020年~2024年借书统计量分析:
学院 | |||||
| 频率 | 百分比 | 有效百分比 | 累积百分比 | |
有效 | 16 | 5625 | 23.5 | 23.5 | 23.5 |
23 | 6044 | 25.2 | 25.2 | 48.7 | |
24 | 6747 | 28.2 | 28.2 | 76.9 | |
26 | 5057 | 21.1 | 21.1 | 98.0 | |
28 | 490 | 2.0 | 2.0 | 100.0 | |
合计 | 23963 | 100.0 | 100.0 |
|
由直方图可直观看出,学院24的借书量最大,为6747本,而学院28的借书量最少只有490本。其他三个学院差距较小。
2、该年级同学在2020年~2024年借书变化:
年份 | |||||
| 频率 | 百分比 | 有效百分比 | 累积百分比 | |
有效 | 2020 | 2345 | 9.8 | 9.8 | 9.8 |
2021 | 6998 | 29.2 | 29.2 | 39.0 | |
2022 | 7632 | 31.8 | 31.8 | 70.8 | |
2023 | 5077 | 21.2 | 21.2 | 92.0 | |
2024 | 1911 | 8.0 | 8.0 | 100.0 | |
合计 | 23963 | 100.0 | 100.0 |
|
由折线图可以直观地看出,随着入学时间的推进借书量越来越大,尤其是在大一这一年,借书量增长迅速。大二开始借书的频率有所下降。但到了2022年大家开始上大三以后借书量开始骤然减少,当同学们慢慢进入大四借书量达到谷底。
3、各学院大学四年外借书籍类别分析
学院16的借书统计
类别 | |||||
| 频率 | 百分比 | 有效百分比 | 累积百分比 | |
有效 |
| 1 | .0 | .0 | .0 |
马克思主义、列宁主义、毛泽东思想 | 53 | .9 | .9 | 1.0 | |
哲学 | 237 | 4.2 | 4.2 | 5.2 | |
社会科学总论 | 100 | 1.8 | 1.8 | 7.0 | |
政治、法律 | 114 | 2.0 | 2.0 | 9.0 | |
军事 | 17 | .3 | .3 | 9.3 | |
经济 | 183 | 3.3 | 3.3 | 12.5 | |
文化、科学、教育、体育 | 89 | 1.6 | 1.6 | 14.1 | |
语言、文字 | 210 | 3.7 | 3.7 | 17.8 | |
文学 | 1818 | 32.3 | 32.3 | 50.2 | |
艺术 | 95 | 1.7 | 1.7 | 51.9 | |
历史、地理 | 208 | 3.7 | 3.7 | 55.6 | |
自然科学总论 | 6 | .1 | .1 | 55.7 | |
数理科学和化学 | 640 | 11.4 | 11.4 | 67.0 | |
天文学、地理科学 | 23 | .4 | .4 | 67.4 | |
生物科学 | 4 | .1 | .1 | 67.5 | |
医学、卫生 | 16 | .3 | .3 | 67.8 | |
工业技术 | 1504 | 26.7 | 26.7 | 94.5 | |
交通运输 | 227 | 4.0 | 4.0 | 98.6 | |
航空、航天 | 1 | .0 | .0 | 98.6 | |
环境科学、劳动保护科学(安全科学) | 37 | .7 | .7 | 99.3 | |
综合性图书 | 42 | .7 | .7 | 100.0 | |
合计 | 5625 | 100.0 | 100.0 |
|
学院16外借书籍集中在文学、工业技术和数理科学和化学,其中文学类最多。从书籍集中类别可以猜想这个学院是理科学院,课业要求可能比较繁重,但仍有自己支配的自由时间,可以欣赏文学作品。如果给这个学院推荐书籍,建议从这三类书中推荐。
学院23的借书统计
类别 | |||||
| 频率 | 百分比 | 有效百分比 | 累积百分比 | |
有效 | 马克思主义、列宁主义、毛泽东思想 | 31 | .5 | .5 | .5 |
哲学 | 232 | 3.8 | 3.8 | 4.4 | |
社会科学总论 | 309 | 5.1 | 5.1 | 9.5 | |
政治、法律 | 226 | 3.7 | 3.7 | 13.2 | |
军事 | 2 | .0 | .0 | 13.2 | |
经济 | 1585 | 26.2 | 26.2 | 39.5 | |
文化、科学、教育、体育 | 90 | 1.5 | 1.5 | 40.9 | |
语言、文字 | 269 | 4.5 | 4.5 | 45.4 | |
文学 | 1617 | 26.8 | 26.8 | 72.2 | |
艺术 | 172 | 2.8 | 2.8 | 75.0 | |
历史、地理 | 159 | 2.6 | 2.6 | 77.6 | |
自然科学总论 | 17 | .3 | .3 | 77.9 | |
数理科学和化学 | 442 | 7.3 | 7.3 | 85.2 | |
天文学、地理科学 | 14 | .2 | .2 | 85.5 | |
生物科学 | 5 | .1 | .1 | 85.5 | |
医学、卫生 | 21 | .3 | .3 | 85.9 | |
工业技术 | 833 | 13.8 | 13.8 | 99.7 | |
交通运输 | 2 | .0 | .0 | 99.7 | |
环境科学、劳动保护科学(安全科学) | 18 | .3 | .3 | 100.0 | |
合计 | 6044 | 100.0 | 100.0 |
|
学院23外借书籍集中在文学、经济和工业技术,其中文学类和经济最多。而其也有很多种类别有所涉猎。从书籍集中类别可以猜想这个学院是经管学院,课业要求比较轻松,同学们知识涉猎范围广泛。如果给这个学院推荐书籍,建议推荐文学和经济书。
学院24的借书量统计
类别 | |||||
| 频率 | 百分比 | 有效百分比 | 累积百分比 | |
有效 | 马克思主义、列宁主义、毛泽东思想 | 4 | .1 | .1 | .1 |
哲学 | 101 | 1.5 | 1.5 | 1.6 | |
社会科学总论 | 41 | .6 | .6 | 2.2 | |
政治、法律 | 16 | .2 | .2 | 2.4 | |
军事 | 2 | .0 | .0 | 2.4 | |
经济 | 81 | 1.2 | 1.2 | 3.6 | |
文化、科学、教育、体育 | 35 | .5 | .5 | 4.1 | |
语言、文字 | 86 | 1.3 | 1.3 | 5.4 | |
文学 | 656 | 9.7 | 9.7 | 15.1 | |
艺术 | 518 | 7.7 | 7.7 | 22.8 | |
历史、地理 | 101 | 1.5 | 1.5 | 24.3 | |
自然科学总论 | 18 | .3 | .3 | 24.6 | |
数理科学和化学 | 154 | 2.3 | 2.3 | 26.9 | |
天文学、地理科学 | 19 | .3 | .3 | 27.2 | |
生物科学 | 3 | .0 | .0 | 27.2 | |
医学、卫生 | 9 | .1 | .1 | 27.3 | |
农业科学 | 2 | .0 | .0 | 27.4 | |
工业技术 | 4857 | 72.0 | 72.0 | 99.3 | |
交通运输 | 20 | .3 | .3 | 99.6 | |
环境科学、劳动保护科学(安全科学) | 10 | .1 | .1 | 99.8 | |
综合性图书 | 14 | .2 | .2 | 100.0 | |
合计 | 6747 | 100.0 | 100.0 |
|
学院24外借书籍基本全部集中在工业技术类别,以及少量借阅了文学和艺术书籍。从书籍集中类别可以猜想这个学院是工科学院,而且课业紧张,同学们大量的时间精力都用在了拓展自己的专业能力,导致其他方面的兴趣涉猎较少。如果给这个学院推荐书籍,建议推荐工业技术相关的专业书籍。
学院26的借书量统计
类别 | |||||
| 频率 | 百分比 | 有效百分比 | 累积百分比 | |
有效 | 马克思主义、列宁主义、毛泽东思想 | 8 | .2 | .2 | .2 |
哲学 | 323 | 6.4 | 6.4 | 6.5 | |
社会科学总论 | 626 | 12.4 | 12.4 | 18.9 | |
政治、法律 | 682 | 13.5 | 13.5 | 32.4 | |
军事 | 15 | .3 | .3 | 32.7 | |
经济 | 713 | 14.1 | 14.1 | 46.8 | |
文化、科学、教育、体育 | 118 | 2.3 | 2.3 | 49.1 | |
语言、文字 | 114 | 2.3 | 2.3 | 51.4 | |
文学 | 1522 | 30.1 | 30.1 | 81.5 | |
艺术 | 466 | 9.2 | 9.2 | 90.7 | |
历史、地理 | 151 | 3.0 | 3.0 | 93.7 | |
自然科学总论 | 3 | .1 | .1 | 93.8 | |
数理科学和化学 | 78 | 1.5 | 1.5 | 95.3 | |
生物科学 | 4 | .1 | .1 | 95.4 | |
医学、卫生 | 15 | .3 | .3 | 95.7 | |
工业技术 | 211 | 4.2 | 4.2 | 99.8 | |
交通运输 | 4 | .1 | .1 | 99.9 | |
环境科学、劳动保护科学(安全科学) | 3 | .1 | .1 | 100.0 | |
综合性图书 | 1 | .0 | .0 | 100.0 | |
合计 | 5057 | 100.0 | 100.0 |
|
学院26外借书籍大部分集中在文学、经济、政治法律和社会科学方面,以及其他类别的书均有涉及。从书籍集中类别可以猜想这个学院是文科学院,而且课业较轻松,同学们涉猎的知识面广泛。如果给这个学院推荐书籍,建议以文学书籍为主。
学院28的借书量统计
类别 | |||||
| 频率 | 百分比 | 有效百分比 | 累积百分比 | |
有效 | 哲学 | 50 | 10.2 | 10.2 | 10.2 |
社会科学总论 | 7 | 1.4 | 1.4 | 11.6 | |
政治、法律 | 2 | .4 | .4 | 12.0 | |
军事 | 6 | 1.2 | 1.2 | 13.3 | |
经济 | 3 | .6 | .6 | 13.9 | |
文化、科学、教育、体育 | 7 | 1.4 | 1.4 | 15.3 | |
语言、文字 | 54 | 11.0 | 11.0 | 26.3 | |
文学 | 136 | 27.8 | 27.8 | 54.1 | |
艺术 | 43 | 8.8 | 8.8 | 62.9 | |
历史、地理 | 22 | 4.5 | 4.5 | 67.3 | |
自然科学总论 | 1 | .2 | .2 | 67.6 | |
医学、卫生 | 13 | 2.7 | 2.7 | 70.2 | |
工业技术 | 138 | 28.2 | 28.2 | 98.4 | |
交通运输 | 7 | 1.4 | 1.4 | 99.8 | |
综合性图书 | 1 | .2 | .2 | 100.0 | |
合计 | 490 | 100.0 | 100.0 |
|
学院28外借书籍比较少,大部分集中在文学和工业技术方面,以及其他类别的书均有涉及。从书籍集中类别可以猜想这个学院可能是理学学院,而且课业较轻松,同学们涉猎的知识面广泛。如果给这个学院推荐书籍,建议以文学和工业技术书籍为主。
4、该年级同学进馆和外借书籍的相关性分析
相关性 | |||
| 进馆时间 | 外借时间 | |
进馆时间 | Pearson 相关性 | 1 | .474** |
显著性(双侧) |
| .000 | |
N | 233336 | 23912 | |
外借时间 | Pearson 相关性 | .474** | 1 |
显著性(双侧) | .000 |
| |
N | 23912 | 23963 | |
**. 在 .01 水平(双侧)上显著相关。 |
在进行进馆时间和外借时间的相关分析时,先将两个变量基于相同变量—学号进行统计,然后严格按照精确到秒的时间进行相关性分析。由以上表格可以看出,相关系数为0.474,进馆与外借比较相关。
此外,将进馆时间和外借时间简要到年月时,观察两种变量的散点图所呈现的状态,可以粗略看出相关性较好。
5、各专业在大学四年进馆频率的变迁
观察上图,“1”代表大一上,“1-2”代表大一下至大二上,“2-3”代表大二下至大三上,“3-4”代表大三下至大四上,“4”代表大四下。我们得出结论:尽管专业不同,整体趋势大致相同,均是在入学后去图书馆的频率逐渐增大,这期间也是从适应大学生活到熟悉校园设施,以及对专业课程逐渐深入的过程。然而在大三下至大四上这一学年,进馆频率有所下降,我们推断是在这个时间段是同学们做出接下来人生选择的重要阶段。有人选择考研、出国、工作,同时专业课相对减少。在这期间可能有些人去实习,去上辅导班等,因此,去图书馆的次数减少也能得到解释。接着又有一大幅度增长出现在大四下,我们推断这则是因为毕业设计需要查找许多资料,所以又推动了同学们去图书馆。
五、总结
以上是我们以SPSS为辅助工具,分析已有的图书馆的进馆数据得出的所有结论。在整个实验过程中,我们遇到的最大的问题就是分析要点的把握,从一开始面对规模较大的数据摸不着头绪到沉下心来慢慢学习数据分方法论,整理分析思路,理清分析框架后,我们才对数据有了整体上的把握,从而进行越来越深入的研究。在分析过程中,我们得出的结果相对符合我们预期结果,经过思考也可以解释的通。并且在已有结论上,根据同学们使用图书馆的习惯,和外借书籍的类别,我们推出书籍推荐服务,使图书馆服务迈向更加“智慧”的一步。