往期目录
文章荟萃
SWOT视阈下高校图书馆大数据管理践行的实然落差
来源:未知 作者:admin 点击:
次
〔摘 要〕随着大数据时代的到来,我国各领域对大数据理论层面的研究远超于实证探索,导致理论与实践间呈现脱节、失衡状态。本文首先借用大数据和SWOT等相关理论对高校图书馆实施大数据管理进行前置分析,继而以东北林业大学图书馆实施的大数据管理为例,在指出实践与理论间存在的实然落差基础上,提出了高校图书馆优化大数据管理的应然策略。
我国高等教育进入了发展的快车道,特别是“211工程”大学,但作为高校发展三大支柱之一的高校图书馆却处于学校尴尬的边缘化地位。究其关键,在于图书馆一直以来的墨守成规,使其与各层次读者不断增长的诉求、所需服务的深度及广度间形成了一定的实然落差。大数据时代的到来,无疑为处于信息流聚合中心的高校图书馆突围提供了一种可能。图书馆应抓住契机,开拓优势与实践对接,收集、挖掘、提取大数据背后隐藏的价值,利用大数据分析,推动图书馆服务的创新与升级,而不应局限于以往那种仅对新词、新术语(泛在、移动图书馆、云计算等)的植入性或嵌套性的理论研究。这是图书馆界当前应加以关注且需重点解决的课题。
1 大数据、SWOT等相关理论在图书馆的转化
11 图书馆大数据的解析
2013年被称为中国的大数据元年。各领域对大数据的研究可谓如火如荼。概念并未统一,本文采用权威IT研究与顾问咨询公司 Gartner对它的定义,即:“在一个或多个维度上超出传统信息技术处理能力的极端信息管理和处理问题”。大数据的特点为Variety(多样化)、Volume(海量)、Velocity(快速)、Vitality(灵活)以及Complexity(复杂)等。
纵观大数据的理论研究,基本认为大数据不仅应从数据量方面进行考量,更要从数据结构上进行区分,传统意义上仅有几个服务器存储的数据库是不能称其为大数据的。同时认为,由简单、规律、重复性的庞大数据组合而成的、运用传统分析工具或者简单的数据挖掘方式可以进行分析归类的数据,也不能称之为大数据。既如此,那么图书馆有大数据吗?就大数据的海量特点而言,国内单个图书馆的MARC数据、读者的借阅记录数,目前还达不到PB级,从严格意义上讲不属大数据。目前,学界将数据规模巨大、文献类型多样、内容交叉、载体数字化的大量数据库资源、电子书资源、纸质转换的数字资源及各种音频、视频资源、读者书目查询、检索、下载存在于不同数据库商家系统中的以及借还产生在图书馆集成系统中的OPAC日志和流通日志等含有大数据特征的数据皆认定为图书馆的大数据。本文研究定位于此。
何为图书馆的大数据?笔者以例说明。读者到图书馆借阅图书,当图书馆读到该读者卡信息后,可初步了解到读者目前所属单位、借阅册数、邮箱、电话等简单结构性信息,当通过联机CRM系统,该读者以前的查询、浏览、链接记录、Web网络日志等隐性信息展现出来,通过挖掘这些非结构性信息行为数据,可进一步分析出该读者的阅读倾向与研究方向等相关性因素,由此归纳出读者感兴趣的主题,并为该读者提供图书馆与其相关联的增值服务,进而实现了图书馆知识服务的横向扩展,这就是图书馆的大数据。
2015年11月 第35卷第11期 现?"代?"情?"报 Journal of Modern Information Nov,2015 Vol35 No11
2015年11月 第35卷第11期 SWOT视阈下高校图书馆大数据管理践行的实然落差与应然路径 Nov,2015 Vol35 No11 12 图书馆实施大数据管理的SWOT分析
任何一项新事物的开展,首先应做前置态势分析。SWOT分析也称态势分析,指通过影响组织内外环境发展的优势﹙Strengths﹚、劣势﹙Weaknesses﹚、机会﹙Opportunities﹚、威胁﹙Threats﹚四要素,构建SWOT矩阵进行系统分析,最终得以制定适合本组织实际情况的发展战略和对策方法。因实施大数据管理硬件及相关条件的要求,本文借用SWOT理论以在人、财、物上优于全国千所普通高校的“211工程”大学图书馆为例进行分析。
121 内因微观SW说:内部优势(Strengths)与劣势(Weaknesses)
(1)优势说
其一,“211工程”大学的评估,从客观上促进了图书馆文献资源、基础设施、特别是数字化建设方面水平的提升;其二,近十年来图书馆进人基本为硕士以上学历,图书馆“高学历、高水平、高职称”的三高态势为开展大数据的收集、分析、传输、应用等高层次的知识服务提供了智力保障;其三,区域性高校图书馆联盟加速,资源共享格局初步建立。
(2)劣势说
一是,大学评估在一定程度上促进了图书馆的发展,但数据量、非结构性数据、新的数据源和数据类型的增多,保护高度分布式基础设施和数据的可信应用体系的软硬件基础设施明显滞后,使得图书馆存储与计算能力不足的问题得以凸显。二是,目前仅有清华大学、复旦大学、东北林业大学等为数不多的高校图书馆实施了大数据管理,总体上看大数据思维意识仍很淡薄。三是,个人职业成长与图书馆发展相对割裂,激励机制不强、馆员创新意识不足、大数据深层次分析人才短缺、研发能力薄弱,服务模式在传统中徘徊。
122 外因宏观OT说。外部机遇(Opportunities)与威胁(Threats)
(1)机遇说
其一,信息技术的发展驱动了图书馆业务向外有效地延展。通过大数据技术可实现对非结构化数据的挖掘、获取、数据建模及数据可视化的利用,能够有效确定图书馆未来服务模式的发展走向。其二,大数据时代,读者不再仅仅满足于被动接收者、只提服务诉求的角色定位,同时也希望是图书馆信息知识制造和重组的主动生产者。其三,读者不断提升的需求是图书馆发展的原动力与基础。
(2)威胁说
一是,大型实力派数字化产品开发商(超星等)的研发经费较为充足、专业主攻人才能力突出、竞争力较强,对图书馆造成了较大的冲击。二是,网络时代资源获取途径多元化,一些数据开发商在一定程度上代替甚至“剥夺”了图书馆的某些职能,悄无声息地分化着图书馆的读者源。三是,大数据时代,由于数据挖掘技术的大量使用,单位和个人的信息安全、个人隐私保护受到威胁。
2 东北林业大学图书馆对大数据管理的践行与认知
21 大数据管理的践行
我馆自2013年5月起实施大数据管理,每月以馆报形式向全馆公布实施情况。笔者以当年5月各部室对其服务或资源利用情况所做的当月或当年的统计与分析为例制图表,两年来,我馆基本以这种数据形式报送每月工作小结。希望通过下列可视化的信息图表可以帮助我们将枯燥的信息与数据转换成有意义、有价值的分析材料。
22 大数据管理践行的表征与实然落差
221 大数据理念确立,但对其定位仍不够明确
我馆实施大数据管理两年多,大数据理念可以说已经确立,与以往相比,实施大数据管理,加快了我馆一些重要政策制定、修改、完善时间,但围绕着大数据相关的因素分析并未融入研究,如:哪些数据属于大数据的范畴以
图1 2013年5月各学院读者平均入馆情况(网络系统部)〖〗注:该表中的统计数据为各院系读者在统计时间段内刷卡通过门禁的次数与该院系读者总数的比值,为避免读者拥挤,实际工作中在读者入馆高峰期多 采用直接开门放行,所以该统计数据存在一定的误差。
图2 2013年5月馆藏图书利用情况(图书管理部)注:在馆藏文献利用中,社会科学类图书的总利用率比自然科学类图书总利用率高。其中利用率最高为文学艺术类,其次为语言文字、自动化计算机和 建筑类,最低为天文地理医药类图书。
图3 2012年图书馆数据库使用情况(文献资源建设部)注:全文数据库整体利用中文库高于外文库。利用率最高的是CNKI,其次是万方和维普,国研网由于其涉及的专业范围较单一,下载量低。外文库SD 全文下载量远远高于其他外文全文库。国外博硕士学位论文库PQDT下载量最少,利用率最低。 文摘数据库的利用情况通过文摘浏览次数体现:CAB、BP、AGRIS、Agricola是生物学和农学专业文摘数据库,其中以CAB利用率最高。PQDDB是外 文博硕士论文文摘库,其利用率最低。
及应该被分析和预测?大数据如何挖掘、分析?待分析的这些数量巨大的非结构化的静态和动态数据真的具有所需价值吗?服务模式是否应当改变或重构?大数据如何嵌入到学科服务中等,这无疑说明我馆对实施大数据管理的定位还存有一定的偏差。
222 大数据思维意识有之,但大数据内涵仍不清晰
分析之前要厘清一对概念——数据和大数据,大数据前边已阐释,不再赘述。何为数据,它指包括各种文字、
数字、影像视频形式的文本或信息。上述图表表明我馆已产生了用数据说话的思维意识,并有将之付诸实践的行为。但不容忽视的是,与大数据内涵、特点比照来看,我馆对何为大数据还没有清晰的认知,甚至有些混淆了数据和大数据概念之间的区别。实际上,大数据并非图书馆内所有数据的统称,也不是把传统业务进行简单的数据化录入就可形成,图1、图2、图3与表1挖掘方式呈现出一定的大数据特点,但分析较浅明显没有体现出大数据应有的内涵;表2、表3与表4这些由简单的数据方式归类而成且未进行深度分析的则明显不属于大数据范畴。
- 上一篇:国内外MOOC研究热点前沿可视化对比分析
- 下一篇:我国信息获取权研究综述