SAFARI在线图书——电子图书数据库的出版年龄、利用率和发行政策

引言

   90年代末期,针对计算机和实用技术类图书,德州农工大学图书馆尝试以电子图书来代替纸本图书。之所以购买或订购这类图书的电子版有两个主要原因,第一,这类图书在读者中有很高的需求,图书馆必须购买多个复本(有的书复本量多达6本),甚至还要购买以新换旧的复本。第二,计算机类图书的爆炸性增长,超出了为Q760索书号分配的物理空间。解决办法就是购买这类图书的电子版,首先购买的是NetLibrary电子图书。
最常用的计算机类图书由两家出版社出版,一是奥雷利出版集团(O'Reilly Media),一是皮尔森出版集团(Pearson Technology Group),两家出版社响应市场需求,联手行动创建了Safari数据库。正是这个原因,奥雷利出版社的图书只能在Safari数据库中看到电子版。
Safari数据库提供的电子图书,是一批编程和信息技术图书(包括商学、计算机手册和考试指南),它们都是由著名作者编写,知名出版社出版的,如奥雷利、Peachpit、Microsoft、 New Riders、Prentice-Hall、Addison-Wesley等。用户可以在数据库中检索并找到编码的实例和其它实用信息。但与其它电子图书数据库有所不同,在Safari中,用户没有“借出并独享”某本书,而是所有的登陆用户能在数据库中同时访问所有的图书,因此,多个用户能够在同一时间里阅读同一种书。最大用户数由订购的图书馆来决定,当数据库中的最大用户数(席位)已经饱和时,其它的用户就不能登录数据库了。游手好闲的用户(10分钟没有动作)会被系统自动“踢出”,另一个用户便可进入系统。对拒绝访问的用户,系统会有一个提示。考虑到Safari数据库的图书类型、学科范围和出版社覆盖面,2003年夏天,德州农工大学图书馆做出决定,拨出了一部分经费来订购Safari数据库。此外,这个图书馆很幸运,大学的管理层对电子图书项目非常支持,学生的图书馆使用费也充实到了文献建设经费中。
在有关电子图书选择的文章中,人们讨论更多的是电子版本的优缺点。确实,在谈到电子图书的选择标准时,少不了要谈及电子版与印刷版的优越性比较。出版年龄和对某种图书的需求,被人们看成选择电子图书的重要标准。在知识更新较快的学科中,购买一些大使用量图书的电子版,会使这些图书及时纳入馆藏。在一个校园(各分馆之间)或一个联盟内,电子图书的多用户使用也是非常便利的,这样,也就没有必要购买多个印刷型复本了。
Safari数据库还有其它别具一格的特色。与Netlibrary不同,Safari允许用户同时使用其所有电子图书,这样,就进一步提高了电子图书的传播速度,提高了用户对电子图书的共享程度。与纸本图书相比,电子图书数据库具有出版年龄的优势,但是,这个优势的出现是以下列条件为前提的,数据库中收录的电子图书,其电子版要比印刷版出版得早,或者与印刷版同时出版。因此,本文的目的有以下几项:确定Safari数据库中电子图书的整体出版年龄;为Safari数据库提供图书的出版社有许多家,本文研究各家出版社的电子图书的出版年龄和发行政策;比较Safari电子图书与德州农工大学图书馆对应纸本图书的使用模式;讨论Safari电子图书数据库多种订购模式对大学图书馆馆藏建设的影响。

文献综述
虽然出版年龄作为电子图书选择(或剔除)的标准,常常被一些文献提到,但通过文献综述,我们并没有见到评价电子图书数据库出版年龄的研究。尽管如此,我们还是见到了几篇文章,通过研究使用量来评价电子图书数据库。这些研究表明,对某些类型或主题的图书,提供电子版是个好的选择,例如,计算机应用手册、商业、计算机科学与技术类图书。一些研究发现,出版年龄和版本对用户也是很重要的,因此,出版年龄成为电子图书的一个重要选择标准。
2005年,Buczynski收集了加拿大SENECA应用艺术与技术学院的使用量数据,研究后发现,印刷型图书的总体使用量略微有所下降,但是,计算机科学与技术类电子图书的需求量却有明显增长,这一主题的纸本图书借阅量呈反比例在大幅度下降。有趣的是,尽管在电子图书中已经能获得最新的版本,但两、三年以前的纸质老版本依然有人借阅。Buczynski得出结论,使用应用软件老版本的用户,自然还需要老版本的手册。
    2002年,Crawley-Low收集了一类文献的使用量数据,即专门支持Saskachewan大学毒理学研究生课程的文献,既有印刷版也有电子版,既有期刊也有图书。研究结果发现,虽然借阅旧书的品种超过了新书,但新书的借阅频率却更高。这从另外一个角度支持了Buczynski的研究成果。
    Chan和Lai于2005年、Langston于2003年分别收集了多学科电子图书数据库的使用数据。香港大学图书馆及其国际联盟与四种电子图书供应商合作,Chan和Lai的研究比较了四种供应商的商业模式。他们发现,在有些学科中,电子版更受青睐。与2002年Crawley-Low的研究结果相似,在所有学科中,新书的流通频率高于老书。
    加利福尼亚州立大学图书馆是一个图书馆联盟,其电子图书建设处于领先地位。2003年,Langston描述了该联盟电子图书的建设情况,分析了一些使用量数据。他的研究发现,计算机学方面的手册是电子图书中使用量最大的图书,但他并没有比较新版本与老版本的使用情况。因此,他的研究数据不能用来确认前面的几个结论,即新版本流通更为频繁,或者对于计算机手册之类的图书来说,老版本依然有价值。

德州农工大学购买的Safari数据库
    2003年10月,德州农工大学订购了Safari数据库。Safari提供了三种订购模式,一是“整库订购”、二是“新书订购”、三是“挑选购买”,德州农工大学图书采用了挑选购买的模式。虽然Safari提供的价格是集团采购价格,但德州农工大学的合同只提供主校区用户的访问,包括了五个分馆。电子图书品种由人工选择,以出版年龄和出版社等为选书标准。在有采购计划的年份,相应学科的学科馆员互相交流所选的图书,使同一种书保留最新版本,所选的图书互不重复。然而,这项工作相当耗时,特别是在续订时,因此,我们又对订购和购买两种模式进行了评估,最后决定转换成为“新书订购”模式,包括当年和前两年出版的新书。Safari很快被读者接受,并发用户数不足带来的访问被拒,已引起一些读者的抱怨。确实,访问被拒的数量(由于并发用户限制而造成登录失败)在第一年是很高的,因此将并发用户数从两个升级到四个也成为必要。由于Safari的价格基于所选的图书数量和并发用户数量,这两个方面的数量都有所增加,因此,价格也就提高了。尽管如此,这种模式还是有好处的,它提供了对Safari各类图书的访问(商业、计算机和技术类),包括了所有与Safari合作的出版社。虽然并发用户还是有点少,但这种新模式提供越来越多的新书,不断地缓解前面讨论的复本和空间问题,已经是很理想了。最初,德州农工大学的印刷型图书纲目计划中排斥了几家出版社,但随着图书馆更换了他的纲目计划书商,图书馆决定在纲目计划中不排斥任何与Safari合作的出版社。

研究方法
SAFARI数据库的出版年龄
德州农工大学订购的Safari数据库中共有1258种图书,将这个书目表单导入Excel表中,每种书所包含的字段有:题名、ISBN,出版社,Safari中的最新版本、出版社网站上的最新版本。确定一种书的信息,既查询出版社网站(以确定有无最新版本),也查询Safari数据库,从数据库和网站上得到的出版日期和版本变化信息都记录在Excel表单中。由于Safari数据库和出版社网站的更新时间表无从知道,也无法控制,所以对出版日期相同的图书,要比较数据库和出版社网站的版本,以确定数据是否正确。最终的Excel表用来确定Safari是否包括了出版社已经出版的最新版本,出版社和出版社是不是在提供最新版本方面有什么不同。做这项工作时,数据收集人员参照了一个流程框图,有助于保证数据收集的可靠性。
出版社的问卷调查
  通过问卷形式对Safari所有的合作出版社(德州农工大学1258种电子图书的出版社)进行了调查,以确定其电子图书(及新版本)的发行政策。问卷调查想要得到的信息包括: 哪些图书已经被收到了Safari数据库中?其对应的印刷型图书什么时候发行?现有的市场占有政策是什么,例如,是否在销售了许多印刷型图书之后,才把电子版提供给数据库?是否存在着一些书不发行电子版的情况?一些电子图书是否也提供给其它的电子图书供应商?什么时候一些电子图书会从Safari数据库中撤出?问卷调查表用电子邮件发给出版社的代表,通过电子邮件和电话来回收答案。

研究结果
出版社调查
德州农工大学的Safari数据库共包含了1258种图书,出版社有奥雷利集团及其下属出版社(包含26%的图书),皮尔森出版集团及其下属出版社及合作出版社(如、Addison-Wesley、 Cisco、Peachpit、Prentice Hall)(占67%),汤普森出版集团及其下属的出版社(占4.9%),西格雷斯出版社和No Starch出版社(各含不到1%的图书)。
奥雷利、皮尔森和No Starch三家出版社反馈回了问卷调查。作为Safari最重要的两个出版社,奥雷利和皮尔森的问卷调查显示,它们的电子版和印刷版同步发行。由于版本转换的原因,电子版略微要比印刷版早一些面世。奥雷利的战略决策是,在Safari数据库中发行其所有的实用技术类图书。皮尔森则发行其所有实用技术和信息技术类电子图书。当作者保留了数字出版权并拒绝发行电子版时,两家出版社会有少量的例外。奥雷利不撤出Safari数据库中的电子图书,但是皮尔森根据市场情况来决定是否把电子图书撤出。一般情况下,当新版本发行后,皮尔森会从Safari数据库撤出旧版本,如果印刷版受读者欢迎仍在出版,皮尔森会在Safari中保留其电子版。
圣弗朗西斯科的No Starch出版社把自己拥有数字版权的所有图书提供给Safari、eBrary和24/7三家电子图书供应商。在印刷型图书投入市场后大约九十天,其电子版才能在Safari数据库中看到。
汤普森不愿意公开此类信息,其它出版社没有答复调查问卷。
Safari电子图书最新版本的情况
对最终的Excel表单进行研究后,发现它与从出版商处得到的信息是一致的,Safari数据库拥有每本书最新的版本,只有极少的例外(占0.6%)。发现有7种书的印刷版是新版本,而Sarafi中的电子版是老版本(Peachpit两种、奥雷利一种、Maska & Lipman两种、IBM一种、MySQL一种)。
图书利用情况
Safari 的目标是提供借阅量大、与实用技术相关的电子图书。我们对德州农工大学的印刷版与电子版使用量做了对比研究,时间是2006年秋季学期和2007年春季学期。对比结果使我们知道了,和印刷型图书相比,读者对电子图书的接受程度有多么地高。在两个学期中,Safari中的被点击过的图书,其访问量从1次到1040次不等,平均访问次数为40次。同时,索书号区间为QA75-76.9的印刷型图书(具有相同出版日期的印刷版),借阅量为1-44次,平均借阅次数为1.9次。访问次数最高的Safari电子图书是1040次,而对应印刷本(书名和版本相同)的借阅量是3次。访问次数第二高的Safari电子图书是822次,而它的印刷版借阅量是0次。以下依次是电子版的访问量与印刷版借阅量之比:第三名819比4、第四名720比1、第五名547比0、第六名544比0、第七名509比3。值得注意的是,两个学期中,42%的电子图书访问量为0次,而58%的印刷型图书借阅量为0次。两个学期里由于并发用户限制造成的访问被拒虽然高达40%,但是总得来看,德州农工大学用户的平均单次检索回合的时间是7分钟,因此,即使当一个用户由于并发用户限制被拒绝访问,等待的时间也可能是很短的。使用数据的评价证明,在下次续订时,增加一些并发用户数是合理的。
显而易见,以“新书订购”模式方式订购Safari数据库,向读者提供图书最新版本的电子版,为德州农工大学用户使用资源提供了方便,同时也提高了单个图书的利用率。用户任何时间需要看书,就可随时在Safari数据库访问这本书。此外,在同一段时间段内登录的用户,如果有必要的话,可以访问同一种书。与电子图书相比,借阅纸本图书是十分麻烦的,借阅了以后,通过网络续借又十分容易,因此,一个人把书借出后,其它人就不能用了,而在Safari数据库中,没有必要两个星期地去等待别人还书。使用量数据使我们确信,与购买多个印刷型的复本相比,投资购买Safari数据库,是德州农工大学的明智决定。

结论
这项研究的结果证明,德州农工大学对于使用量大的计算机和信息技术类图书,购买Safari数据库提供这些图书的最新版本,这个馆藏发展决策是正确的。在订购Safari数据库之前,德州农工大学图书馆对这些使用量大的图书,要购买多个复本。现在,印刷型复本减少了,对物理空间的需求也减少了,这一索书号区间也不需要频繁地剔除,进一步节省了人力和经费资源。      
图书馆要对这一类非常独特、且疾速变化的信息技术类图书提供访问,选择Safari数据库是非常适宜的。然而,有使用价值的老书,Safari并不能提供,这是一个问题。2003年,Langston的使用量研究发现,在电子图书中,计算机手册类图书是使用频率最高的图书。2005年,Bucyznski对老的计算机和实用技术类图书使用情况研究后推测,由于人们还在使用老的应用程序,所以需要老的计算机手册。这与本调查研究的结果不谋而合,我们认为,一些读者确实需要这些老版本的计算机书,例如C++编程之类的书。Safari的完整的图书目录也提供了使用老书的一些信息,这个表可以按图书使用量进行分级。分级排序后,使用量最高的5%的图书中,再按出版年代进行排序,确实能看出一些老书(2004年前出版的)还是有一定需求的。遗憾的是,因为德州农工大学图书馆选择了Safari的“新书订购”模型,图书馆不能通过Safari对这些稍微过时一些,但依然有大量需求的书提供访问。因此,还要通过图书馆的纲目购书计划来购买这些书的印刷本,使图书馆馆藏的历史深度得到增加。
  还有一种解决方法,可以从其它电子图书提供商那里购买少量需求量大的电子图书,但是,本研究表明,为Safari提供图书的两个最主要的出版社(奥雷利和皮尔森),不向其它供应商提供电子图书,或只提供极少量的图书,因此,通过其它电子图书供应商来得到大量的图书是不可能的。
与印刷本的借阅统计相比较,这些电子图书有潜在的使用量,既然如此,到了2007年秋,学科馆员可能会提出合理化建议,要在6个并发用户基础上再增加两个并发用户。学科馆员们最终也许会建议在续订Safari时,把购买模式变更成“整库订购”。转换订购模式可能会导致费用增加,但这个费用如果与出版社为印刷版指定的零售价相比,每本电子图书的平均年订购费却是非常低的。特别是那些使用频率很高的电子图书的单位使用成本,有助于证明年度订购模式的合理性。
任何考虑购买Safari电子图书的图书馆,肯定要考虑许多因素。我们希望德州农工大学购买Safari数据库的经验,会对有同样馆藏管理打算的一些图书馆提供指导。

编译自 Jane Stephens, Pauline Melgoza and Gang(Gary) Wan. Safari Books Online: Currency, Usage and Book Release Policies of an E-book Database. Collection Building, 2008, 27(1):14-17
编译 刘丽丽 西安交通大学公共政策与管理学院
审校 强自力 西安交通大学图书馆