logo

中国科技期刊发展蓝皮书(2019) (2019) https://doi.org/10.1360/B978-7-03-062200-6

第三章 科技期刊出版模式创新路径249)

  • Published May 19, 2020

第三章 科技期刊出版模式创新路径249)

研究科技期刊出版模式,梳理与出版模式相关的技术发展历程,聚焦学术期刊出版全过程,从投审稿、排版校对、发布运营、科研社交、增值利用、科学评价等方面对支撑出版模式创新的国际平台进行分类总结,归纳国际期刊出版平台建设的重要特点,探讨相关建设标准,以期为我国科技期刊在数字化条件下创新出版模式、融合新兴技术、建设世界一流期刊提供思路和借鉴。

第一节 科技期刊出版模式嬗变

科技期刊是学术交流的重要载体,在科学研究的生命周期中既是"龙头",也是"龙尾",科技期刊出版模式随着学术交流方式的变化而变化。在科技期刊长达350余年的发展历程中,前300年发展较为缓慢,尽管经历了第一次和第二次产业革命,涌现了一批各个行业的新兴技术,但就科技期刊的出版模式而言,与最初创办的刊物并无巨大差异,这一时期对科技期刊出版影响最大的是真正科学研究本身的进步而非技术的变革。科技期刊在漫长的发展过程中建立了一套完备的出版模式,如标准化的论文格式、被广为接受的同行评审制度、订阅销售的商业模式等。直到近50年,数字和网络技术对学术交流方式产生了巨大的影响,科技期刊出版顺应学术交流方式及科研人员的需求出现了新的出版模式,如开放获取期刊取得的巨大成功打破了传统科技期刊发展了近几百年的销售模式;新技术的出现改变了期刊出版内容,内容不仅仅是格式规范的论文,也可以是各种类型、各种格式、各种关联形式的数据或文件。社交媒体和APP(Application,智能手机第三方应用程序)等也参与科技期刊出版的重要过程。近年来在各个领域引领创新的人工智能技术也开始慢慢进入出版流程,未来技术的发展将如何影响出版模式值得期待。

一、纸质时代期刊出版模式

科技期刊起源于17世纪,自第一份科技期刊创办至20世纪下半叶300余年的历史中,科技期刊一直以纸张作为载体,以印刷在纸张上的文字或图片来展示期刊的主要内容。纸质时代期刊的主要功能有:科学知识的存档;信息交流;验证科学研究的质量;对科技人员的回报;建立科学社区250)。纸质时代尽管都是以纸张作为内容的呈现载体,但也因技术的变革、学术交流的方式,以及科学技术的进步而呈现出不同历史时期的各自特点。根据其特点又可将纸质时代划分为:创建发展期(1665-1778年)、专业发展期(1778-1830年)、检索发展期(1830-1930年)、规范发展期(1930-1995年)251)252)253)

创建发展期的期刊发展较为缓慢,经历了100余年的发展,期刊数量也仅仅维持在几百种的规模。由于当时创办期刊的主要目的是为了科学知识的聚集和存档,且受制于有限的传播渠道,这一时期期刊的功能还是以科学知识的档案记录为主,学术交流或传播功能非常有限,受印刷技术、创办机构经费和人员的限制,很多期刊甚至不能持续地按期出版。

专业发展期指随着产业革命的兴起和专业性学科分化,大量专业性期刊由此开创,以1778年在德国创办的《化学杂志》(Chemisehes Journal254)为开端。除专业性学科期刊,这一时期也出现了以短文形式出版的通报、以综述形式出版的年报和述评,科技期刊的类型也呈现多样化的趋势。由于期刊数量的增多和从事科学研究人员的增多,科技期刊在首发权的认证作用方面开始显现。

检索发展期始于第二次产业革命的兴起,科学取得了重大发展,技术也成为独立的理论体系,由此而使科技期刊数量和论文数量快速增长。这一时期出现了大量检索类的期刊,以便科学家能更快、更便捷地查阅到相关内容。以1830年创办的《药学总览》为开端,各个国家纷纷积极创办检索类期刊,期刊以题录、目录及文摘形式出版,能全面和系统地呈现某一科学技术领域内的新成就和发展趋向,在电子化数据库出现以前这类期刊是检索的重要工具。

规范发展期是第二次世界大战后第三次技术革命兴起后,科学技术取得了很多重要的成果,并成为现代科学的基石,由此而带来这一时期期刊数量快速增长,1960年期刊数量接近6万种,而1921年还只有2.4万种。这一时期得益于国际标准化协会(International Standardization Association, ISA)的成立和标准化工作的开展,期刊的各项标准开始建立,促进了期刊的规范性和标准化,很多标准和规范至今仍在使用和不断更新。

纸质时代科技期刊出版模式历经300余年,这一时期对于科技期刊发展最重要的技术革新早在17世纪中叶期刊出版之前就已经实现,即15世纪末的印刷技术和16世纪末广泛而可靠的邮政系统,因此,这一时期技术本身对期刊的制作和传播影响相对较小,印刷、造纸和运输过程都非常稳定255)。推动这一时期科技期刊发展最重要的因素是科学和技术自身的发展,科技期刊在这一时期,建立了一套科技期刊出版的体系和规范,期刊内容的格式慢慢成熟并被固化下来,同行评审的流程被各个领域的大多数期刊所接受,并成为保证期刊出版质量的核心环节。在20世纪中叶以前,学会、大学等科学团体一直是创办期刊的主体,商业出版公司出版的期刊比例并不高。在商业公司大规模出版期刊之前,出版期刊成本高昂,主要的发行渠道是读者订阅,当时的图书馆采购规模也很有限,而且科技期刊出版的高度专业性要求与大规模的生产不协调性,使期刊出版很难盈利。这一局面在美国《科学引文索引》(Science Citation Index, SCI)出现(1957年)后被打破,第二次世界大战后研究规模骤增,图书馆的规模和数量也大大增加,SCI带来的"核心期刊"所附带的价值也大大增加,且不受市场价格的影响,因此,商业出版公司通过直接创办、收购、出版服务和销售,以及兼并重组而不断扩大出版规模。到20世纪80年代,商业出版公司占有出版科技期刊数量主要份额的格局已经形成256)

二、数字时代期刊出版模式

数字时代期刊出版起源于20世纪50年代末60年代初,期刊出版论文的形式不仅以纸版期刊为最终出版形式,而是将出版内容以数字化形式出版,根据其特点又可分为电子期刊时代(20世纪60年代至1990年)和网络数字时代(1990年至今)。数字时代科技期刊的主要功能为:记录和确认最新的科研成果;通过同行评议进行学术成果的质量评价和质量控制;广泛地报道和传播科研成果;对科研成果进行永久保存和长期利用。与纸质时代相比,传播成为较重要的功能,而科学社区的功能由于非正式学术交流方式更多,已不再属于科技期刊的主要功能。

电子期刊时代是指将期刊内容以数字形式存储在光、磁等介质上,可通过计算机设备本地或远程读取期刊内容。最初的电子期刊主要以检索类期刊为开端,如《化学文摘》(Chemical Abstracts, CA)、《工程索引》(Engineering Index, EI)、《科学文摘》(Science Abstracts, SA)等均发行了磁带版,这些机读磁带在纸质期刊的基础上通过再制作而成,多用于检索,通常又称之为书目数据库257)。1982年,《哈佛商业评论》(Harvard Business Review)电子版问世,标志着学术期刊的电子化成为新的期刊出版模式。在1990年以前,电子期刊的出版流程并没有太大的变化,仅仅是对出版物形式做了延伸和拓宽。

网络数字时代是指以网络环境下的期刊出版内容为目的和形式的出版时期,这一时期由于网络技术的进步,不仅是针对出版内容的网络数字化,而是整个出版流程已经转为主要依赖网络完成,很多期刊已经不再出版纸质版。这一时期出版成本降低,特别是通过网络传播大大降低了纸质时代印刷和邮寄的成本,商业出版机构认为纯网络数字出版能节省10%~20%的成本258)。另外,由于网络技术的运用,使得期刊投稿、同行评审及编辑加工等环节的时间大大缩短。对于商业出版公司来说,一旦建立了基于网络技术的出版传播平台,期刊数量或文章数量增多带来的成本增长不像纸版期刊那样带来同比例的增长,因此,以爱思唯尔为代表的大型商业出版集团纷纷投入巨资建设期刊平台。这一时期电子期刊数量开始快速增长,由20世纪90年代初的20余种增加到1999年的近8000种,截至2012年,出版纯网络的同行评议期刊已达8000余种259)

网络数字时代和其他时代最重要的区别在于出版内容的呈现形式及出版内容,此前的出版内容都是标准化的科学论文,而在网络数字时代,出版内容借助于技术的发展呈现出更多、更丰富的形式:①论文不再仅限于排版后的标准化文件展示,而是以更符合网络浏览环境下的Web/HTML为主要呈现界面,还可包含丰富的图表、图像、音频、视频、动画等;②出版内容成为知识工具。网络数字内容与纸版内容的一个最大区别是,网络数字内容中每一个层次的信息都可以作为具体的知识单元被解析、描述、重组,使得这些单元与其他知识单元可动态地、个性化地关联,通过揭示这些单元之间的关系来支持复杂的知识发现。这将期刊和论文从一个孤立、静止的知识包变成了嵌入在相互关联和相互作用的知识体系中的活的知识工具,并超越传统的期刊功能,为科学、教育和文化提供了全新的服务260)

在网络数字时代,期刊出版的商业模式也发生了巨大的变化,出现了以往从未有过的明显特点:①不以期刊为单位进行销售或订阅的模式出现,如针对图书馆和机构的数据库捆绑订阅形式,针对个人的单篇付费模式,借助于强大的发布运营平台,个人付费下载论文已成为平台的基本功能;②开放获取(OA)模式出现。开放获取是不改变原有的同行评审机制的新型学术出版模式,读者可以通过互联网随时免费地获取和使用期刊论文,打破了基于订购的传统出版模式,在出版模式上为出版界提供了新的选择261)。如2006年创办的PLoS One是世界上载文量最大也是较成功的OA期刊之一262),这也是科技期刊历史上极少数的出版模式创新之一,打破了20世纪末期由商业出版公司主导建立的期刊销售和市场格局。政府、研究机构和大学支持OA出版的各项政策,促使这一进程快速演变,并通过这些政策和计划促使研究人员改变投稿行为,2018年"科学欧洲"(Science Europe,SE)发起的S计划被预计会进一步影响期刊的商业格局,甚至可能会结束期刊的订阅模式263)264)

网络技术的发展不仅影响了学术交流方式,还为科技期刊出版带来了更多变化。除了上述提及的重要改变以外,科技期刊出版相关的平台、服务和工具等也得到了快速发展,这些衍生系统或服务有些来自传统的出版机构或社会团体,有些则独立于期刊出版体系,服务于科技期刊出版,这些都是基于网络技术发展而带来的变化。随着网络出版量的增加,论文审查问题日益凸显,每年出版的大量论文需要道德标准来解决出版中出现的利益冲突、署名不当、引用行为、同行评审公正性,以及严重的学术不端行为等问题。在纸质时代,解决这些问题困难重重,只能依靠读者、编辑和作者或者机构自行监督和发现进行自我约束。在网络数字时代,可以实现客观的检测和比对,由此而产生出相应的文本和图片检测工具,如CrossCheck等自动检测抄袭工具,已成为期刊出版的必备工具。得益于网络技术的不断进步,科学社交网络也在这一时期取得了迅猛发展,如21世纪初建立的ResearchGate、Academia.edu、Mendeley等,这些平台所带来的用户及文档数量非常惊人,还通过在线的个人简介、研究成果替代期刊成为新兴活跃的科学社交社区,这也是为什么进入数字出版时代之后,聚集科研人员不再是科技期刊主要功能的原因。此外,以主题为基础的知识库发展迅速,如arXiv作为最早的主题知识库265),截至2017年收录预印本论文已超过150万篇。预印本模式虽然不是传统意义的期刊出版,但也在一定程度上替代了期刊的某种重要功能,如确定科学发现的首发权。

总的来说,网络技术的发展使得数字时代成为期刊出版历史上变化最大也是最快的时代,科技期刊的功能也随之发生了变化,部分功能被其他渠道所取代。虽然最重要的期刊核心功能仍然被保留,但已出现一些与传统期刊出版流程不同的方式,且正在被科研人员所接受。期刊发行、传播和盈利模式发生了颠覆性的改变,OA期刊的出现改变了商业出版公司在20世纪末建立的市场格局,技术进步也给其他一些技术性公司带来进入科技期刊出版领域的机会,提供相关的服务或工具,成为科技期刊出版链条上的一环。科技期刊出版不再是研究人员、研究机构、图书馆或商业出版公司相对封闭的系统,而是更多地与社交网络、主题数据库,以及不同类型的工具交织在一起,共同构建一个复杂而精细的期刊出版时代。

三、移动互联时代期刊出版模式

移动互联时代(2007-2017年)期刊出版以智能手机和移动设备为载体,根据人们的阅读习惯呈现期刊出版的内容。这一时代的特点是技术改变了人的行为,由此推动期刊出版做出了相应的改变。为了顺应读者碎片化阅读的需要,国外重要的学术期刊出版机构在移动出版领域做了很多引领性尝试,如2013年美国医学会(American Medical Association)推出了能实现在任何设备、任何时间、任何地点均可获得信息,且同时适配于PC端和移动端的JAMA Network Reader266)。美国化学会(American Chemical Society)于2010年开发了ACS Mobile应用程序,该APP荣获PROSE奖的"自然科学与数学领域最佳e产品奖"和美国出版商协会(Association of American Publishers)专业学术出版部颁发的"e出版新产品最佳创新奖"。这些APP重点在于对出版内容的重组,使其更适应移动设备的阅读性、便捷性及互动性,更关注与用户的沟通和交流,同时针对用户的行为可灵活调整推送的内容,更清晰地了解读者的兴趣,从而使内容和广告的推送更具针对性,也由此解决了纸版时代和PC端用户无法实现的精准定位和有效传播问题。

这一时代,期刊出版在出版前的流程其实与网络数字出版时代并无二致,只不过是在传播设备和呈现内容上带有更多移动、精准的特点。目前移动应用的商业模式仍处于发展阶段,通过移动应用程序获取期刊内容与PC端访问的最大区别在于移动设备的个人属性,使得获取用户与应用程序的交互数据较为便利,并且个人支付变得便捷,这为个人订阅期刊提供了新的空间,同时也缘于用户行为的精准化数据,使得靶向广告比网站广告拥有更多的机会。

四、人工智能时代期刊出版模式

人工智能(Artificial Intelligence, AI)时代(2017年至今)期刊出版模式呈现了较大程度和更多层面地变化。2017年谷歌围棋人工智能AlphaGo战胜韩国棋手李世石,人工智能进入第四次发展浪潮,应用领域也不断扩大。大数据驱动知识学习、跨媒体智能、人机混合增强智能和群体智能与出版行业关系最为紧密,进一步推动出版产业的高速发展。人工智能以机器学习的形式在过去几年里推动了许多创新,在科技期刊出版中的应用可能在于:提高生产效率;为编辑决策提供更好的依据;提高营销和销售活动的有效性;提供更好的内容搜索和发现;支持个性化展示;提高内容的价值;帮助出版商更好地了解用户。

目前人工智能已经在期刊出版领域进行了初步尝试,如近年来,虽然国际出版机构已然获取了有关用户的行为数据,但数据非常庞杂,如何处理以使其物尽其用反倒成了新的挑战。大数据技术可以帮助国际出版机构在出版产品类型、销售方式上作出更睿智的决策。然而遗憾的是,人类无法对如此海量的信息作出快速有效的处理。将大数据转化为机会是当今出版商面临的主要挑战之一,而在这方面人工智能可以帮忙。利用机器学习,计算机能够吸收大量数据,识别这些数据的意义,基于用户行为为用户推送精准信息,并对下一步的工作做出建议,这是人类难以做到的。

人工智能还被应用在搜索功能上,以人工智能为基础的新型知识搜索方式正逐渐被开发,如Yewno模仿人类大脑的运作方式,相较于使用关键字搜索的Google这类传统引擎,它能够通过全文分析、计算机语义分析和机器学习等方法来提炼文献的含义,从而图文并用给使用者提供相关材料。丹麦的AI技术公司开发的在线搜索工具--UNSILO,利用自然语言处理(NLP)和机器学习(ML)来分析论文,通过语义分析自动提取关键概念、总结论文内容267),该项技术可能为编辑和审稿人提供决策依据,同时也可帮助编辑寻找合适的审稿人,目前他们正在与科睿唯安旗下的ScholarOne投审稿平台合作268)

传统出版商也开始参与这一进程。如2018年2月,爱思唯尔与荷兰人工智能平台Euretos合作开发新项目"下一代研究"(Next Research),利用人工智能技术扫描数百万篇期刊文章和数百个数据库并建立知识间的联系,在此基础上提出新的科学假设。2018年8月,施普林格•自然宣布将与国际商用机器公司的沃森健康(IBM Watson Health)合作,将人工智能技术与它的基因组数据相结合,帮助肿瘤学家发现治疗方法269)

人工智能技术在期刊出版领域还有更多发展空间,目前还处于初步应用期,尚未出现改变整个期刊出版模式的作用,但变革的能量已经开始酝酿,加上技术升级的催化和新平台的不断涌现,将为学术交流注入新的活力,也为科技期刊出版带来了新的可能性和方向。

第二节 基于出版模式的相关主流技术

技术是出版行业变革的触媒和关键力量,每一次出版模式的变革都伴随着技术的发展和进步。电子出版是电子计算机技术与出版活动相结合的产物,起源于20世纪50年代末60年代初期刊编辑出版的电子化,主要指把电子计算机技术用于出版物的印前编辑工作;数字出版是数字技术(信息技术、计算机技术、网络技术)与出版密切结合的产物,它带来了产品、服务、流程、管理和业务模式等一系列的变革;随着超文本标记语言的兴起,增强出版应运而生,增强出版物打破传统出版中篇幅和出版形式的限制,能更丰富地展示研究成果;数据内容管理技术的发展催生了数据出版,数据出版是推动数据开放的重要手段和激励机制;协创出版利用协同编纂技术,为多作者协同完成各个层面内容的创作及编改提供工具保障;可视化出版是利用可视化技术、虚拟仿真技术等将科学数据、信息、知识立体地呈现在用户面前;语义出版是语义网技术的应用实践,能够实现机器自动处理、识别、集成与整合,帮助读者快速理解和获取信息;知识服务利用内容动态重组,对出版内容进行结构化、标签化和图谱化处理,使得期刊从被动的内容供应商变为主动的信息服务商。技术与内容的合力构成了出版模式创新的基础,影响了产品与服务,带动了产业的发展。

国际科学技术和医学出版商协会(The International Association of Scientific, Technical and Medical Publishers,STM)自2011年起,每年都会发布技术发展对出版行业的作用趋势报告。国际出版集团爱思唯尔拥有超过1500名在自然语言处理、机器学习、检索、数据可视化、大数据和移动等领域的技术专家,利用先进技术,制定分析解决方案,推动科学、技术和医疗领域的进步。由此可见,国际出版商非常重视技术对出版行业的推动作用。中国科技期刊的未来发展,也需要更加重视技术手段对出版模式创新的作用。

一、网络首发

网络首发指先将论文网络出版,按出版网址和发布时间确认论文首发权,之后将论文全部或其根文本在期刊印刷前出版的出版方式。网络首发是一种以确保学术成果的首发权和快速传播为目标的新型出版方式。

网络首发需要依靠具有首发功能的软件系统来实现,系统通过智能标引技术对稿件内容进行结构化处理,并利用动态排版技术完成经结构化处理后的内容在各种终端上的动态流式发布。同时,引入智能检校技术、稿件质量检测技术等,在最短的时间内,以最高效的方式智能化地把控稿件质量、校正稿件问题。

(一)智能标引技术与版面理解

智能标引技术主要用于实现命名实体识别、关键词抽取、自动摘要、自动分类与隐含主题显性化等功能。在进行智能标引的过程中,需要利用版面理解技术对文档内容进行格式解析,在获取底层数据的基础上对稳定版本进行空白分割和连通分支分析,以便获取文档内容的结构布局,并在此基础上提取文档全局排版信息,包括正文字体、页眉、页脚、版心、文字排版方向、分栏情况、行间距、标题字体等。全局排版信息是其他布局和逻辑信息抽取的基础。

(二)稿件质量检测技术

稿件质量分为内容质量和编校质量两个方面,内容质量主要体现在学术研究成果的创新性、科学性和先进性上,同时确保不存在学术不端行为及其他侵权行为。编校质量主要体现在能否正确使用和统一规范语言文字、符号、数字、外文字母、法定计量单位及地图标注等方面。后者主要由智能检校技术来辅助完成。

当前,较为成熟的稿件内容质量检测技术主要体现在学术不端检测系统的使用上。在进行学术不端检测前需要对稿件内容进行预处理,不同类型的数据处理方式也不尽相同。各类型数据(文本/表格/图片/公式)预处理完成后,以解析和内容抽取结果为基础,引入基于语义的多阶段指纹特征结合各种文献类型的学术不端文献特征行为模型,实现对相似性内容分析、相似性位置分析、引用排除分析、同名作者排除分析、相似内容追溯分析、一对一/多对照分析和章节段落分析,并形成分析报告,为各类出版机构提供相似性辅助分析服务,实现对学术不端行为、写作规范性,以及使用未授权内容等重点问题的把控,保证学术出版质量。

(三)智能排版技术

智能排版最大的优点是提高效率,降低人工参与度。智能排版技术通过结构化、半结构化的标引,将内容与样式相互分离,并使用XML排版引擎(其中包含排版样式、排版区域、排版规则)对原始结构化内容展开样式应用、区域合成等处理,经过排版渲染引擎进行区域重建、规则应用、自动排版、文字定位、版面对象定位、渲染处理,形成指定版式的数字出版物,这些版式可以满足PC端、移动端内容展示的需要,并且可以支持版式、流式等多种格式。

二、增强出版

增强出版指将根文本及与之关联的其他数字资源经过组织和封装,形成一个有内在联系的复合数字作品的数字出版方式,其作品称为增强出版论文。为了完成增强文献的创作,往往需要对根文本及附加内容的每一知识单元进行表征和关联,这就需要利用内容理解技术,并且这一内容理解技术需要支持对文本、图形/图像、语音、视频等各种形态媒体的自主学习,实现以智能感知为基础的跨媒体内容的知识单元统一表征。同时,增强出版的附加内容由于涉及包括图形/图像、音频、视频在内的多种形态媒体,需要引入音视频采编技术来完成这一必要的工作。最后,增强出版需要通过跨媒体链接技术来实现各种形态媒体之间以知识单元为主线的互联互通,增强表达。

(一)文本内容理解技术

文本内容理解技术主要解决以自然语言描述的无结构化文本内容中蕴含的隐性知识内容,以及知识内容之间内在联系的感知与获取问题。文本内容理解框架大致可分为文本分词和语义标记。文本分词负责将文本内容通过分割形成语义一致的单词或词组集合,主要实现将文本内容分割为预定义词典中的词组序列。语义标记负责通过识别实例词组所对应的概念或实体,对文本内容进行消歧,主要用于识别名词词组表示的概念或实体信息。

(二)图形/图像内容理解技术

计算机对图形/图像内容的理解首先要对该图形/图像进行语义标注,但是图形/图像是由不同颜色属性的像素构成的点阵,并没有独立的语义单元。因此,图形/图像内容可以通过分析像素的颜色属性及像素之间的关联关系,提取有关图形/图像内容的底层视觉数据特征,主要由颜色、纹理和形状三部分构成。其中颜色特征作为最常用的特征,具备位置、尺寸、布局可调节等特点,可利用直方图、相关图构建一致性向量。纹理特征用于表现图形/图像某一区域的局部性质,是对该区域中像素相对关系的一种度量,可利用统计等方法对纹理进行描述。形状特征往往包含一定的语义信息,需要利用基于轮廓和基于区域的方法对图形/图像进行精确的分割,得到特征描述。然后利用视觉特征数据构建语义索引,通过语义模型对图形/图像进行识别。在识别的过程中也可引入深度学习技术对模型不断训练,帮助提高识别精度和准度。

(三)语音内容理解技术

语音内容理解技术主要是利用知识表达和组织等人工智能技术对语句进行自动识别和语意理解。通过不断提高计算机理解语言的能力,消除噪声、杂声,在理解上下文意思的基础上对语义进行纠正,同时能够处理不合语法或不完整的语句。语音理解技术在实现原语音识别的基础上,还需要引入知识处理,实现知识内容的自动收集、知识库的自动构建,以及知识内容的推理和校验等。围绕共有知识库,分别提取和搜索有关音位、音变、韵律、语法、句法、语义和语用等知识信息,构建语言的有限状态模型,通过唯一、统一的网络将原本离散型的各种知识源进行汇总、分析和理解,最终实现语句的自动识别和语意理解。

(四)视频内容理解技术

从信息方面看,视频是图像、声音、文字的综合载体,具有时间连续性。在内容理解的过程中需要将视频分割为相对独立的帧以便提取底层特征,如颜色、纹理和文本信息等,通过引入HSV(Hue/Saturation/Value)模型对其进行描述,近似量化频谱信息。基于视频挖掘,构建底层视频特征与高层语义之间的关系映射,并对视频中的重要图像帧进行提取。提取完成后,构建一种类稀疏模型,将关键帧序列与其他图像帧序列进行分离。通过比较重要图像帧之间的帧差,剔除最小值后得到视频关键帧,用以表达视频所表达的主要内容。

(五)音视频采编技术

目前音视频采编技术从技术角度可以分为线性编辑技术和非线性编辑技术。其中被广泛使用的是非线性编辑技术,由计算机系统和数字专业板卡构成,采用数字技术对视频、音频等信号进行分离、处理,从而达到理想的合成效果。以音视频采编技术为核心构建编辑系统,将图像转化为数字信号后进行保存,同时构建数据库对所有素材进行管理,实现随时以各种顺序存储、调用、处理和重放图像。通过非线性编辑技术可以将画面剪辑、后期、字幕文字等进行合成,实现以时间为主线的同时完成空间的分解和重组,解决多层图像合成问题。在编辑过程中可以任意改变镜头位置和节目的长度,也可以任意改变节目的编辑时间和线性结构。

三、数据出版

数据出版是指以数据论文的方式,通过互联网公开发布观察、实验、计算分析等研究过程中的原始数据,或对已有科学数据进行整合、标识和交互处理,形成数据集或数据产品,以便使用者能够快速发现、获取、理解和再分析利用的一种出版方式。

数据出版不是简单的数据开放和数据共享。通过对数据整合、数据标识和数据交互,将数据文件上传至互联网,使相关数据具有开放性的同时,数据文件能够长期、无损保存。在数据出版的框架下,不同类型的数据具备不同的出版形式,具体可分为以下三种:

第一,针对原始数据。可以以元数据或者数据论文的形式发表,能够准确反映出观测者、仪器、观测机构信息以及受资助的情况。利用Datacite数据引用标准格式,通过数据互引,构建不同数据与被引文献之间的关联。

第二,针对分析处理后的数据。可以以数据期刊的方式出版。在此过程中以传统论文形式对数据源信息、数据处理过程、质量控制措施以及相关数据的使用方法进行详细描述,有助于帮助数据使用者合理正确地使用。通过数据发布对原始数据和处理方式进行引用,构建数据与数据之间、数据与研发方法之间、数据与数据生产者/使用者之间的关联。

第三,针对学术结论有直接支撑作用的数据。引入可视化技术通过图形、图像、表格等形式进行出版。通过数据引用,构建学术结论与支撑数据之间的关联。

(一)数据内容管理技术

数据出版涉及多类数据,包括实验、测量、采访、调查、模拟数据等,其数据格式可能以多种形式存在,如EXCEL、数据库、文本格式等,数据表现形式更是多种多样,包括图、表、音频、视频、3D展示、动画等,这对数据内容的融合管理提出了新的要求。

数据内容管理技术重点解决各种非结构化或半结构化的数字资源的入库、存储、管理、利用、传递和增值,并能有机集成到结构化数据的运营智能环境中,如数据发现、精准推荐、计量评价等。数据内容的创作、编辑、发布人员则需要使用这项技术来提交、修改、编辑、审校、发布数据内容。

(二)数据质量检测技术

面对数据出版可能出现的各种特定数据格式,需要利用数据质量检测技术确保各种格式数据的完整性、一致性、准确性和有效性。该技术可处理经由程序接口采集的多源数据,通过筛选算法和人工干预的方式对数据进行甄别,自动发现脏数据和无用数据,保留有效数据集合,并能提取数据特征值,包括数据的类型、含义、规格、大小、表现形式和存储格式等。通过对特征值的演算变换,计算特征间的相对率和相对比率,在此基础上利用统计学方法和质量约束规则,完成对数据质量的自动化检测。

(三)数据确权与版权追踪技术

以区块链技术为基础构建一套去中心化的、可信任的区块链网络,将数据内容及对应数据的来源、作者等信息完整记录在区块链节点上,实现内容永久、不可篡改的保存。结合大数据技术、全网监控等技术对链上内容的传播情况进行全网络范围监控,当区块上的内容在传播过程中被分享、盗用时,通过区块链之间的互联互通特性,实现数据的确权和追踪,以保证数据所有者的权益不受侵害。

四、协创出版

协创出版又称全过程出版,是一种试图通过协创平台将科研创新全过程予以记录,并将其中的重要过程成果选择性公开发表的全新出版模式。协创出版以突破当前学术出版的出版极限、传播极限和服务极限为目标,以构建衔接学术研究、学术成果记录、学术传播的学术生态链为任务,以知识管理、知识挖掘、协同研讨与协同编纂等技术的有机整合为基础,旨在打通知识生产、知识传播、知识利用全过程。

协创平台是协创出版的关键支撑系统,平台以项目管理为核心,综合应用各种显性知识并挖掘研究团队的隐性知识,开创全新的团队学习、讨论、研究和创作模式,同时对创作的过程、思路、结果等进行碎片化处理和结构化加工,以全媒体形式进行存储和再利用,帮助研究团队在规范化、程序化的流程框架下完成科学研究和创新,如实记录参与者的创新思维和贡献,实现碎片化的微成果登记,并为过程成果的确权与发表提供全流程服务。

为了保证平台未发表数据的安全性、保护研究团队的过程数据隐私,协创平台需要充分利用数据加密技术、访问控制技术等实现对系统数据的集中管理、集中策略控制,以及灵活的分组(部门)管理。同时为了促进合作者资源的优化配置,提高合作沟通的效率与效果,系统整合了学者画像与合作者推荐技术,帮助项目牵头单位快速找到适于合作的其他科研团队。另一方面,系统整合了协同编纂技术,为多作者协同完成各个层面内容的创作及编改提供工具,并客观记录参与者的贡献。

(一)数据加密技术

数据加密技术是将数据信息经过加密钥匙及加密函数转换,变成没有任何意义的密文进行传输。接收方需要将密文通过解密函数、解密钥匙还原成明文,确保数据信息传播过程的安全。数据加密技术大致分为三类:专用密钥、公开密钥、非对称加密技术。

(二)学者画像与合作者推荐技术

学者画像是基于用户数据对现实世界中用户的数学建模。在构建科研工作者学者画像的过程中,首先通过互联网采集大量真实用户数据,采用基于深度语义学习的实体识别技术、关系抽取技术及属性抽取技术对多源用户信息进行抽取,针对科研工作者,重点抽取包括研究领域、工作单位、职称职位、学术成果、文献引用情况等信息。采用基于跨模态共享子空间学习理论的知识融合技术,实现跨模态、跨领域的学者信息融合,构建学者画像。引入基于深度神经语言模型的知识推理与实体扩展技术,实现对学者画像的动态演化和更新,最终基于学者画像实时、动态推荐合作者。

(三)协同编撰技术

协同编撰技术的引入旨在构建一个能够共同创作的平台,解决科研成果跨地域的协同创作。以Web为基础,构建一个可以随时随地通过互联网进行数据信息交互的框架,在数据内容语义结构化处理的基础上,引入多媒体交互技术,构建协同工作模型,面向科研工作者实现消息协同、会议协同、写作协同和讨论协同。常见的协同工作模型通常由开放系统互联环境、系统工作支撑平台、协同工作应用接口及应用系统等四个层次构成。其中开放系统互联环境能够为整个协同编撰过程提供通信服务,确保正常、高效的通信。系统工作支撑平台则提供整个协同编撰过程所需要的相关工具和服务,比如,在线编辑工具、格式转换工具、自动标引结构化工具等。

五、可视化出版

可视化出版是利用可视化技术、虚拟仿真技术及可视化工具将科学计算、数据、信息、知识立体地呈现在用户面前的一种新型出版方式,具有直观、生动、交互性强等优点。

在可视化出版过程中,需要将抽象的内容信息、分析结果通过表格、图形、图像等形式直观、形象、立体地展示给读者,帮助读者快速掌握主要内容及关联关系,同时加深读者对内容的理解或进行辅助决策。基于统计学构建的类似于饼状图、折线图、柱状图等只是对内容数据可视化的基础,不能有效体现内容数据之间的关联关系。在引入可视化技术、虚拟仿真技术后,针对文本内容将相关词汇通过语法规则组织成词汇集合,对词汇进行标签化处理,通过词频统计和词汇分布分析词云图、词汇分布图,实现对文本主要内容的直观体现;针对文本关系(如文献引用关系、主题关系、页面链接关系等),通过聚类算法,将特定维度上的相似内容、关系进行聚合,以图谱形式解释内在联系和隐藏的关键信息。由此可见,可视化技术、虚拟仿真技术是实现可视化出版的有效手段。

从用户需求对可视化技术进行分类270),包括:

(1)科学计算可视化。指对计算或实验产生的数据进行的可视化研究。随着技术的发展,可视化的范围从科学计算产生的数据扩大到其他类型的数据,由此形成了数据可视化。数据可视化主要建立在文献中实体对象或数据语义标记的基础上,并用大量高清图像、视频、Flash 应用等多媒体方式代替传统的文字或二维图表加以呈现。由于动态可视化的形象展示,读者能够更加直观、深入地理解相关概念、数据结构和模型等对象。

(2)信息可视化。旨在利用大量抽象数据衍生出新的见解,主要帮助改善大数据集的信息检索、访问和表达。信息可视化使原本单调的线性叙述方式被一种更富于层次感的结构所取代,带给用户全新的阅读体验。如施普林格•自然推出的在线可视化工具Author Mapper,将作者位置信息和Google地图相结合,通过动态页面实现搜索和科研趋势分析。

(3)知识可视化。旨在通过更加丰富的方式促进知识在人群中的传递和创造,增加个体之间的知识密集型交流。如当前天文学、生物学、地球科学等领域的科学家往往要面对无比庞大的信息量,而且其中蕴含复杂的变量关系,就需要借助可视化分析工具对复杂现象进行直观表达,从而提高科研人员的信息获取效率,并发现信息分析中存在的盲点。

这三种可视化类型之间的关系呈现螺旋式上升和递进,也展现出人们希望通过图像、视频或其他多媒体呈现方式帮助理解其中的抽象概念和结构,这也是科技出版可视化的价值所在。

六、语义出版

语义出版最早由大卫•香顿(David Shotton)于2009年提出,是一种可以提高期刊上文章的语义,促进它们自动化获取,使其能够链接至语义相关的文章,并提供获取文章内数据的可行性途径,使论文之间的数据整合变得更加容易出版271)272)。语义出版以促进计算机自动获取文章语义为目标,以实现对内容数据、知识资源的自动发现、抽取、整合、链接及再利用为任务。

从学术交流的角度出发,应该实现快速的自动化无缝获取,整合各类跨学科知识信息。从传播的角度出发,需要满足读者的个性化阅读需求,以阅读内容为基础在语义层面构建知识关联网络实现互联互通,面向读者群体提供智能索引、智能推荐服务。从技术上来看,实现语义出版需要通过本体技术对各领域知识、各类资源以及资源之间的潜在关系进行描述,构建不同领域的专业知识体系。在该体系的框架下,通过对内容的自动化处理,实现各领域文献内文本词汇的智能识别、检索和相似度分析,对不同文献进行语义标注、分割和关联,最终以语义链接的形式构建语义网络,实现文本内容的自动关联和推荐。科技出版语义化的理想状态是基于庞大的语义网基础设施,利用技术与协议使科学论文和数据相互关联,并引入领域本体,支持科研人员采用基于语义相关的非线性阅读方式273)

(一)本体技术

本体通过定义知识及知识间的关联关系,最终确定其精准含义,赋予了互联网信息语义的含义,是从语义层面解决互联网信息共享和传播的基础。构建领域本体是对领域内的知识资源进行语义表述的基础。

领域本体的构建主要是基于专业叙词表、分类词表、主题词表、分类主题等结构化信息资源,通过构建模型将知识转化为本体中的类、将知识的层级结果转化为本体中的上下位关系、将知识的描述转换为本体中的类属性。为了能够更深层次地反映各知识之间的内在关系,在利用计算机自动获取知识和属性的同时,构建多元组实现知识间关系的自动识别、获取,通过此种方式构建的领域本体具有强针对性和高准确性等优点。借助互联网海量数据,本体进化技术根据现有知识和规则进行推理,实现领域知识和知识之间关系的自动学习和获取,解决信息量有限、更新缓慢等不足。基于互联网本体进化的方法,在获取了本体的类名、属性名及关键词集合后,通过智能搜索、数据清洗、特征提取和关键词获取等操作获取候选关键词集合,最终实现领域本体的构建和自动学习。

(二)语义标注技术

语义标注的结果是通过构建语义索引体现的。在语义出版的过程中,内容资源需要在动态真实环境下体现,同时知识属性与关系的来源、新知识的获取都需要和现有资源密切结合。以语义标注为核心的语义检索在其中起到了决定性的作用。

与传统基于关键词信息的检索方法不同,通过语义技术,得到每个句子不同层次的语义标记,在索引时利用标引的语义信息构建语义索引架构。通过自然语言处理技术,充分利用领域本体内部的概念、属性,以及概念之间的关系,对相关文献进行语义标注,并在大量内容语义化的基础上,通过深度学习等技术实现语义标注与资源语义化的同步实施。与传统的按照整篇文档进行内容索引不同,语义索引是将文档分割成段落级、句子级等不同大小的粒度后,将知识片段的语义内容通过语义索引的形式表现出来。

(三)语义网络构建

通常情况下所提到的万维网是由非结构化数据构成的,网络上的内容只有人类可读,但是对于计算机而言,它只知道这是一个网页,而对其中包括的图片、链接、表格等的意义和关联关系是无法理解的。因此,计算机不能自动对其中文本内容的隐含信息进行有效组织和推理。而语义网络则不同,它通过本体、命名、分类、属性、关系等概念描述整个网络,同时遵循一定的标准体系,以便于在该描述体系下所有信息能够实现互联互通,构建语义关联关系网络。

七、知识服务

随着信息技术的发展,用户对知识获取的需求在不断提高,尤其是在专业出版领域,用户的需求在向个性化发展。在以用户需求为导向的互联网时代,出版行业基本流程被不断优化和再造,传统的文本加工正在逐步向知识发现、知识整合转变,知识内容多以碎片、多源、异构、强关联的形式存在,出版机构的身份也正在由出版发行商向信息提供商、知识供应商转变。在这一过程中,对于内容的挖掘和组织是最关键的环节,而这一环节的基础便是底层数据的碎片化和内容动态重组。

内容动态重组可根据各种媒体资源,以及内容单元之间的关联关系,结合不同专业领域的特点,快速完成个性化产品内容的生产。动态重组技术建立在海量结构化数据之上,基于知识组织和规则,把碎片化的素材进行关联,快速抽取,重新组装形成新的产品。

结构化数据是基础,通过对各种数字内容进行标注,构造合适的结构化关系。数字内容的结构化,是对自身内涵的描述,也是对自身与其他素材之间关系的刻画。同时,数字内容经过结构化,可以有效地实现碎片化处理,将不同粒度级别、不同结构组织的数据分散开,以备复用。数据的结构化分为全结构化和半结构化两种,由于全结构化数据的局限性,半结构化数据模型近年来已经得到广泛地应用,特别是可扩展标记语言XML,通过对数据内容使用标签和属性进行标记,为数据提供了丰富的元数据信息,从而可以为上层应用的构建提供有益的指导。此外,XML基于内容的天然结构,使用嵌套的标签形式,可以对内容进行层次化的组织,符合人们普遍的认知形式。

知识组织和规则是桥梁。知识组织是基于领域的,表示特定领域内专家与从业者的知识体系。动态重组最终的好坏程度取决于知识组织的完备性和准确性。通常,用户需通过关键词进行描述,而领域词表是对关键词的完善和补充。而更一般的知识表示是基于领域的本体库,通过描述得到领域广泛认可的概念,以及概念之间的关系。规则是对动态重组内容的指导,例如,重组的内容主题、重组的内容时间跨度、重组的素材来源、重组的素材数量等。而最后的素材提取及组配过程,是在重组策略控制下的自动化过程。

目前,知识服务是国际科技期刊出版的主流出版模式,国内科技期刊虽然相比国外有一定的差距,但是始终在进行积极探索,而技术的发展将为这个过程带来新的契机。如何利用技术进一步提升资源及数据的规范性、保持数据的完整性、呈现多样化的数据,将是未来知识服务提升的基础。

八、通用技术

(一)大数据技术

大数据技术是一种包括数据采集、加工、标引、存储、统计、分析、挖掘、预测和呈现的综合性技术。大数据技术以庞大的数据信息为基础,强调数据信息的完整性和全面性,重点在于多源异构数据处理后的价值体现,是对数据核心价值的再挖掘,通过数据挖掘构建语义关联网络并提供专业数据服务。

在大数据环境下,信息孤岛的现状已被打破。利用云计算技术能够记录、分析、呈现任意用户在任意出版过程中的每一条数据。传统选题依靠随机问卷的形式已不再适用,而是通过对实时数据聚类分析得出不同学科/领域知识图谱,在多种分析模型和可视化技术的综合作用下,以柱状图、饼状图、折线图、词云图等多种形式,完成对学科热点趋势、研究机构分布和受众群体的检测、分析、追踪和预测,实现以用户需求为导向的科学策划。在内容编审环节,对已OA的文献数据资源进行结构化、知识化加工标引,形成比对源。通过指纹识别技术将待审稿件的观点、内容、创新点等与其进行比对,能够对内容抄袭、重复发表、观点陈旧、虚假创新等进行高效甄别。运用数据挖掘和可视化技术,为每位科技期刊内容创作者构建实时学者画像,其中主要包括该学者的发文量、被引量、发文学科分布、录用期刊,以及录用期刊的影响因子等历史数据的语义关联。通过学者画像,出版机构能够对不同作者在不同领域的研究水平进行预判,实现来稿个性化处理,以及精准的智能推送服务等。在制作发布环节,内容动态重组便是大数据催生下的产物,通过词表构建技术和本体构建技术面向不同专业领域构建完整的知识体系,根据全媒体资源及内容单元之间的关联性,结合不同专业领域的特点,利用知识资源检索技术对碎片化的关联性素材进行快速抽取,经过重新组装完成个性化产品内容的生产。在知识服务环节,最典型的例子莫过于智能推荐。对用户数据从人口特征、互动行为和社交媒体三个方面进行建模分析,以用户浏览、检索和购买三种操作行为为主线,引入文本语义分析技术对相关历史数据进行处理,从内容分类、本体概念、语义相似度等多个维度刻画用户行为轨迹,通过知识资源推荐技术向用户快速推荐感兴趣的内容,同时确保推荐内容的相似性、新颖性和多样性。

大数据技术的应用还促使科技期刊评价规则向多元化转变274)。学术评价是伴随学术研究的必然活动,当前的学术评价主要包括定性(同行评议)和定量(引文计量)两种方法。同行评议是对内容的直接评价,但结果的公正性、时效性对外界环境具有较强的依赖性;引文计量虽然具备较强的可操作性,且客观、快捷,但目前单纯统计被引频次的方式过于粗糙,无法准确反映评价对象的实际价值。无论是单纯的统计作者发文数量、被引频次,还是评价期刊的学术影响力,都是对评价对象某一特定层面的单一评估,其中的创新性、首发性、核心贡献、社会影响等均未列入评价范畴。大数据技术在评价指标框架方面,利用数据挖掘技术,引入综合影响因子,有效反映期刊的跨学科影响力。针对基础研究类和技术研究类科技期刊,分别引入基础研究影响因子和技术研究影响因子,反映出不同研究层次学术研究产生的不同影响。引入学科复合影响因子,反映综合类科技期刊在其重点学科的影响力。在评价时效方面,利用数据挖掘和数据跟踪技术构建一个实时更新的动态数据信息源,确保统计数据的精确度和可信度。

(二)人工智能技术

人工智能的概念最早于1956年提出,人工智能技术是指利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统275)

(1)选题策划。传统出版模式主要依靠经验和市场直觉,在时效性方面严重滞后。在互联网时代,以大数据为基础引入数据挖掘和深度学习技术构建跨媒体知识图谱,量化分析读者的主观阅读意愿,获取读者需求。同时对全网热点话题/热门事件进行实时监测、监控和追踪,利用智能分析和机器学习等技术对热点话题/热门事件的评论数据、回复数据,以及相关读者的用户行为数据进行分析,预测传播趋势,双管齐下实现智能选题。

(2)协同撰稿。结合数据挖掘构建跨媒体知识图谱,利用智能检索、情感分析、智能推荐等多项技术对已录入的关键词、观点等信息进行匹配分析,实现相同观点的文献推荐、内容提示。运用群体集成智能的理论和技术,包括基于互联网的大众化协同、大规模协作的知识资源管理与开放式共享等技术,协助作者进行资料分析与用户研究,协助作者进行创作,支持众多作者在线协同撰稿、编辑。

(3)内容编审。一方面,随着图文识别、智能检索、数据挖掘、语义分析等技术的飞速进步,在内容编审环节引入人工智能技术实现了根据上下文内容对简单的错别字、缺字、人名/地名、单词拼写、异形词、标点等错误,以及参考文献前后是否一致等问题的自动识别和修正。另一方面,依托深度学习技术将稿件所属的研究方向、研究领域以及研究层次与审稿专家数据库进行匹配,结合专家的审稿速度、审稿质量、审稿态度和拒审率等综合评分,为稿件智能推荐最合适的专家。在此过程中引入数据挖掘技术,基于作者和专家的履历进行关联性对比分析,甄别工作、学习交集,为稿件剔除有合作关系的、相同单位的专家,确保稿件审理的公正性。

(4)发行传播。人工智能技术强调差异化、个性化和定制化传播。利用大数据技术和人工智能技术构建多维度模型,对包括检索、阅读、购买、评论在内的多种用户行为数据进行采集、统计和分析。通过机器深度学习、卷积神经网络等技术对算法模型进行相似度训练,以实际需求为导向、面向不同渠道的读者,提供不同的内容,实现精准推送和智能化传播。

人工智能对期刊出版的影响不仅体现在上述几个方面,它正在全方位地促进期刊出版流程的优化和升级,同时为读者带来更好的阅读体验。人工智能技术和科技期刊的融合势必会推动期刊出版向全流程、多元化、智能化的方向发展。

(三)区块链技术

区块链最初是指一种去中心化的数据库,代表着一种数据结构,由中本聪于2008年首次提出。因为其具备去中心化、开放性、可追踪性、不可篡改性和匿名性等特点被广泛应用于数字货币中,利用时间戳和前一区块的区块链接确保区块中数据不可逆。2016年,中国人民银行数字货币研讨会首次肯定了数字货币在降低传播货币发行流通等方面的价值。目前,我国区块链技术在出版行业的应用主要体现在知识产权保护方面,集中解决目前数字版权侵权泛滥、版权登记制度缺陷和侵权举证难等问题。

互联网传递信息,区块链传递价值。在版权交易过程中引入区块链技术,实现交易的可信记账和追踪。基于区块链技术建立一套去中心化的、可信任的区块链网络,在该网络中通过分布式账本多节点完整记录期刊文献内容和对应的产权归属,在产生产权交易的过程中,记录每一笔交易发生的时间、地点、交易双方、交易内容等各种交易信息,实现交易双方的可信任记账。结合大数据、全网监控等技术对链上内容进行传播情况的全网络范围监控,实现在任何时刻对产权交易历史的回溯和追踪。当区块上的内容在传播过程中被分享甚至盗用时,通过区块链之间的互联互通能够进行追溯并通知产权所有人,为解决产权纠纷提供权威凭证。

未来区块链技术在出版行业的应用将不再局限于版权保护、交易记录和追溯等方面。随着智能合约技术的成熟,以及网络化、数字化出版相关标准的完善,区块链技术将有望实现图表/公式的不端检测、同行评议的身份认证、参考文献的自动引用等,这将又是一项能够引起出版行业转型升级的新兴技术。

(四)移动互联网技术

在移动互联网技术催生下的移动出版是一种新型的跨媒体出版模式,通过将内容资源进行融媒体编辑加工,利用移动网络在智能终端进行传播。随着移动互联网技术的发展、传输速率的提升,使得传播多元化内容成为可能。在信息过载和移动智能终端普及等因素的影响下,阅读受时间和空间的限制已被打破,人们的阅读习惯正在由传统的纸版阅读向多样化的移动终端阅读迁移。

在内容编审环节,移动互联网技术的引入使出版活动不再受时间和空间的限制,出版人只要接入网络便可随时随地参与出版活动或对相关的出版任务进行操作。同时,利用移动互联网提供服务,在内容编审环节可实现作者、编辑、专家之间的实时沟通,加速出版流程。移动互联网技术对于内容的传播和服务方面有着更深远的影响。首先,打破了传播对版式的约束,通过引入音频和视频进行融媒体加工,使内容更加丰富、完整。利用屏幕自适应技术解决硬件环境变化对内容展现带来的影响,提供了类似仿真阅读、有声阅读和交互阅读等多种阅读模式。其次通过APP、公众号,以及自适应WAP网站构建移动出版生态圈,按照阅读/研究层次、服务类型对用户进行精细化区分,结合行为数据采集及情感分析等技术获取用户的潜在需求,对内容二次加工进行智能推送,实现一次制作、多元发布。基于主题内容创建交流圈,便于学者交流研讨,有利于收集用户反馈信息,形成良性循环。

九、技术对出版的影响

技术与出版模式的融合不仅促进了出版模式的不断发展,还改变了用户获取期刊信息的方式,增强了用户获取期刊信息的能力,推动了期刊出版的繁荣。在传统出版技术条件下,人们习惯于利用纸版期刊,查阅资料的方式主要是在图书馆或阅览室逐本查阅,不仅费时费力,而且效率极低。在电子出版技术条件下,期刊的信息载体是磁盘、光盘等电子存储设备,体积小、存储容量大,肉眼看不到其中的具体信息,必须借助于计算机等相关设备才能阅读。与传统出版相比,电子出版技术条件下通过构建期刊数据库,并通过信息检索手段进行期刊查阅,大大提高了获取期刊信息的效率。随着4G技术的迅猛发展及5G移动通信技术的应用与发展,智能手机及平板电脑成为最重要的移动阅读终端,移动应用软件APP的大量涌现,引发了期刊信息获取方式的变革,网络多媒体将图片、声音、视频及超链接等技术手段融为一体,内容更加丰富生动,进一步提升了人们获取期刊信息的能力。

网络技术的发展,改变了人们获取期刊信息的方式,打破了时间和空间的限制,在任何时间、任何地点都可以通过网络查询到所需要的相关信息。在网络信息技术条件下,由于使用超文本链接,用户只需点击鼠标,即可完成对期刊信息的查询操作,缩短了受众的信息获取时间,信息获取更加方便、快捷;读者有更多的"发言权",可与期刊和作者进行灵活双向的直接交流,信息的流动速率和利用率大大提升,信息价值也得到充分发挥,进一步提升了人们获取期刊信息的能力。

第三节 支撑出版模式创新的平台建设

学术期刊出版平台的定义目前在国内外并没有统一的界定标准,平台聚集"内容资源",既为上游期刊提供资源发布、展示等功能,又为终端用户提供资源检索、传播、服务、评价等功能,通过一定的规则和机制促进不同用户群体之间的协作和交互,借助互联网和移动互联网实现平台和各端的互动。在愈加开放的学术交流环境下,技术的发展直接推动了学术期刊出版平台功能的改变,使学术交流变得更加方便和快捷。对于我国科技期刊出版单位来说,要想建设世界一流科技期刊,实现国际化发展或者提高国际影响力,有必要了解国际期刊出版平台,从而学习其先进经验,建立中国高水平的出版平台。

一、国际平台的分类

(一)投审稿平台

在稿件采编环节,国际主流投审稿平台主要包括科睿唯安的ScholarOne Manuscripts;美国HighWire开发的Benchpress、Preprint;爱思唯尔开发的Elsevier Editorial System (EES)、Evise,西班牙Aries公司开发的Editorial Manager (EM);Public Knowledge Project (PKP)组织研发的为支持开放获取期刊的 Open Journal Systems (OJS)。

1. ScholarOne Manuscripts

ScholarOne Manuscripts在全球服务6700余种期刊276),与Web of Science、Reviewer Locator、ORCID、EndNote、Publons等无缝集成。Reviewer Locator自动从Web of Science匹配并推荐审稿人,审稿人可以利用Web of Science引文数据库,及时查找与稿件相关的文献;集成EndNote,使用EndNote写作的作者,参考文献可以自动格式化成期刊要求的格式,省去了编辑重新编排的时间;集成ORCID这一全球研究者学术社区功能,让期刊更容易了解到专家的最新学术动态及科研成果;集成Publons,可将专家审稿工作和学术评论转化为可衡量的产出,以确保审稿人的每项工作得到认可。ScholarOne Manuscripts每年至少2次全球同步升级,有超过200万的有效专家信息,目前有中文、英文、法文、日文等多个版本。ScholarOne Manuscripts的建设目标是集成数据库平台与多种出版服务工具,体现全球最先进的出版理念,让全球领先的投审稿平台更好地服务于学术出版。

2. Editorial Manager(EM)

EM在全球服务6700余种期刊277)。2018年9月,爱思唯尔收购Aries公司,2019年爱思唯尔旗下的期刊及与爱思唯尔合作创办的期刊宣布放弃自己开发的EES和Evise,转而使用EM。

EM在1990年推出之时只是作为一款单纯应用软件用于稿件追踪,2001年起它被移植到Web上作为一个B/S远程使用,并迅速被学术团体及出版商使用。随着互联网的迅速发展,EM采用全球领先的云计算模式为用户提供全面的技术支持,主要功能包括:

(1)EM采用云端服务,支持各类浏览器,因此用户无需下载任何应用程序,只要连接上网络即可使用。

(2)自动将参考文献链接到CrossRef和PubMed,并将参考文献格式化为期刊样式。

(3)集成Pivot数据库,有超过350万个审稿专家,方便选择合适的审稿人。

(4)提供稿件Transfer功能。

(5)统计报告可视化。

(6)与第三方机构如Kudos、Publons、Impact Vizor、ORCID等共享数据。

(7)与ORCID、Ringgold、FundRef、JATS和CRediT等标准进行集成。

(8)在英国、德国、日本和美国设有个性化服务客户中心。

(9)开发多个语言版本,包括简体中文、日文、德文、法文、西班牙文、葡萄牙文、英文。

(10)积极参与用户社区,每年举行3次用户会议,每周召开网络研讨会等。

(11)免费功能升级,每年升级2~3个新版本。

3. Open Journal Systems(OJS)

OJS是由PKP组织研发的学术期刊在线编审管理与期刊出版的免费开源软件,在全球服务7000余种开放获取期刊(如果期刊在某一年至少发表了10篇文章,那么该期刊将被计算在内,否则将不予计算)。PKP 由加拿大英属哥伦比亚大学的约翰•威林斯基(John Willinsky)在1998年创立,现由加拿大英属哥伦比亚大学教育学院、加拿大西蒙菲沙大学图书馆、美国斯坦福大学教育学院以及加拿大西蒙菲沙大学出版研究中心等机构共同合作278)。OJS致力于通过向期刊社提供一套完整的在线办刊系统,以提高出版效率。OJS第一个版本于2002年发布,2016年8月已经发展到了OJS 3。早期的版本功能单一、性能一般,新发布的OJS 3在功能上主要具有以下特色:

(1)支持本地安装。

(2)编辑人员自行配置需求、栏目、评审过程等。

(3)所有内容可以在线提交及管理。

(4)具有延迟开放获取选项的订阅模块。

(5)用户可以基于领域和编辑选择不同的内容阅读工具。

(6)为读者提供电子邮件通知和评论功能。

(7)提供完整的上下文相关在线帮助支持。

OJS 作为支持开放获取的开源系统,适合电子版与纸质版期刊对应的情况,也适用于纯电子版杂志的发布与管理;在编审业务实现、出版标准化、与稿件审稿系统的紧密结合,以及系统的高可配置性方面独具特色。

4. Benchpress

Benchpress是由HighWire于2001年研发的服务于学术期刊的投审稿平台,用户包括SciencePlant Cell等期刊。Benchpress是基于Web的在线稿件处理平台,可以根据特定的要求定制。众所周知,大多数投审稿平台按照在系统中提交的稿件数量向期刊收费,而Benchpress按季度固定标准收费,在一个季度内,无论是提交100篇稿件还是1000篇稿件,费用都是固定的。除此之外,Benchpress还具有以下功能特点:

(1)Benchpress和HighWire开放平台实现无缝对接。

(2)提供引文跟踪,如在Medline数据库的引文链接。

(3)可以根据期刊的要求灵活地调整审稿流程。

(4)提供丰富、翔实的审稿人数据库。

(二)排版校对平台

计算机技术的发展给排版校对工作带来了一次革命,使排版摆脱了"铅与火"的陈旧方式,经过大批计算机科技工作者的多年努力,诞生了许多不同风格的排版系统,本节介绍国际上流行的智能化排版系统和校对系统。

1. 排版系统

动态排版系统主要有以下3种。

(1)PTC Arbortext Styler系统。创建基于XML的样式表,供自动化出版使用。PTC Arbortext Styler使样式表开发人员无须掌握专业的编程技能,就能创建和维护基于XML的样式表以进行自动发布,用户可以创建支持多种输出类型的单一样式来源。PTC Arbortext Styler主要具有以下功能和优势:①改善开发人员和作者的工作效率,在直观的用户界面中快速轻松地创建样式表;②增强输出功能:在多种媒体类型之间共享格式设置,或为特定的媒体类型建立独特的格式设置,全都在同一个样式表中完成;③减少对专业技能的需求:通过将同一组技能应用于所有输出类型,简化样式表的创建过程。

(2)PTC Arbortext Publishing Engine系统。它是一个基于服务器的系统,会跨所有目标介质制作按需、更新的出版物,包括HTML网页、EPUB或帮助文件,以及基于页面的格式,如PDF、PostScript以及Word,自动过滤、组合和发布技术内容,以提供准确、相关的产品信息和服务信息。该系统主要具有以下功能和优势:①缩短信息的发布时间:无论使用何种介质,均能利用自动化的出版过程缩短交付时间;②改善信息的相关性:组合和出版内容,这些内容按照特定用户的要求定制,并且自动使用更适合用户需求的介质交付;③降低出版成本:使用功能强大的自动内容格式化工具消除费用高昂、劳动密集型的桌面出版任务。

(3)PTC Arbortext Advanced Print Publisher系统。它是一款先进、自动化的打印排版系统,将更好的排印功能与功能强大的自动化工具结合在一起,让用户在服务器或桌面环境中创建桌面排版(DTP)质量的输出。全局语言支持允许通过一个模板进行多语种的格式化,从而降低生产成本。交互式的微调功能允许在排版后更改内容和外观。主要具有以下功能和优势:①改善输出质量:通过采用有效的排印和布局控制措施,遵守严格的输出要求和出版标准。②降低生产成本:自动完成桌面出版任务,以减少手工工作量和消除人为错误。③提高输出的灵活性:应用条件性的格式化和多个输出视图创建各种交付项,无需重复工作。

2. 校对系统

在线校对系统主要包括爱思唯尔开发的Proof Central、施普林格•自然开发的e.Proof、美国化学会开发的ACS Direct Correct等。这些在线校对系统支持多角色同时在线校对,大大加快了出版周期。在功能上,3个系统具有如下共同特点:

(1)系统都是基于XML技术开发,以HTML界面展现。

(2)系统都支持插入/删除字符,撤销排版员的修改,插入批注,字符的斜体、加粗及上、下标的修改,在线编辑修改公式,添加附件,生成更正的PDF版本等。

(3)支持包括编辑、作者和排版人员在内的多人在线校对,并保存校对记录。

目前3个系统存在的主要问题有:e.Proof不支持LaTeX排版的文件;基于XML排版的文章,其图表位置与PDF版本中的位置不一致,参考文献的著录格式也与PDF版本不一致。

(三)发布运营平台

自20世纪80年代起,国际出版机构开始投入大量资金,通过数字技术、云计算等信息技术,建设学术期刊发布运营平台,以支撑出版模式变化的需要。在学术期刊平台建设方面,目前影响力较大的学术期刊发布运营平台包括国际出版集团如爱思唯尔的ScienceDirect、施普林格•自然的SpringerLink、约翰•威立的Wiley Online Library、泰勒•弗朗西斯的Taylor & Francis Online等,学协会如美国化学会的ACS Publications、英国皇家物理学会出版社的IOPscience等,大学出版社如牛津大学出版社的Oxford Journals、芝加哥大学出版社的The University of Chicago Press Journals等,出版平台如日本的J-STAGE、韩国的KISTI、美国的HighWire、巴西的SciELO等,开放获取平台如PLoS、ScienceOpen、Hindawi等。

这些平台集内容展示、数字化采编、自助式检索、个性化定制及社交媒体互动服务为一体,实现了稿件采编、制作加工、发布传播的自动化,提高了出版的时效性。这些平台主要有以下功能特点:

(1)检索与导航。平台基本都提供快速检索和高级检索功能。用户可以在"快速检索"框中输入任意检索词,当需要精确检索时,可使用高级检索功能。高级检索可以设定学科领域、期刊名称、文献出版年、时间段,以及作者姓名、文章题目、摘要等检索范围,这些范围可以适当地组合搭配,以达到精确检索的目的。

(2)期刊主页功能。平台为每一本期刊都开设了期刊主页,提供期刊论文"优先出版"功能。在期刊的主页上有期刊的基本信息,包括期刊的所有卷期,以及检索功能、编委会、影响因子等。期刊的主页还嵌有投审稿系统,便于稿件的投审稿。

(3)文章主页系统功能。每篇期刊文章都有自己单独的页面,显示文章的基本信息,包括题目、作者姓名、卷期号、学科分类、出版日期及DOI号。对于订阅的用户提供文章全文的PDF下载。对于文章的主页,部分平台也设置了一些个性化的功能。如在页面点击"引用"的选项,可以查看引用该文章的其他文章信息。另外,页面还设置了"相关的文章"和"相关的评述性文章"两个选项,显示和本篇文章研究相关的文章。作者可以通过这些文章进一步拓展研究思路,丰富对领域的了解认识,从而更高效地获取信息。

(4)其他个性化服务。第一,通过Email Alert和RSS推送服务,平台可以向读者发送感兴趣或者订阅的最新文章及期刊消息,使读者了解所在领域的最新动态。第二,读者通过共享书签功能,可以将自己感兴趣的文章分享在社交网站上,比如Facebook等。第三,读者可以通过平台保存自己的检索、被标签的文章,以及下载过的文章记录。通过这些功能可以更好地为读者服务,提高用户的满意度。

(四)科研社交网络平台

科研社交网络平台借助互联网,通过提供学术科研的辅助工具和服务,促进学术交流、科研信息共享,提高科研效率,增强沟通,更好地促进学术成果的影响和传播。本节重点介绍ResearchGate、Mendeley、Academia.edu。

1. ResearchGate

ResearchGate279)2008年成立于柏林,旨在推动全球范围内的科学合作,分享科研方法,交流学术思想。截至2019年4月,已经有超过1500万名来自196个不同国家的科学家加入,有超过1.18亿篇文献可以通过此平台浏览、阅读和下载。目前ResearchGate已经获得了8700万美元的融资,包括在C轮融资中获得了微软创始人比尔·盖茨的投资。

在ResearchGate平台上,用户可以分享出版作品和研究成果,查看分享作品的引用和评论;关注其他用户,跟踪他们的学术动态和最新发布信息;在社区中创建问题,让大家讨论并提供建议等。平台根据用户的研究领域自动推荐同行和招聘信息等。

ResearchGate被称为科研工作者的Facebook,它的存在就是为了使学术信息更为透明,提升学术效率,让对某个课题感兴趣的全世界范围内的科学家可以协同工作。除此之外,ResearchGate还在做改变传统学术机制的事情--建立学者的声誉评价机制,鼓励学者不止把在学术期刊上发表的内容放在平台,也可以把他们第一手的调研资料和结果放在平台。同时通过社区内其他科学家的引用和评分,在网络上重新建立一套学术评价机制。

颇为有趣的一点是,ResearchGate的投资方并没有期望在对ResearchGate的投资中获得短期回报。而对于ResearchGate创始人伊亚德·马迪奥(Ijad Madisch)来说,他短期内也没有把ResearchGate做成十亿美元级别的大公司的准备。他想把知识从象牙塔中搬出来,让它数字化,可以为每一个学者提供帮助,借此促进学术发展进程。

虽然现在很多用户在ResearchGate中发布内容都是免费的,但未来ResearchGate可能在机构发布人才需求这一块尝试收费,在研究设备和服务的出售上也有很大的盈利空间。

2. Mendeley

Mendeley280)是一款免费的跨平台文献管理软件,同时也是一个在线的科研社交网络平台。Mendeley最早由德国的3位博士创建,一诞生就凭借其超前的理念和强大的产品功能获得多个欧洲大奖,2013年4月被爱思唯尔收购。

Mendeley支持多平台使用,移动端包括iOS和Andriod版本,用户可将本地文献云同步至服务器,免费个人空间为2 GB。从科研社交网络的角度来看,Mendeley和ResearchGate功能类似:记录、管理、分享自己阅读的文献;发布出版后的作品,并在平台上分享研究成果;获取自己研究成果的影响力统计,包括发表数量、引用次数、下载次数和读者人数;平台根据用户的研究领域自动推荐最新研究成果和研究领域动态;加入兴趣讨论研究小组,与全球的同行们互动。Mendeley和ResearchGate的区别在于,用户可以创建不同等级的群组,来和不同的人分享文献。

自2008年成立以来,Mendeley一直以开源和免费为宗旨,其数据库已经囊括了600余万名科研人员和近20.6万个科研团体发布的4.7亿份文档,并且支持超过260个教育及科研应用,其应用程序接口(Application Program Interface,API)每天被调用上亿次。Mendeley不但提供全文数据库,还利用大数据技术(Hadoop和MapReduce)对全文数据库与用户之间互动所产生的大量数据进行处理,生成有价值的数据并进行智能推送。

Mendeley在并购完成后的第一个举措,就是将爱思唯尔出版的数百万篇论文从全文预览数据库中移除,使用户无法社交分享。这些让步事实上削弱了Mendeley相对其他科研社交网络平台的竞争优势。ResearchGate、Academia.edu、Zotero等竞争对手正在吸引越来越多的科研人群,并在开放分享的基础上强化学术社交,争夺Mendeley的市场份额。Mendeley用户的社交活跃度在下降,很多昔日活跃的群组和用户变为长期不更新的数字"僵尸",这也是令人担忧的趋势。

3. Academia.edu

Academia.edu创建于2008年,旨在加速科学研究。目前平台注册用户超过8900万名,月活用户超过4700万名,有超过2300万篇论文可以通过其平台浏览、阅读和下载。Academia.edu在前三轮融资中共获得了3380万美元的投资。

Academia.edu平台的主要功能包括:分享论文;用户之间可以互相关注账户,以便及时获得他人的学术成果发布的动态信息;用户注册后,可以上传并发布已出版和未出版的作品,并可获得作品的浏览次数和读者人数;还可以建立讨论组,邀请其他注册者参与讨论作品或研究成果。

Academia.edu创始人理查德·普莱斯(Richard Price)表示,目前Academia.edu已经成为美国最大的学术论文分享平台。之前,如果科研人员想参考网站上的其他学术论文,经常会出现需要付费阅读的情况,很多甚至查看不了。有了Academia.edu,科研人员可以在网站上相互免费分享和查看各自最新的科研论文,使学术交流变得更为畅通。Academia.edu将采取长期盈利模式,论文分析服务所有人都可以免费使用,但是许多高级功能需要付费。

如今,越来越多的专业科研人员冲着其在科研学术领域的巨大作用而加入Academia.edu。然而,Academia.edu面临的最大挑战之一就是如何让不太会玩社交网络的科研人员参与到社交活动中来。有网络头脑的科研人员,基本上都有Facebook或者LinkedIn账号,他们会在这些社交网站上更新自己的新鲜事,不太愿意在Academia.edu上与人沟通,他们更多地将它当作是学术交流的地方。除了来自社交网站的压力,还有许多科研学术型网站的用户也在快速增长,如Mendeley和ResearchGate等。和ResearchGate相比,Academia.edu只提供交流功能,ResearchGate则提供讨论、问答功能。Academia.edu只允许有Facebook账号或者Google账户的人进行注册,这也会影响它在其他国家的推广使用。

(五)增值服务平台

在增值服务领域,国际同行在出版理念、出版产品和出版服务等方面做了更多的探索和尝试,为期刊出版提供了新的工具,为读者和作者服务。客观地讲,中国科技期刊的工作重心相对更局限于办刊,以提高期刊国际影响力、增加数据库收录比例等工作为主要任务,在利用新工具为读者和作者服务方面落后于国际同行。针对国际同行在出版服务上的新态势,本节重点介绍以下增值服务平台。

1. Code Ocean

对于科研工作者来说,编写代码是研究工作的一部分,科研工作者用多种编程语言开发算法、软件模拟和分析(每种编程语言通常都有多个版本,从而产生更多的兼容性问题),代码还依赖于不同的文件包、脚本和安装程序来正常运行,因此,这部分工作既耗时又复杂。另外,科研工作"重用"困难是一个备受关注的问题,许多人称之为科学中的"再现性危机"。基于此,康奈尔大学的西蒙•阿达(Simon Adar)博士创建了Code Ocean281)平台,它是一个基于Docker的开放代码和数据协创平台,总部位于曼哈顿,在特拉维夫设有办公室,员工分布在美国各地,是一个处于成长期的平台,旨在推动科学研究更容易、更协作、更持久,同时帮助解决科研再现性危机。

Code Ocean将代码、数据、结果和用于执行它们的计算环境汇集在一个独立的"计算胶囊"(Computer Capsule)中,以复现投稿作者的计算配置。并提供给使用者数据存储空间、适合代码运行的环境,从而使得用户可以轻松地在云平台上运行代码。该平台支持投稿作者从创作到出版的每一个工作阶段,用户基于云服务的Web浏览器开发、共享、发布和下载代码,无须在个人计算机上安装软件。其他用户可以从codeocean.com网站下载、修改和运行该代码。

Code Ocean平台提供的主要功能包括:编写、浏览和运行代码;下载代码和数据;无限制地发布代码,并为发布的代码分配DOI;修改已经发布的代码;协同编写代码;将代码链接至个人网站主页。平台支持多种编程语言,包括C/C ++、Fortran、Java、Julia、Lua、MATLAB、Octave、Perl、Python、Stata、R和Linux系统可用的任何编程语言。

Code Ocean平台为个体科研工作者、研究团队及机构提供服务。对于个体科研工作者,每月提供10小时的计算时间、存储空间为50 GB的免费服务;对于研究团队,团队中每名用户每月收取20美元的费用;对于机构,机构中每名用户每月收取25美元的费用。个体科研工作者和研究团队/机构之间的区别在于协作编写代码功能、管理和报告功能,付费的用户还能享有更多的存储空间和计算时间,由于共享环境和单点登录,允许更高的聚合。

2018年8月,Nature联手Code Ocean,在其旗下的三大子刊Nature MethodsNature BiotechnologyNature Machine Intelligence中试行审稿和文章发表新策略,即在文中提供可运行、有完整功能的程序,如果文章录用,相关程序会以DOI的形式在文中被引用,以解决研究成果的再现性和正确性问题。目前支持Code Ocean集成的期刊和出版商越来越多,包括Nature旗下的多种子刊、GigaScience、IEEE、国际光学工程学会(Society of Photo-Optical Instrumentation Engineers, SPIE)、剑桥大学出版社、泰勒•弗朗西斯等。

2. Publons

Publons282)由安德鲁•普雷斯顿(Andrew Preston)和丹尼尔•约翰斯顿(Daniel Johnston)于2012年创立,并受到了新西兰天使投资人30万美元的资助,旨在通过建立透明的同行评审认可平台,让同行评审更快速、更高效地推动科学发展。2017年,Publons被科睿唯安收购。Publons自成立以来发展迅猛,据官网介绍,目前已有21000余种期刊、17万余位评审人、超过60万份评审意见在Publons平台被认证。

Publons平台的主要功能有:让研究人员的同行评审工作获得认同,于此开发了同行评议的认证功能,这也是此网站最主要,也是使用最多的功能;记录和存档专家评审过的文章和所撰写的评审报告;培训科研人员如何审稿和撰写评审报告。

Publons的使用步骤很简单,主要包括:审稿人在Publons网站上注册后就可以添加审稿记录,然后Publons会联系所评审文章的期刊,确认记录是否属实。Publons并不标记所审稿期刊的好坏等级,不管期刊的审稿方式是单盲、双盲、还是开放的,只要作为审稿人都可以得到Publons平台的认可。如果期刊是开放审稿,审稿人提交的评审意见在文章录用后也可以被公开。在Publons审查完审稿记录之后,审稿人就可以下载正式的审稿记录并作为简历中的证明,用于审稿和基金申请。

对于集成在投审稿系统的期刊,Publons的操作步骤如下:审稿人在投审稿系统完成评审工作;审稿人在完成其评审工作时选取"选择加入"来使用Publons;投审稿系统自动通知Publons,告知评审工作已经完成,审稿人希望参与;Publons通过E-mail地址检查匹配账户;如果没有找到匹配账户,则邀请审稿人创建一个新账户;Publons自动从投审稿系统中检索详细的评审内容。

Publons集成在投审稿系统的优势包括:简化审稿人的认可过程;尊重匿名要求;改进审稿人的体验,认可审稿人的贡献并促进审稿人参与;Publons记录的评审有助于提高论文的Altmetric评分。

Publons平台对于研究人员的优势不言而喻,研究人员可以在平台免费注册,由于Publons与多家期刊合作,因此可实现审稿记录的自动更新。即使审稿人要求匿名评审,通过Publons平台依然可实现对审稿人工作的认证。另外,研究人员通常会具有审稿人、作者、读者三重身份,Publons可以帮助其展示学术研究成果。对于期刊,Publons平台一方面为期刊提供同行评审解决方案,提高同行评审过程的透明度、效率、质量和认可度。另一方面可以帮助期刊选择合适的审稿人。除此之外,Publons通过与Web of Science、ORCID等进行集成,保证了审稿人信息的可信赖性。Publons平台审稿人的个人页面会显示所审论文发表的期刊(包括名称和网址链接),而审稿人通常也会是作者、读者,这就可以提高期刊的显示度,扩大期刊的影响力。Publons还开发了Publons Academy系统,为注册的会员提供了10个培训模块,可以很好地帮助年轻科研人员了解如何完成审稿工作。

3. figshare

figshare283)由马克•哈内尔(Mark Hahnel)于2011年1月创建,2012年1月在Digital Science的资助下推出,旨在为科研人员提供发布各类研究产出内容的平台,以便研究成果可以更好地被引用、共享和发现。figshare总部设在伦敦,在波士顿设有办公室,研发团队横跨三大洲,以可靠、可扩展的方式安全、持久地存储、管理和可视化数据。截至2018年12月,figshare平台提供了2600万+页面浏览量、750万+数据下载、80万+用户上传、200万+文章、50万+集合、5000+项目。figshare每年发布"开放数据的状态",以评估开放研究中不断变化的学术环境。

figshare是一个基于云的在线数据管理平台,主要功能包括:保存和分享科研人员的研究成果,包括数据、数据集、图片、视频、海报、代码等,从而使他们的研究,甚至包括过程研究,发布并得到认可;平台为所有内容对象分配DOI,采用Creative Commons许可协议共享数据,减少版权纠纷,使全球科研人员可以存取、共享信息;figshare平台的主要特点包括:遵循开放数据原则,用户可以自由访问数据和快速、便捷地上传数据。另外,平台对各种文件类型都可以接受;figshare平台上的所有内容都有DOI,方便引用;采用基于云的数据管理来保证数据存储的安全和可靠性。默认情况下,figshare的数据都存储在Amazon Web Services S3上;公共空间不设限制,对于个人用户,提供20 GB的私人空间,可以存储暂时不想公开发布的数据;鼓励发表过程及负面数据和图表,用户可了解研究内容的全部计量统计,易于发现研究亮点,并成为现有科技出版模式的有益补充。

figshare不提供标准意义上的数据质量控制机制,更多的是一种数据优先发布机制,让数据创建者优先发布数据,其元数据是按照DC元数据创建的,没有审核机制,最后由数据提交者进行数据的核查和修改。

figshare为个人用户、出版商和机构用户提供不同的服务。对于个人用户,其主要功能和服务包括:①个人用户可以免费注册figshare;②上传的文件最大可至5 GB;③公共存储空间不设限,提供20 GB的免费私人空间,存储暂时不想公开发布的数据;④即使是负面和否定的结果,也可以为研究工作分配DOI;⑤平台接受上传任何文件格式;⑥提供桌面上传器,将文件拖放到桌面上,以便快速、可恢复上传;⑦提供API,自动化研究者的工作流程并提供示例;⑧提供共享空间,允许研究者信任的同事访问研究者的私人文件夹;⑨私人链接共享,快速与同事共享文件,也可以设置禁用链接;⑩为暂时不想发布的数据预留DOI。

figshare为出版商提供的服务包括:①可视化文章中任何格式的补充和数字文件;②可创建一个包含所有数字媒体和数据文件的库,并为文章带来流量;③提供数据存储区,在处理大的数据量时不会影响现有的基础架构。

对于出版商,根据出版商的文献数量、数据大小、与figshare集成及实施的复杂性收取相关费用。出版商可以在用户付费前公开补充数据,以增加读者对文章的兴趣,同时支持所有数据放在文章付费后的选项中。另外,figshare可以与出版商的任何现有系统集成,也可以根据出版商的要求进行功能定制。

figshare为机构提供的服务包括:①数据存储,通过私人存储、公共存储和共享空间控制研究者所在机构的研究成果;②数据传播,通过所有公共研究成果的可定制门户网站展示研究者所在机构的研究;③整理工作流程,管理要公开的文件,控制配额和管理权限;④报告和统计,管理员可以查看对象、研究人员、部门或机构级别的统计报告和指标。

figshare的创立,不仅满足了全球科研人员希望以更好、更新的形式展示他们的研究图表、数据、视频等成果的愿望,而且也可以新的方式提升研究成果的价值。

(六)评价平台

1. Web of Science

Web of Science(WOS)最初是由美国科学信息研究所(Institute of Scientific Information, ISI)于1997年推出的一个大型的、综合性的、多学科的科学引文索引数据库,后由汤森路透(Thomson Reuters)建设维护,2016年起由科睿唯安(Clarivate Analytics)运营维护。WOS核心合集由三个独立的数据库组成,分别是Science Citation Index Expanded(SCIE)、Social Sciences Citation Index(SSCI)和Arts & Humanities Citation Index(A&HCI),内容涵盖自然科学、工程技术、社会科学、艺术与人文等诸多领域内的9000余种学术期刊。WOS平台将WOS核心合集与多个区域性引文索引、专利数据、专业领域的索引,以及研究数据引文索引连接起来,总计拥有超过33000种学术期刊,面向全球提供文献题录和引文检索、检索结果分析和评价等服务。

(1)引文数据库。除WOS核心合集外,WOS平台还可以检索到BIOSIS Previews、中国科学引文数据库、Medline等11个数据库的资源。其中的WOS核心合集可以检索科学、社会科学、艺术和人文科学领域的世界一流学术性期刊、书籍和会议录,并浏览完整的引文网络。WOS提供强大丰富的检索功能及可视化分析功能,可以方便用户快速地找到有价值的科研信息,数据每周更新一次。

(2)基本科学指标(Essential Science Indicators, ESI)。ESI针对WOS的10年滚动数据,基于22个学科的文献计量分析包括:全球总影响力(总被引次数)分析,筛选出进入全球前1%的科学家、研究机构(或大学),以及进入全球前50%的国家/地区及学术期刊;对以上筛选出的机构、学者、期刊、国家/地区进行如下多指标描述与排序:文献量、篇均被引用次数、总被引用次数、高影响力论文数。ESI展示最近10年的数据,每两个月更新一次。

(3)JCR(Journal Citation Reports)。JCR是WOS的期刊评价模块。JCR对收录的期刊之间的引用和被引用数据进行统计、运算,提供了有关引文成效、引文网络,以及已发表文献的数量及类型的详细报告,针对每种期刊定义了影响因子并加以报道。在功能上,用户可以按照期刊、学科浏览,查看已保存的自定义报告,还可以设置期刊比较。

(4)InCites。InCites是在汇集和分析WOS三大引文数据的基础上建立起来的科研评价工具,综合各种计量指标和30年来各学科、各年度的国际标杆数据。通过InCites,用户能够实时跟踪机构的研究产出和影响力;将本机构的研究绩效与其他机构,以及全球和学科领域的平均水平进行对比;发掘机构内具有学术影响力和发展潜力的研究人员,监测机构的科研合作活动,寻求潜在的科研合作机会。

2. Scopus

Scopus是由爱思唯尔于2004年建设的目前全球规模最大的文献摘要和引文数据库。Scopus涵盖了由5000余家出版商出版发行的科技、医药、社会科学、艺术和人文领域的21900种期刊,另外还有丛书、会议录、专利及网页。

相对于WOS,Scopus收录的内容更加全面,学科更加广泛,特别是在获取欧洲及亚太地区的文献方面,用户可检索到更多的文献。为了确保包含最广泛的覆盖范围和最高质量的内容,Scopus收录的内容都需要经过内容遴选与审查委员会(The Content Selection & Advisory Board, CSAB)持续且定期的审核,审核形式以期刊的样本文件为基础,采取定量与定性相结合的方式。CSAB成立于2005年,由来自所有学科和不同区域的17位国际科学家、研究人员和期刊编辑组成,旨在促进开放和透明的内容覆盖政策。

Scopus的数据每日更新,有检索和分析评价两大功能。通过Scopus,用户可以检索到最早回溯至1823年以来的近5000万条文献信息,其中1996年以来的文献有引用信息。检索包括对文献、作者、归属机构、来源出版物的检索,以及高级检索;分析评价包括文献分析(检索结果集分析和单篇文献分析)、作者产出分析、机构产出分析和来源出版物评价。Scopus 有效整合了网络资源,除了检索数据库收录的期刊文献之外,还利用了搜索引擎,通过Scirus(www. scirus.com)可以从网络上获得2.5亿高质量的相关科技信息网页,可以直接从文章的参考文献链接到网站上的被引文章。Scopus每年对所有期刊的质量进行评估,对不满足指标要求的期刊给予一年时间进行改进,复核不合格的期刊可能会停止收录,这在很大程度上保证了所收录期刊的质量。期刊评价包括该期刊自Scopus收录年份至今的CiteScore、SJR、SNIP,以及5年的CiteScore得分趋势,同时Scopus还对期刊当年的CiteScore进行追踪分析,得分结果每月更新。

3. Google Scholar

Google Scholar是一个可以免费搜索学术文章的网络搜索引擎,由计算机专家Anurag Acharya开发,2004年11月发布Google Scholar的试用版,可以帮助用户了解到某个领域最重要的学术文献,帮助研究者轻松地掌握研究动态。

Google Scholar数据源自学术出版商、专业性团体、在线知识库、各大学及其他网站,检索数据包括期刊、学位论文、书籍、预印本、文摘和技术报告在内的学术文献,还包括了法院意见和专利。从2012年起,Google Scholar每年发布期刊和出版物排名,排名中使用了h5作为衡量期刊和出版物排名的指标。

Google Scholar与各大学术著作出版商、专业性团体、在线知识库、各大学及其他网站管理员进行协商,确立合作关系,合作方负责提供纯文本及没有权限设置的XML网页,方便Google进行网页的抓取,确保汇入Google搜索引擎。Google Scholar的检索方式简单易用,支持多种字段检索、特定文件类型检索等功能;检索资源全面,不仅可以免费搜索跟踪同行评议过的文献的引证文献,还能搜索跟踪会议录、学位论文、预印本和在版文献,以及其他非传统媒体形式文献的引证文献;Google Scholar提出了h5指数、h5中位数指标,利用h5指数指标对世界范围内的学术期刊或出版物进行影响力评价,h5指数作为h指数的一项延伸指标,在一定程度上体现了谷歌学术平台在科研评价指标中的创新之处。

正如上面所言,Google Scholar的数据来源涵盖了各种各样的文献类型,所以检索结果杂乱,有大量的噪声数据;在引用关系上,由于只是采用了计算机自动处理技术,而多种类型文献中存在大量不规范的引用,因此对基础引用数据的排重、链接存在大量错误,其提供的引用指标很不准确。

(七)平台技术服务商

1. Atypon

Atypon284)是一家为出版商在数字出版领域提供软件服务和技术的服务商,1996年由纽约大学博士生乔治斯•帕帕多普洛斯(Georgios Papadopoulos)创立,2016年8月以1.2亿美元被约翰•威立收购。Atypon总部位于美国加利福尼亚州圣克拉拉市,在美国、英国、希腊、捷克共和国等设有办事处。目前在全球拥有446名员工,其中75%是工程师、17%是客户服务人员、8%是行政管理人员。

1999年,Atypon首次推出Literatum,Literatum是世界上使用最广泛的学术网站开发和在线发布平台,截至目前,平台有33亿次用户访问、2700万篇论文、39万本电子书、13000种期刊、2476家协会、928家出版网站。Literatum采用模块化设计,不仅可以轻松地与出版商现有的出版平台集成,还是可扩展的,随着出版商的业务发展而调整,主要功能包括:

(1)网站设计和建造。UX3.0是Atypon创建现代化网站的简化系统,它基于成功的消费者网站所用的相同用户界面和UX设计准则,提供最佳阅读体验;它基于组件的网站设计和设计主题库,加快了网站建设时间,可以产生质量更高、bug更少的网站。

(2)内容托管和交付。Literatum平台提供托管服务,对书籍、博客、视频、数据库、培训课程等所有内容,均可以快速方便地索引、标记、更正、删除、转移、封锁和存放,并进行管理、打包、搜索、营销和销售。

(3)身份和访问管理。Literatum的内置身份和访问管理(IAM)模块为用户提供友好地注册、登录和档案管理。Literatum还支持与第三方系统的集成,支持使用标准单点登录协议(如SAML和OpenID Connect)的外部身份管理系统的单点登录(SSO)。

(4)营销和广告。Literatum根据访问者的身份和网站行为(无论他们是否是注册用户)确定内容、广告和优惠。该平台可以跟踪和存储访问者的特征--比如他们的从属关系和位置,以及他们的行为,包括他们访问的内容、他们来自的网站,以及他们响应的营销活动。这有助于实现精准营销。

(5)电子商务。Literatum的电子商务模块由该平台的许多其他功能支持,如产品折扣由平台的分析模块通知;智能群组根据身份和特征对访问者进一步细分;内容推荐引擎将"更像这样"和"相似的访问者已经购买"的建议放在购物车中,因此模块使用者可以在购买时定制优惠和呈现吸引人的内容。

(6)分析功能。Atypon Insights是Literatum的内置报告模块,它提供了丰富而详细的平台活动历史,跟踪并结合特定出版内容的使用数据和读者的网站行为,深入了解趋势和异常的根本原因,并提供可视化报表。

2. Impelsys

Impelsys285)是面向内容出版商、学习提供商和企业的领先技术解决方案和服务提供商,2001年创立于纽约,在印度班加罗尔和加洛尔设有办公室,拥有500余名员工。Impelsys提供跨数字产品生命周期的端到端解决方案,从内容和课件制作、丰富、转化、货币化到交付和移动,旨在通过科技传播知识,让世界变得更美好。

Impelsys的主要产品和服务分为以下几大类。

(1)iPublishCentral

iPublishCentral是基于云服务的阅读学习平台,通过SaaS服务模式,允许内容创作者在线提供数字内容,然后在多种平台分发、销售和交付,是Impelsys的主打品牌。

iPublishCentral主要包括:iPublishCentral Ebooks是电子书交付平台,可支持多种商业模式,并提供丰富的数据分析,有助于深入了解消费者的阅读和学习模式。iPublishCentral Scholar是一个集成所有学术产品的平台,允许客户通过自己的门户网站,将所有学术内容和在线课件直接集成并安全交付给他人。iPublishCentral Learn是一个在线学习平台,通过丰富的数据分析和实时反馈来促进教育内容的传播,从而提高学习模块的效率。

(2)解决方案

Impelsys为客户提供多种解决方案,包括出版解决方案、专业学会和社团解决方案、大学解决方案、企业解决方案。

1)出版解决方案。帮助出版商控制和简化生产流程,以降低总体成本并提高效率。

2)专业学会和社团解决方案。帮助专业学会和社团发布行业标准、最佳实践和研究论文,通过内容交付平台确保这些研究论文安全及时地到达专业受众的手中。

3)大学解决方案。核心是iPublishCentral Learn,包括教育内容的开发、品牌门户的设计和开发、移动解决方案和定制技术解决方案,旨在让教师和学生更轻松地进行教学。

4)企业解决方案。为企业提供定制数字内容和可见开发、运营效率解决方案、企业学习和开发解决方案、基于云服务的内容分发和交付基础框架等,以帮助企业提高生产力和效率。

(3)服务

1)技术服务。Impelsys凭借与出版和教育领域领先品牌合作的经验,为客户带来出版专业知识和技术创新的独特结合,提供的技术服务包括定制开发、云基础设施管理、基础设计和容量规划、数据库监控和管理、系统健康监控和升级等。

2)学习技术解决方案和服务。旨在使学习成为一种引人入胜和充实地体验,从而确保提高学习效率和学习效果,提供的服务包括在线学习解决方案、混合学习计划、移动学习、适应性推荐引擎、模拟和课件开发等。

3)移动服务。Impelsys的移动服务产品基于定制框架,将符合共享内容对象参考模型(Shareable Content Object Reference Model, SCORM)标准的学习模块打包到手持移动设备中,以便随时随地进行学习。提供的服务包括阅读器应用程序、品牌书架应用程序、交互式应用、视频应用、带有SCORM和评估支持的课件应用等。

3. HireWire

HireWire286)成立于1995年,是硅谷一家科技公司,在美国洛斯加托斯和硅谷、英国布莱顿和北爱尔兰贝尔法斯特设有办公室。HireWire是一个由技术专家、学者和出版专家组成的团队,一方面作为全球领先的电子发布平台,HighWire与学术出版商、社团、协会及大学出版社合作,发布经数字化的学术期刊、参考文献及书籍等。另一方面,作为技术服务商,为社会群体、大学出版社、研究机构及其他的独立学术出版商提供战略性的内容托管解决方案,旨在帮助出版商最大限度地传播内容。HighWire在设计、用户体验(UX)和数据可视化方面处于领先地位,其为麦格劳-希尔教育集团(McGraw-Hill Education)设计的DataVis(tm) 工具获得了2017年物理学和数学领域的最佳PROSE奖。

(1)HighWire Identity

HighWire Identity提供简单、灵活地访问控制和身份管理:

1)身份管理功能。HighWire Identity为用户提供单点登录功能,用户的身份信息形式可以是用户名、IP地址、Shibboleth、推荐人IDs。

2)自助管理。用户界面提供了即时管理客户、用户、订阅、凭证和报告所需的所有信息和工具,对发布者来说,所有客户端只有一个视图,能够即时添加和编辑信息、运行报告和发布访问凭证。

3)消息通知、电子邮件和通知。通过电子邮件、消息或通知将更改自动传达给用户或机构。

4)链接所有身份数据平台的API。通过应用编程接口提供简单的集成,确保客户关系管理和电子商务系统能够自动更新。

5)分析和报告。了解用户的行为模式,探索您的数据以获得更多发布机会。

(2)HighWire Submissions

为了充实HighWire的在线托管和开发服务,HighWire提供了HighWire Submissions产品,包括BenchPress、BenchPress Unlimited、Preprint,以满足用户对学术出版的要求。

BenchPress是一款投审稿系统,支持单点登录、界面直观,加快稿件提交过程,享受快速的数据访问,具有强大的报表和分析功能。BenchPress Unlimited是一款可以根据特定的需求定制的投审稿系统,能够灵活应对期刊发展而产生的变化和需求。BenchPress/BenchPress Unlimited和HireWire平台无缝对接,实现了与其他被托管内容及自行托管内容系统的链接。

Preprint是一个在线存档和分发服务平台,即让作者在同行评审以前免费公开分享自己的成果。Preprint与BenchPress和JCore相集成,确保作者和读者拥有熟悉、简单和功能全面的体验,同时还可以受益于与以往相同的操作生态系统和链接。不仅如此,Preprint还与第三方集成,如DOI、iThenticate、Disqus等集成。

(3)HighWire Hosting

HighWire Hosting通过一系列模块化应用程序被交付,这些应用程序简化了数字出版流程,扩大了覆盖面。HighWire的智能发布平台是一个独特的数字化解决方案,旨在满足在线用户快速变化的期望。智能发布平台使用开放架构,帮助使用者上传、管理和发布多种内容类型,包括文本、视频、图像、数据等。

(4)HighWire Analytics

HighWire Analytics通过Impact Vizor和Usage Vizor提供服务。与通用数据平台不同,Impact Vizor和Usage Vizor是专为满足期刊出版商、编辑、营销人员和销售人员的需求而设计的,旨在帮助使用者优化内容的影响力、覆盖面和读者群。

(5)HireWire Consulting

借助先进的分析、设计和用户体验(UX)专业知识和最佳实践,HireWire Consulting可以帮助使用者将出版数据和信息转化为有用的知识,从而推动出版物质量的显著提高。

4. 小结

从Atypon、Impelsys、HireWire的概况中可以看出,三家技术服务商既有相同点,又各具特色。

(1)相同点:三家技术服务商创建时间基本相同,业务上都主攻数字出版领域,专为满足期刊出版商的需求而设计,帮助他们建设平台,优化内容的影响力、覆盖面和读者群。另外,三家技术服务商的客户群有一定程度的重合,反映了其提供的核心产品与服务有重叠。

(2)不同点:主要是规模和发展方向不同。Atypon的产品与服务主要集中在数字内容的托管、电子商务解决方案,业务范围比较集中。Impelsys的产品与服务除了数字产品的托管外,还为客户提供多种解决方案,包括出版解决方案、专业学会和社团解决方案、大学解决方案、企业解决方案。HireWire的产品与服务除了在线托管和服务,还提供投审稿系统,包括BenchPress、BenchPress Unlimited、Preprint,以满足用户对学术出版的要求。

二、国际平台的建设特点

(一)国际平台的建设方向

1. 全球化:平台建设的发展方向和战略选择

国际出版机构在其国际化的出版历程中,平台建设全球协作化成为重要的发展方向和战略选择。一般来讲,国际出版机构会采用以下3种模式进行平台建设:

(1)平台建设采用自主开发和与技术服务商合作并行的方式开发。如约翰•威立公司的移动应用软件APP,部分应用由自己开发,部分应用由技术服务商开发,且与多个技术服务商合作,如gWhiz、Thicksole、QuickMobile、MedHand、YUDUMedia等,这些技术服务商专注于移动方案的解决或移动应用的设计。采用这种模式能够利用技术提供商的优势,在其支持下进行系统维护,不需要从头开始。但是系统兼容性也是这种开发模式需要重点考虑的问题。

(2)平台依托第三方技术服务商建设。如美国化学会推出基于Atypon的全新期刊全文数据库平台,新版平台基于Atypon的网络出版和网站开发平台Literatum。虽然美国化学会期刊全文数据库平台使用Literatum已经超过10年,但网站内容直到现在才完全在Atypon的基础设施上进行托管,此举将进一步提升网站性能,并实现代码、性能和安全更新的更快整合。该模式也存在缺点,平台知识产权的归属在一定程度上弱化和限制了平台运行的自主性。

(3)平台建设集成第三方工具。如Code Ocean是一个基于Docker的开放代码和数据协创平台,目前集成在多家出版机构的一体化平台中,以复现投稿作者的计算配置;Publons集成在投审稿平台中,认证审稿人在不同出版机构平台上的评审工作,为研究人员提供被学术界和出版行业认可的评审记录。平台集成第三方工具的举措从浅层次上来说能够增强其在出版流程中处理重要环节的工作能力,但更重要的原因是基于出版机构之间的竞争,集成第三方工具成为各个出版机构提高服务质量、增强竞争力的重要手段。

2. 社交化:平台与社交媒体的融合与利用

随着Web 3.0的日渐成熟及Web 4.0的到来,社交媒体和社交网络发展迅速,与科研工作者的融合度日渐提高,国际出版机构已经认识到社交化媒体在加快科学发现中的普遍性和有效性,因此,正通过多种渠道面向用户提供相应的服务。

(1)建设面向读者、出版者和作者的专业化的学术交流社区。如美国化学会将社交引入平台中,建设了ACS Network,并将其定位为专业化的科研社交网络,用户可以创建话题,邀请全球的科研工作者参与话题讨论;用户可以发表博客,其他用户可以浏览并对博客内容进行评论,还能够将博客内容分享到社交媒体上;关注其他用户;添加书签及与其他用户分享内容等。这样快速高效的同行学术交流在很大程度上促进了科学的发展。

(2)建设独立的科研社交网络平台。借助互联网,通过提供学术科研的辅助工具和服务,展示自己的研究成果,促进学术交流,共享科研信息,提高科研效率,增强沟通,更好地促进学术成果的影响和传播,如ResearchGate、Mendeley、Academia.edu平台在科研圈的普及。

(3)平台嵌入社交媒体。普通大众使用社交媒体的趋势愈演愈烈,很多人相信随着时间的推移,社交媒体将成为学术交流的一部分。学术期刊出版平台借助社交媒体,如Twitter、Facebook、Google+、LinkedIn等的嵌入,加强与用户之间的交流和互动,推动其作为社交化这一角色的发展。

3. 移动化:PC平台的补充和业务扩展

随着智能手机和平板电脑的广泛使用,国际出版机构已经默认提供移动端访问作为PC端访问的补充和额外服务。一方面,使用移动设备获取信息已经成为科研工作者的共同需求,据统计,2014年底,STM出版商约10%平台流量来自移动设备。到2018年底,这个数据已经上升到25%~35%,而且还在持续增加;另一方面,移动应用软件APP的设计与开发直接影响着发布平台的业务扩展能力。国际出版机构深刻地认识到移动端是改善用户和出版者关系、增强平台用户黏性、影响用户忠诚度的关键所在。它们依托自身的优势资源,开发了支持市场上主流的移动设备(如手机、平板电脑等)和主流的移动端操作系统(如iOS、Android、Windows Phone等)的应用程序,形式不一、内容丰富。

国际出版机构提供的移动应用软件APP大多适配性高、应用多样化、多媒体资源丰富、信息获取便利,又具有良好的用户体验。调研发现,约翰•威立在移动应用软件APP上是非常积极的出版机构。约翰•威立开发的APP比较丰富,在APP Store上有507个APP应用,这些APP涉及的范围广泛,包括期刊类、电子书类、工具书类、新闻类、商务类等。其中期刊类APP汇集了约翰•威立旗下各个专业领域比较权威的期刊,为用户提供该领域最新的研究文章;APP设计形式多样,内容丰富多彩,并且十分注重用户体验287),如以视频摘要的形式,将传统的内容用生动的形式展现出来,增强对读者的吸引力。

4. 服务化:知识服务的转型探索

随着互联网技术的发展,机构用户和专业科研人员对出版产品的需求发生了明显变化。国际出版机构积极应对市场变化,不再固守单一的内容出版服务,而是通过提高内容附加值,为用户提供更多的选择和全面的、个性化的信息与知识服务。在这一跨越中,多数国际出版机构已经完成了数字出版生态链的构建,实现了向知识服务商的转型。

如爱思唯尔,目前已将自己定位为一家科技医学信息和分析服务提供商,旨在为全球范围内的期刊提供一个有效的一站式知识平台,向全世界的科研人员提供知识获取和发现,通过精选数据内容资源并进行结构化、知识化深加工,打造多种产品形式和服务形态。具体措施包括:用户输入字段或论文摘要进行机器学习,从中提取出包含语义背景的关键词,并以此为基础帮助用户找到相关度较高的话题和资料。此外,区别于Google Scholar 的关键词搜索,使用人工智能技术的学术搜索引擎 Semantic Scholar,并通过评估论文内容的相关度来实现搜索结果的快速排序。

又如美国化学会将"提供信息解决方案"作为重要的战略目标,解决科学共同体面对的全球挑战等问题。ChemPlanner是2017年CAS(Chemical Abstracts Service)联手约翰•威立提供的最准确、最全面的化学信息与技术相结合,从而加速预测合成反应路线的发展。CAS已经完成SciFinder(r)与ChemPlanner的集成,2019年,ChemPlanner将在反向合成方面有所突破。

2013年4月,BMJ出版集团宣布正式将其名字中的"出版"二字去掉,更名为BMJ集团。BMJ集团相信"随着公司业务持续拓展,品牌名称的变化会帮助他们更好地反映提供服务的所有内容,同时体现在市场和数据平台上的国际化特性",这对英国本土以外的用户尤其重要。英国医学杂志集团是在英国医学会旗下的《英国医学杂志》基础上,不断发展壮大起来的医疗服务提供商,目前其产品致力于为医疗机构和个人提供研究、学习和临床决策工具,包括医学期刊、教育培训和评估、循证决策支持、质量改进服务、初级医疗工作流程解决方案以及职业招聘活动,而并非单纯依赖于内容组织的输出288)

(二)国际平台的建设方式

1. 体验性:以用户为中心,重视用户体验

2012年,Outsell公司发布了关于STM出版平台发展的综述报告,指出STM出版平台开始追赶互联网平台中常见的用户界面/用户体验的发展,虽然这方面一直相对地被忽视289)。随着Web 4.0的初现端倪,人与万物互联的网络社会趋势正在进一步向纵向加深,了解用户、研究用户、为用户提供有价值的信息服务已是大势所趋,成为平台建设的必然选择。

(1)交互功能设计,主导用户体验

随着技术的发展,科研工作者的交流方式也发生了显著变化。因此,STM出版平台仅仅提供文献下载已经无法满足科研工作者的需要。近年来,STM出版平台将交互功能引入平台的建设中,平台运用易用的交互逻辑和丰富多样的表达方式,汇集文本、音频、视频、图片、动画等多媒体表现形式。除此之外,平台为用户提供了文献作者的采访视频,由作者介绍自己的研究成果,以直观的形式将各个知识单元及其之间的关系呈现在用户和读者面前。

同时,近年来Push Pop Press、Habitat、Celluloid、Vook等电子出版物制作工具的大量涌现,也为STM出版平台的交互型功能设计提供了应用技术和革新条件。另一方面,充分认知用户的潜在价值,调动用户参与平台建设的积极性,包括允许用户自由添加注释和链接、搭建用户信息反馈渠道等。如施普林格旗下的自然科学和工程技术领域物质数值型数据库(Springer Materials)提供化学结构检索模块,用户可借助平台结构式画图软件ICEDIT自主式进行精确结构检索、子结构检索、化学反应检索及其路线设计290)

(2)精准信息传播,优化用户体验

Web 1.0时代,互联网早期的资讯门户是第一个成功的产品,它其实就是由编辑人工整理出来的一堆链接堆叠在网页上。在资讯匮乏的时代,这已经可以满足绝大部分用户的心智需求。在Web 2.0时代的早期,出现了诸如RSS订阅、Google Reader等产品,由于每个人订阅的信息不一样,最终呈现的出版内容也全然不同,用户在这里体会了个性化的推荐服务。亚马逊网站出现的购物推荐,开启了机器精准智能推荐的时代。由此衍生出了现在新闻、音乐、书籍、社交等各种类型的智能推荐引擎。

面对目前海量的信息资源,单纯依靠RSS订阅、Feed等服务已经不能满足用户的需求,因此,以大数据和人工智能为核心技术的新一代互联网使得高度智能化的精准信息传播将成为平台建设的重要原则,STM出版平台通过对注册用户的浏览记录、阅读习惯、功能使用等数据进行最大化地挖掘、分析,了解用户的阅读特点、研究领域和关注范围,快速和精准地制订触达不同用户的方案,对目标用户推送其所需信息。建立在用户体验基础之上的精准有效传播将最终迎来个体定制信息时代的到来,届时,"千人一面"的传统学术期刊将被"千人千面"的个体定制版学术期刊所取代。

2. 高效性:借助信息技术,实现资源的高效传播和发现

互联网时代,随着数字资源的海量增加,用户亟须在海量数字资源中快速、准确地发现目标信息。为适应和满足用户的需求,学术期刊出版平台需要借助高效能的检索技术、算法、搜索引擎、参考链接等,增强资源被发现的可能,优化资源检索的响应速度、结果匹配度,提高资源内容的显示度。

(1)搜索引擎。众所周知,大量的搜索行为不是从出版机构的平台开始的,据OutSell公司2012年统计,超过60%的网页链接来源于搜索引擎291)。因此,国际出版机构重视与搜索引擎公司的合作,如SpringerLink自2006年与Google合作,研究Google的搜索排序算法,提升了搜索结果排名,超过50%的SpringerLink平台的访问量来自Google搜索。

(2)索引和链接。众多平台为作者、文章制作索引和参考文献链接,用户能够从索引和参考文献链接直达引用文献的全文及多个数据库,从而大大提高科技文献的检索效率及可发现性。

(3)语义技术。如HighWire平台通过加载语义丰富化工具,在用户对文章内容进行主题特定分类的基础上,提供充足的索引和参考。这样做的目的是向用户传递更多贯穿文本的相关结果,从而延长其在网站上停留的时间。

(4)插件工具。如SpringerCitations是一款文献引用研究工具,输入期刊或文章名称可查到文献被引用的次数和引用文献的信息,这个得益于参考链接服务CrossRef。通过SpringerCitations可以查找高被引的文章和资料,了解学科热点和前沿;TrendMD是一款学术内容发现工具,基于大数据的智能搜索和一系列可视化工具,帮助用户在平台中容易、准确地找到他们需要的内容,进一步提升了学术资源的可发现性。

3. 全过程:渗透科研全过程,打造闭环学术生态链

STM出版商协会2018年发布的The STM Report: An overview of scientific and scholarly publishing报告292)Science执行主编莫妮卡•玛丽•布拉德福德(Monica Marie Bradford)在2019年世界科技期刊论坛的报告"高标准打造顶级学术交流平台"共同提及,面向期刊出版全过程的协创平台是平台建设的趋势。

协创平台渗透到科研过程的每个阶段,从基金申请/获取、科研团队构建、协同研讨、协同编码、协同撰写、论文提交、评审和修改、生产和出版、分析和评价、传播和交流、锁定新问题、基金申请/获取构成一个研究周期,打造一个新的学术生态链。

(1)协创平台支持科研工作者随时随地交流、充分共享知识、自由碰撞思想、协同编码/协同撰写、贡献记录、版本更新记录等场景,将基金审批部门、科研工作者、学术机构、期刊等整合在一个平台上,每一方都可以根据自己的兴趣和关注点了解相关的动态。

(2)通过该协创平台,可以进行团队的学习、研讨、创作(代码和撰文),真正发挥团队的作用。通过沟通与创新,达成共识、提升能力、记录贡献,可为各类机构解决在决策及其执行过程中克服各级团队的领导力和执行力不强的困惑,达到管理治本的效果。

(3)实现研究成果新的认可方式,比期刊发表的时间更早地追踪个人的学术成果,为科学家服务。另外,平台将准确、完整地链接所有合作者每次提交的意见与资料,如实记录和反映每个人的工作量及其研究思路和方法。

(4)平台将记录的过程、思想、结果等进行碎片化处理和结构化标引,以全媒体的形式存入成果库,长期保存和管理,分类分学科归档、登记。

(5)平台支持多人实时协同共同撰写文档,支持单人独立创作。同时支持多人实时编写代码,并支持代码的运行及在线修改。

4. 先进性:深度利用人工智能、区块链等技术

STM出版商协会2018年发布的The STM Report: An overview of scientific and scholarly publishing报告中提到:语义富集是平台建设的核心,人工智能、区块链是平台建设的焦点293)。人工智能、区块链等技术为科技期刊出版带来了新的可能性和前进方向,因此,未来平台建设的重点是考虑对以上前沿技术的深度利用。

在过去几年中,出现了许多基于区块链技术的开放学术出版平台,例如,scienceroot、Pluto. network及orvium、Ledger期刊平台等。这类平台旨在通过建立与当前寡头市场分离的分散、竞争的市场来改变当前的科技出版现状:利用区块链这种分布式的、自我调节的数据技术,以一种革命性的新方式对学术交流和科技出版进行管理和组织,将出版物版权和使用许可权交还到作者和学术机构手中,从根本上降低出版成本。

其中,Orvium是出版行业内第一个基于区块链的出版平台,Ledger是第一本将区块链与学术出版相结合的期刊典范。Orvium由创始人团队与欧洲核子研究中心(CERN)、甲骨文(Oracle)、亚马逊(Amazon)和坎塔布里亚大学(University of Cantabria)等机构合作创建。该平台依托以太坊区块链和智能合约、分散式存储解决方案、大数据分析和云计算等技术,本质上是科学出版物的一种发布和分散存储系统,为用户提交的学术著作和数据提供一个共享、权威的科学事件数据库。它能够记录出版物完整的生命周期,包括研究起源、修订过程、同行评审人及内容,以及研究数据和方法等细节294)

Ledger期刊鼓励通讯作者将比特币地址[或PGP(Pretty Good Privacy)公钥]与其身份相关联,要求作者在每篇提交中都必须包含一份声明,描述任何可能的利益冲突(如相关的商业利益)。此声明成为通讯作者签名的文件哈希值(hash function)的一部分。文章通过同行评审录用后,Ledger期刊提供数字签名和时间戳工具SimpleSign。通过加盖时间戳和基于密码学的数字签名为任意一个时间点提供身份证明和版权证明,这个证明完全公开透明,进而能够确保所有文章都能追踪到作者和版权所有人的信息,为文章版权保护、传播效果统计、内容资产管理等提供了全新的视角和解决方案。

传统出版商认识到区块链对出版的重要意义,也开始参与到这一进程中。如2018年3月,科技公司数字科学(Digital Science)与荷兰新创区块链技术公司卡塔莱斯(Katalysis)合作启动支持同行评审过程的区块链项目,并吸引了施普林格•自然、泰勒•弗朗西斯、剑桥大学出版社和ORCID等出版机构或组织积极参与。该项目试图利用区块链技术的分布式注册表和智能合约元素建立同行评审联盟。其中,Katalysis主要负责平台建设和技术维护;施普林格•自然参与期刊选择,并为同行评审工作流程提供关键支持;ORCID则贡献关于个人标识符和身份验证的方法。

三、科技期刊平台标准建设与应用

(一)国外期刊出版中的标准发展与应用

1. 期刊内容获取与展示

(1)PDF

PDF由Adobe在20世纪90年代开发,是用于呈现包含格式化文本和图像的文档,独立于应用软件、硬件和操作系统。PDF基于PostScript语言,每个PDF文件都封装了固定布局平面文档的完整描述,包含文本、字体、矢量图形、光栅图像以及显示所需的其他信息。

Adobe于1993年免费提供PDF规范。在早期,PDF主要用于桌面出版,并与各种格式竞争,如DjVu、Envoy、Common Ground Digital Paper、Farallon Replica,甚至Adobe自己的PostScript格式。

PDF开始是由Adobe控制的专有格式,2008年7月1日作为开放标准发布,并由国际标准化组织发布为ISO 32000-1: 2008。此后规范的控制权移交给由志愿参与的行业专家组成的ISO委员会。2008年,Adobe发布了ISO 32000-1的公共专利许可,允许免费使用Adobe拥有的所有制作、使用、销售和分发PDF兼容软件所必需的专利。

PDF 1.7成为ISO 32000-1的PDF规范的第六版,包括仅由Adobe定义的一些专有技术【例如Adobe XML Forms Architecture(XFA)和Acrobat的JavaScript扩展】,ISO 32000-1将它们作为完整实现ISO 32000-1的强制要求。这些专有技术尚未标准化,其规范仅在Adobe网站上发布。其中许多技术尚未被其他广受欢迎的第三方PDF所支持。2017年7月28日,ISO 32000-2:2017(PDF 2.0)发布。ISO 32000-2不包括任何专有技术。

(2)HTML&XML

随着数字出版逐步向网络化数字出版转变,文献内容的描述格式由原来的版式文件格式逐渐向内容与展示分离的XML描述格式转变。爱思唯尔和Science在2010年左右就已开始将期刊文献的内容加工转化为XML格式,这为后来的内容深度处理、HTML展示,以及基于EPUB的移动出版奠定了基础。

OASIS(Advancing Open Standards for the Information Society)已经制定了基于XML的文档内容描述标准,主要包括OASIS的DITA和DOCBOOK,但尚未见到直接针对期刊文献内容XML描述的国际标准。目前主要由各出版商制定自已的标准。

科技期刊数字出版在早期基本都以PDF格式向用户提供全文浏览。但目前,国际上几大出版商都已提供HTML形式的全文浏览。

(3)OpenURL

OpenURL是一种用于编码统一资源定位符(URL)中的资源描述的标准化格式,旨在帮助互联网用户查找允许他们访问的资源副本。OpenURL可以与互联网上的任何类型的资源一起使用,图书馆通常使用它来帮助用户链接其收藏中或通过订阅获得的文章、书籍或专利等内容。NISO制定了OpenURL及其数据容器(ContextObject)的标准,即ANSI / NISO Z39.88-2004295)

OpenURL标准旨在实现从信息资源(如抽象和索引数据库)(源)到图书馆服务(靶)的链接(如学术期刊),链接由"链接解析器"或"链接服务器"进行处理,解析链接中的元素,并通过OpenURL知识库提供到图书馆中可用目标的链接。

生成OpenURL的源通常是存储并索引图书馆中常见信息资源的数据库中保存的书目引用或书目记录。这类数据库包括Ovid、Web of Science、SciFinder、Modern Languages Association Bibliography和Google Scholar等。

OpenURL的靶(与"源"对应)是满足用户信息需求的资源或服务。常见的靶包括全文存储库、在线日志、在线图书馆目录和其他Web资源和服务。

OpenURL于20世纪90年代末由根特大学的图书管理员Herbert Van de Sompel创建。艾利贝斯(Ex Libris Group)收购了他开发的链接服务器软件SFX,并大力推广OpenURL。2005年,OpenURL的修订版(版本1.0)成为ANSI/NISO标准Z39.88-2004,Herbert Van de Sompel的版本被指定为版本0.1。新标准提供了一个框架,用于描述新格式,以及定义各种格式的XML版本。联机计算机图书馆中心(Online Computer Library Center, OCLC)于2006年6月22日被任命为标准的维护机构。

(4)KBART296)

知识库及其相关工具的推荐实施规范(Knowledge Bases and Related Tools Recommended Practice, KBART)作为提高知识库数据效率和有效性的数字资源规范,为信息供应链中的各方提供了关于元数据格式和元数据规范等的直接指导,以确保内容提供商与知识库开发者之间准确的元数据交换,通过改善链接解析器和知识库的数据供应,解决影响开放链接的问题。

KBART是为解决开放链接的有效性问题而产生的。OpenURL297)作为一种数字资源系统整合与互操作的技术标准, 可以使服务提供方(如图书馆)通过链接解析器在相关服务网页上动态生成链接,帮助图书馆用户链接到该图书馆的数字资源内容。随着OpenURL的广泛应用,其链接的有效性问题引起了业界的关注。2006年初, 英国连续出版物集团 (United Kingdom Serials Group, UKSG) 出版了《链接解析器和连续出版物的供应链》(Link resolvers and the serials supply chain) 研究报告。该报告确认和描述影响OpenURL有效性的一系列问题,并建议成立一个工作组,目的在于确定和向整个业界推广"最佳实践"的解决方案,以改进与知识库间的元数据交换。2007年12月,KBART工作组正式成立,由UKSG与NISO共同主持。

KBART第一期工作重点是提供高质量的期刊元数据。2010年1月,第一期推荐实施规范(NISO RP-7-2010)发布,主要是对期刊元数据提供最基本的建议,知识库提供商及其客户(主要是高校图书馆)均受益于内容提供商所提供的高质量的数据。

2010年2月,NISO启动KBART第二期工作,重点是推动有效和高效的元数据传输与交换。2014年4月,KBART第二期推荐实践规范(NISO RP-9-2014)修正草案发布。重点修订内容包括:与联盟、开放获取出版物、电子图书和会议论文集等相关的元数据规范,以及数据交换和传输的方法、交换频率、数据格式、数据发布等。

2. 标识符

期刊出版中最早也是最重要的标识符是ISSN标准。随着数字出版的发展,读者和出版商都迫切需要对单篇论文、单个作者、单个研究机构等进行标识,以解决论文引用和获取、研究统计分析中的问题。DOI是对数字对象的标识,在科技期刊出版中主要解决期刊论文的唯一标识,可以方便论文的获取,减少论文引用中的错误,降低参考文献处理和分析的难度并提高引用分析的准确度。ORCID是对研究成果有贡献的个人和机构的标识,不仅可以有效聚合作者、研究机构的研究成果,还有助于突破传统的只对期刊进行评价的局限,实现对作者、研究机构等的精准评价。

(1)数字对象标识符(DOI298)

DOI全称为"数字对象标识符"(Digital Object Identifier),意为"一个对象的数字标识符",而非"一个数字对象的标识符"。DOI系统1998年由国际数字对象标识符基金会创建,源于出版业内三个行业协会(国际出版商协会,国际科学、技术和医学出版商协会,美国出版商协会)的联合倡议。DOI最早用于文字出版,但由于DOI符合数字融合和多媒体应用的发展趋势,因此很快成为管理数字网络内容识别的通用框架,并于1997年在法兰克福书展上发布。同年,国际DOI(r)基金会(IDF)创建,旨在开发和管理DOI系统。IDF成立伊始便与美国国家研究推进机构(CNRI)建立了技术合作伙伴关系,使用CNRI开发的Handle system作为DOI系统的数字网络组成部分。2000年,DOI语法通过了NISO标准认证。2010年,DOI系统通过了ISO标准认证。

DOI系统的设计面向互联网工作环境。DOI号永久性地分配给一个对象,为该对象的当前信息提供可解析的持久性网络链接,这些当前信息包括该对象在互联网上的位置和资料等。尽管一个对象的信息可以不断改变,但其DOI号保持不变。一个DOI号可在DOI系统中解析为一种或多种与该DOI号所标识的对象相关的值,如URL、电子邮箱地址、其他标识符和描述性元数据。

DOI系统可以实现自动化服务和事务处理。DOI系统的应用包括但不仅限于:管理信息与文献地址与权限、管理元数据、便于电子化事务处理、实现任何格式任何数据的持久性唯一标识,以及商业与非商业事务处理。

基于结构化的可扩展数据模型(此类模型可使对象与要求的任意精度和粒度的元数据相关联),与DOI号相关联对象的内容使用DOI元数据进行明确地描述。该数据模型支持DOI应用之间的互操作性。

DOI系统的范围不根据所指对象的内容种类(如格式等)进行定义,而是参照其功能实现和使用环境进行定义。在DOI应用网络环境中,DOI提供了唯一标识、持久性、解析、元数据和语义互通。

(2)开放研究者与贡献者身份识别码(ORCID299)

ORCID(Open Researcher and Contributor Identifier),起源于汤森路透集团和自然出版集团2009年在剑桥召开的第一次名称标识符高峰会议,以解决名称歧义的问题。在汤森路透和自然出版集团的推动支持下,ORCID作为非营利组织于2012年提供科研人员的开放注册,同时与更多的信息系统、科研相关机构、基金组织、出版社合作,例如CrossRef,以期发展为研究者识别的开放国际规范。

截至2019年6月24日,ORCID全球注册人数668万,会员机构1040家。截至2019年6月,已有77家出版商300)签署了公开信,要求其组织至少提供相应的文章作者,并在出版工作流程中实施ORCID的最佳实践301)

施普林格•自然302)作为ORCID的发起人之一,已经在图书、会议记录和期刊工作流程中实现了ORCID,因此作者和编辑可以从ORCID的所有优势中获益。提交和验证的ORCID出现在文章PDF文件、网站和底层元数据XML中,让具有ORCID的作者能够授权CrossRef在每次使用ORCID发布时自动将有关其已发布工作的信息推送到他们的ORCID记录中。

3. 期刊数据交换:元数据、内容

JATS303),正式名称为ANSI/NISO Z39.96-2015 JATS:Journal Article Tag Suite,是期刊文章的国际标准XML标签集。JATS是一个XML词汇表(类似于其他基于文档的XML词汇表,如DocBook或TEI),旨在为当前期刊文章建模。JATS是XML元素和属性的命名集合,可用于标记单个期刊文章的结构和语义。因此,JATS不会对期刊、书籍、语言语料库、专利、立法、标准或其他文档类型的问题进行建模。最初,JATS用于STEM(科学、技术、工程和医学)文章,但现在人文科学、社会学、经济学和软科学的期刊也使用JATS XML标记。

JATS有三个独立的模型,面向不同的受众:

(1)存档和交换模型(松散,用于库和存档将XML存入其存储库)。

(2)期刊文章发布模型(更严格,用于出版物制作,通常由出版商、托管平台和门户网站使用)。

(3)文章创作模型(为文章作者设计)。

JATS最初构建用于交换期刊文章,提供出版商和档案馆之间文章内容和文章元数据的互操作性。在早期,预计出版商、托管商、门户网站和档案馆将在内部使用他们自己的XML标签集,并在他们想要时转换为JATS XML:

(1)互相交换信息。

(2)将信息放入组合存储库。

(3)在同一主机平台上销售/展示商品。

(4)分享共同使用的工具和资源的开发。

JATS自2003年2月问世以来,许多出版商发现JATS对文章和预印本的制作和质量保证测试很有用。虽然JATS仍然被广泛用于构建大型期刊存储库和组织到组织的交换,但是出版商已开始使用JATS制作新内容。大型出版商仍然使用自己的标签集,但中小型出版商正在使用JATS制作新期刊,并将存储文件从PDF或专有标签集转换为JATS。诸如图书馆和学术门户之类的公共档案可以方便地以单一格式从诸多来源接收文章数据。私人和商业档案可能需要JATS用于分析,或者将他们收到的任何格式转换为JATS,并用于他们的网站、存储库或应用程序。许多网络托管和服务供应商要求或支持使用JATS。这一期刊内容的数据格式已获得了广泛地支持。

全球超过25个国家,包括美国、英国、澳大利亚、比利时、巴西、保加利亚等在使用JATS。北美和欧洲的大多数中小型出版商使用JATS,许多亚洲国家和南美国家也使用JATS出版部分期刊。大型出版商虽然在内部仍然使用自己的期刊模型,但都可以使用JATS用于交换和存储。许多公共和私人档案,如PubMed Central(美国和欧洲)、英国国家图书馆、澳大利亚国家图书馆、美国国会图书馆、Portico/ITHAKA/JSTOR等接受(或要求)JATS。

全球的转换供应商已经开发了流程,并在转换成JATS方面获得了丰富的经验。使用共享的标记集意味着转换供应商无须为每个发布者学习或自定义日记标记集。已经有很多工具可用来从其他格式(包括Microsoft Word和LaTeX在内的多种格式)的文件转换成JATS,并制作高质量的PDF、HTML(包括XHTML和HTML5)、多种可访问格式,以及不使用JATS的电子书。

4. 期刊使用统计

(1)COUNTER

COUNTER(Counting Online Usage of Networked Electronic Resources)304)和SUSHI(The Standardized Usage Statistics Harvesting Initiative)是目前国际上影响力最大、使用最广泛的电子资源使用统计标准。

COUNTER Online Metrics是由图书馆、出版商和数据库商组成的非营利标准化组织,负责通过成员间协作制定并维护COUNTER实施规范。这一规范可帮助出版商和数据库商向图书馆提供一致、可靠和可比较的使用数据。COUNTER Online Metrics于2017年7月发布了COUNTER 5实施规范。

COUNTER提供了一组用于记录、报告、提交对期刊、电子图书、数据库的基本使用统计信息的实施规范。COUNTER标准为图书馆提供了可对比、标准化、量化的电子资源使用统计数据,包括对不同层次(文献层次、期刊层次、数据库层次)、不同操作的统计,能帮助图书馆员更好地了解用户的需求和电子资源的使用效能。统计报告以XML格式存储,便于分析。通过与SUSHI标准结合,COUNTER报告可通过WEB服务进行自动收割。

(2)SUSHI

SUSHI305)由美国国家信息标准协会 (National Information Standards Organization, NISO) 发起,于2007年11月被美国国家标准协会 (American National Standards Institute, ANSI) 正式批准为ANSI/NISOZ39. 93 2007。SUSHI解决了成员馆手动收集使用统计数据的难题,通过SUSHI客户端及数据库商的SUSHI服务器,可以实现统计数据的自动收割。

(二)国际出版商在平台与服务中的标准遵从性

1. 爱思唯尔

在推动信息审核、验证、存档和传播方式举措方面,爱思唯尔是领军企业306)。它的许多合作关系有助于促进交流,实现科研与医疗保健领域的个人和集体进步。

(1)访问

1)ESPReSSO。单点登录的既定推荐实践(ESPReSSO)使用户能够使用其机构凭证登录多个平台和产品。

2)Shibboleth/ SAML。Shibboleth是对SAML(安全断言标记语言)的一种实现,支持安全验证,用户能够利用机构凭证登录,支持OpenAthens和基于SAML的单点登录。

(2)可访问性

1)WAI。支持国际可访问性标准,这可确保各种残疾人也可使用爱思唯尔的网站。

2)Section 508标准。Section 508确保由美国联邦政府或联邦资助机构购买或使用的IT产品可以为残疾人所用。

(3)链接与集成

1)MARC记录。提供可供计算机交换、使用和解读书目信息的机制,其数据元构成当今大多数图书馆目录的基础。

2)CrossRef。作为一个由出版商发起的举措,CrossRef是一项免费参考文献链接服务,可以在出版商之间无缝集成当前及存档内容。爱思唯尔是创始合伙人。

3)NISO。OpenURL标准满足对链接系统间双向互动不断增长的需求。

4)OAI-PMH。OAI-PMH全称为开放档案计划--元数据获取协议,用以将存储库更新内容传达给外界。

5)SCHOLIX。学术出版物与科研数据之间的一种简单而普遍的链接机制。

(4)馆藏与使用

1)COUNTER。COUNTER(统计网络电子资源在线使用情况)是可促进单一、可接受、可扩展的操作守则,以衡量在线信息产品和服务的使用情况。爱思唯尔是COUNTER的创始成员。

2)KBART。知识库和相关工具(KBART)是针对出版商推荐的合适的实践,它使出版商可以采用一致、准确且简单的方式格式化和分发书刊列表及内容报告,以更新图书馆知识库。

3)SUSHI。标准化使用统计获取协议(SUSHI)是一种强制性协议,用于在出版商及其客户之间以XML格式自动交换COUNTER使用报告。

(5)适用于社群的标准

STIX(科学与技术信息交流)字体是一整套科学、技术和医疗出版领域中使用的数学及其他特殊符号的免版税字体。

(6)保存信息

爱思唯尔与耶鲁大学图书馆和荷兰国立图书馆(Koninklijke Bibliotheek)携手合作,采用开放档案信息系统(OAIS)标准来保存图书,并针对爱思唯尔期刊建立了一个正式且永久可访问的数字档案。

2. 泰勒•弗朗西斯

泰勒•弗朗西斯的数字资源管理经历了三代,每一代对标准有不同的支持力度:

(1)第一代,2005-2011年。这一阶段以关系型数据库和独立系统为主,支持的标准主要有NISO的相关标准,如KBART、PIE-J、IOTA,但系统在互操作性上尚有不足。

(2)第二代,2011-2017年。这一阶段主要采用云服务,强调集成,支持的标准包括ONIX-PL、ONIX RRO、NISO ODI、COUNTER、SUSHI、CORE等。

(3)第三代,2018年以后。这一阶段主要聚焦于电子资源的动态交换,支持在出版生态中的各方(包括出版商、提供商、图书馆发现系统、ERP系统、链接解析、代理)之间的数据流动,与组织工作流的深度集成,努力实现使用数据和成本数据的集成,支持更多标准,如图3-1所示。

3. 小结

国际出版机构在期刊出版领域已经制定了一些国际标准,如ISO制定的期刊编排标准、ISSN标准,NISO制定的JATS标准,OASIS制定的EPUB标准等,但更多地是一些约定或指南。这些约定和指南不以正式标准的形式发布,但在事实上起到了标准的指导作用。

<xref rid="FIG3-1" xml:base="fig">图3-1</xref>

从上述标准、约定和指南的实现和支持现状来看,国外期刊出版并没有盲目遵守这些标准、约定和指南,而是根据不同学科的实践和传统以及学科特点,有选择地灵活采用。

同时,由于数字出版的兴起和发展,国际期刊出版平台大量使用信息技术领域的一些标准,以充分利用信息技术的成果,降低出版成本,实现数据互通。

总体上,国际科技期刊出版在标准化及标准应用方面呈现以下特点:

(1)注重内容质量,提升出版品质。

(2)统一内容编排,降低出版成本。

(3)注重提升获取和阅读方便性,提升用户使用体验。

(4)加强数据交换能力,扩大传播途径和范围。

第三章执笔:吴晨,范真真,李苑,熊海涛,任伟

Schaffner A C. The future of scientific journals: lessons from the past[J]. Information Technology and Libraries, 1994, 13(4): 239-247.

刘天星, 孔红梅, 段靖. 科技期刊传播技术、期刊功能和商业模式的历史演变及相互关系[J]. 中国科技期刊研究, 2014, 25(10): 1215-1223.

周汝忠. 科技期刊发展的四个历史时期[J]. 编辑学报, 1992, 4(2): 75-81.

杨文志. 我国科技社团期刊发展机遇与策略[J]. 中国科技期刊研究, 2009, 20(3): 377-383.

诸平, 于澄洁. 第一份化学期刊衰落的教训[J]. 编辑学报, 2003, 15(1): 14-16.

Schaffner A C. The future of scientific journals: lessons from the past[J]. Information Technology and Libraries, 1994, 13(4): 239-247.

Guédon J-C. In Oldenburg's long shadow: Librarians, research scientists, publishers, and the control of scientific publishing[M]. Washington: Association of Research Libraries, 2001. [2019-7-15]. https://www.arl.org/wp-content/uploads/ 2001/12/in-oldenburgs-long-shadow.pdf.

赵丹群. 关于电子期刊的几点思考[J]. 图书情报工作, 1998(5): 33-35.

Mabe M. 科技与学术期刊出版综述--庆祝期刊出版350周年[R]. 2015: 67.

彭希珺, 张晓林. 国际学术期刊的数字化发展趋势[J]. 中国科技期刊研究, 2013, 24(6): 1033-1038.

彭希珺, 张晓林. 国际学术期刊的数字化发展趋势[J]. 中国科技期刊研究, 2013, 24(6): 1033-1038.

李麟, 初景利. 开放获取出版模式研究[J]. 图书馆论坛, 2005, 25(6): 88-93.

https://www.plos.org/.

S计划的足迹:对于学术出版行业格局的意义[J]. 科学观察, 2019, 14: 58-71. doi: 10.15978/j.cnki.1673-5668. 201904007.

Else H. Radical open-access plan could spell end to journal subscriptions[EB/OL]. (2018-09-04). [2019-07-12]. https://www.nature.com/articles/d41586-018-06178-7.

Rieger O Y. (2019-01-29). [2019-07-12]. https://confluence.cornell.edu/display/arxivpub/arXiv+Update+-+ January+2019.

戚义姣, 马建华. 美国医学会和中华医学会期刊APP出版的特点分析及启示[J]. 中国科技期刊研究, 2016, 27(7): 744-750.

https://unsilo.ai/technology [2019-07-12].

https://clarivate.com/blog/news/clarivate-analytics-and-unsilo-partner-to-power-scholarone-with-ai.

徐丽芳, 王钰. 科技内容产业的鼎新革故: 2018海外科技期刊出版动态研究[J]. 科技与出版, 2019(2): 13-22.

盛怡瑾. 可视化在科技期刊出版中的应用[J]. 中国编辑, 2018(11): 72-77.

Shotton D, Portwin K, Graham K, et al. Adventures in semantic publishing: Exemplar semantic enhancements of a research article[J]. PLoS Computational Biology, 2009, 5(4): 1-17.

Shotton D. Semantic publishing: the coming revolution in scientific journal publishing[J]. Learned Publishing, 2009, 20(22): 85-94.

徐丽芳, 丛挺. 数据密集、语义、可视化与互动出版: 全球科技出版发展趋势研究[J]. 出版科学, 2012, 20(4): 73-80.

吴锋. "大数据时代"科技期刊的出版革命及面临挑战[J]. 出版发行研究, 2013(8): 66-70.

中国电子技术标准化研究院. 人工智能标准化白皮书(2018版)[EB/OL]. http://www.cesi.ac.cn/201801/ 3545.html [2018-01-24].

https://clarivate.com.cn/products/scholarone/.

https://www.ariessys.com/about/.

周玲, 钱立波, 王玥, 等. 《中国肺癌杂志》应用Open Journal Systems创建开放存取期刊的实践[J]. 中国肿瘤, 2010, 19(11): 766-770.

https://www.researchgate.net.

https://www.mendeley.com.

https://codeocean.com.

https://publons.com/.

https://figshare.com.

https://www.atypon.com.

https://www.impelsys.com.

https://www.highwirepress.com.

王诗雨. 国内外数据库出版商移动APP应用分析[J]. 新闻传播, 2015(23): 59-61.

刘伟竹, 沈锡宾, 刘冰, 等. 英国医学杂志集团的全方位服务模式及启示[J]. 中国科技期刊研究, 2014, 25(8): 1012-1015.

Ware M, Mabe M. The STM report: An overview of scientific and scholarly journal publishing[R]. 2015.

苏静, 袁小群, 王星. 国外面向用户的科技出版平台构建要素与展望[J]. 科技管理研究, 2015, 35(17): 161-164.

Ware M, Mabe M. The STM report: An overview of scientific and scholarly journal publishing[R]. 2015.

Johnson R, Watkinson A, Mabe M. The STM report: An overview of scientific and scholarly publishing[R]. 2018.

Johnson R, Watkinson A, Mabe M. The STM report: An overview of scientific and scholarly publishing[R]. 2018.

Johnson R, Watkinson A, Mabe M. The STM report: An overview of scientific and scholarly publishing[R]. 2018.

https://www.niso.org/publications/z3988-2004-r2010.

https://www.niso.org/standards-committees/kbart.

https://www.niso.org/publications/z3988-2004-r2010.

http://www.doi.org/doi_handbook/translations/chinese/doi_handbook/1_Introduction.html.

https://orcid.org.

https://orcid.org/organizations/publishers/open-letter.

https://orcid.org/content/case-studies-publishers-using-orcid#01-journal.

https://www.springernature.com/gp/researchers/orcid.

https://www.niso.org/publications/z3996-2019-jats.

https://www.projectcounter.org.

https://www.niso.org/standards-committees/sushi.

https://www.elsevier.com/zh-cn/about/our-business/industry-standards.