数据阶段型存储库(Data Staging Repository,DataStaR) 是康奈尔大学图书馆的一项主要针对本校学者的数据监护服务,其以机构库为基础,力图扮演学术界共享数据集时的一个暂时的、过渡性质的存储节点,其设想是建设成为一个数据监护平台及一套完整服务方案,拥有可产生多种格式的高质量元数据的工具,由图书馆员负责操作,通过协助学者完善数据和元数据来促进共享,最终积极帮助他们向各自领域的学科库发布数据成果,供长期使用和保存。DataStaR 不但是具体数据监护服务的典型案例,还体现出当前美国高校图书馆对机构库建设的一些新思路,非常值得了解。
“暗数据”推动数据监护出炉
目前,大量高校学者所承担的“小科学”(Small Science),因分布散、规模小而长期是数据管理的盲区,这些项目通常只有数名学者参与,产生的数据存放在个人电脑里,既没有统一标准,也没有分享机制,更缺乏长期利用策略。
海登(Heidorn) 对2007 年美国国家科学基金会批准项目的调查显示,当年共拨款28.7 亿美元资助12025 个项目,其中获拨款排名前20% 的项目占据六成经费,剩余四成经费资助了多达9621 个项目,最小一项只获得591 美元。这些小项目根本不可能有充裕的人力财力来处理产生的数据,海登称其为“暗数据”。小科学是人们认识和了解特定局部事物的重要手段,长期忽视小科学的数据是非常不合理的,随着计算机技术、互联网技术、数字化存储技术的发展,海量科学数据的数字化和网络化成为可能。美国越来越多的基金机构要求资助的项目发布数据,如国立健康研究院就从2003 年起规定年度预算达到50 万美元的项目在申请时必须制定数据发布方案。
2007 年后,美国多家高校图书馆陆续开始了数据监护服务的探索:除DataStaR外,新墨西哥大学图书馆主持的地球数据观测网(Data Observation Network for Earth,DataONE) 项目关注地球影像数据,约翰·霍普金斯大学图书馆主持的数据保育(Data Conservancy) 项目关注天文数据,这两个项目各获得国家科学基金会高达2000 万美元的资助。还有调查数据监护需求的伊利诺伊大学数据监护基础信息(Data Curation Profiles) 项目;设计数据监护课程的北卡罗来纳大学数据化监护课程(Digital Curation Curriculum,DigCCurr) 项目;探索“数据馆员”职业规划的普渡大学图书馆的分布式数护监护中心(Distributed Data Curation Center,D2C2) 项目等。
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。