(图片摘自www.sciencealert.com)
2016年9月7日 讯 /生物谷BIOON/ –最近一项研究指出:EXCEL软件的缺陷导致了20%的与基因相关的科学文章中出现了错别字的问题。
研究者们发现这些错误的出现主要是由于EXCEL自带的”矫正”功能。它会把作者们写好的基因名称强制改为时间或数字,一旦矫正之后则很难修复,因为该软件没有永久性关闭这一功能的设置。此外,很多科学家们在发表之前甚至都忘记要手动修改这些因”矫正”而发生的错误。
“我们在使用表格处理软件EXCEL时,它会将基因的名字转变为日期或浮点类型的数字”,来自澳大利亚的科学家们指出。
“通过系统地对顶级基因组杂志中的文章进行筛查,我们发现其中有五分之一的文章都有上述错误”。研究者们对发表在19份杂志中的3597篇文章中35175个经EXCEL软件处理的表格进行了检查,发现其中704篇文章存在基因的拼写或格式错误。
那么这些错误是怎么产生的呢?假设你正在与某人短信联系,而手机自带的功能强制性地矫正你想要发的一些特殊的词汇。大部分情况下你可能会手动修正这些特殊的词语,但有时候也许就懒得麻烦直接发过去了。
同理,对于科学家来说,在处理大量的数据的同时还要克服EXCEL因自动矫正功能带来的问题实属不易。
“举例来讲,SEPT2基因(Septin2)与MARCH1(Membrane Associated Ring Finger (C3HC4)1, E3 Ubiquitin Protein ligase)通常会被改成’2-Sep’或’1-Mar'”。
唯一能够完全避免这一问题的方式就是记住在打字的时候修改每个一个表格中的文本格式。
作者们希望这一调查能够引起业界的重视,有时候一个小小的拼写错误就会断送一篇文章的前程。
相关结果发表在《Genome Biology》杂志上。(基因宝jiyinbao.com)
本文系生物谷原创编译整理,欢迎转发,转载需授权!点击 获取授权 。更多资讯请下载 生物谷APP.
PMC:
PMID:
Gene name errors are widespread in the scientific literature
Mark Ziemann, Yotam Eren and Assam El-Osta
The spreadsheet software Microsoft Excel, when used with default settings, is known to convert gene names to dates and floating-point numbers. A programmatic scan of leading genomics journals reveals that approximately one-fifth of papers with supplementary Excel gene lists contain erroneous gene name conversions.