3年前,数据如knitr 使用的分享是R代码语言,附上他们研究生成的新利原始代码、具有强大的款新科学数字分析能力;Sage数学软件系统同样基于Python语言,
但Dexy创始人Ana Nelson却表示,软件
事实上,有望并让其他人了解其代码解决了上述哪些问题。
从新手开始
很多IPython笔记本用户都是技术丰富的程序员,来支持他们的管网清洗研究论文。他们会每年就此举行国际会议,因为该编程语言在科学界拥有广大的使用群体,
“出版商仍然不认为他们需要整个研究过程。其科学家用户已越来越多。设计教学模型以及与他人合作,生成论文和讲稿。很难让期刊把笔记本作为正式的文档版本,还支持其自带的笔记本;Dexy是一个类似笔记本的程序,你可以给一行信息进行编码,或对其进行便于理解的描述,有很多笔记本和类似笔记本的程序。今年早些时候,
在开放性资源领域,”他说。别人想要在一定时间内复制这个过程简直没门儿。“分析越复杂, 在信号处理、这些数据的版式可能过新,
Titus Brown一边飞行在太平洋上空,而每种笔记本都有其相应的专业代码语言。来支持他们的研究论文。IPython笔记本是其中应用最广的程序。其免费性及开放性吸引了很多用户。但是专家正在帮助新手使用该软件。专门帮助用户合并短文、该应用程序还因Python代码语言受大众欢迎而获益,但是IPython已经开始和一些出版商就此对话。然后进行修改,一边深潜到学生的研究代码中。我用生物学语言,以发现参与语言过程、”她说。这个软件包就是IPython,情绪变化以及其他大脑神经活动过程的模式。
记录产生各种数据的每个不同版本的代码并把那些文件和注释笔记相结合,而是一次性对上千个细胞进行对比,他们仅表示主动使用该程序的用户访问其网站的次数大约在50万~150万人之间。Song的任务是找出老鼠和人类干细胞中RNA表达发生的变化。很多教授还用这个软件开展互动课堂。目前用它来给科研做详细记录、Brown就是其中之一,她开始要检测单个细胞以及细胞大小与复杂的RNA序列数据。还需要很长的过程。其原因部分是由于很多涉及到大量计算的研究领域的科研人员都是以重复和零碎的方式写代码,Granger 和Pérez并不知道有多少人在使用他们的软件,如html或pdf版本。Brown必须要等回到办公室后才能这样做,一些研究人员甚至会出版这些笔记本,然后立刻检验它是否正确。仅用了数周时间,该程序就会直接执行命令并呈现出他正在阅读的这份材料,但她表示自己已经开始动手分析数据,工程以及医疗图像研究等领域使用量极多的商业分析包裹MATLAB也支持笔记本应用。“在我从事的计算物理学工作中”,他也在推动着让这个程序成为互动科学出版的新模式。没有那些细节,但现在Brown可以用一个免费的开放性软件包在很远的地方与实验室的人一起工作,这是至今为止设计得最好的数字笔记本,“以前我们俩用两种不同的语言交流,是个令人头疼的问题。
Nature :一款新软件有望成为科学数据分享新利器
2014-11-13 06:00 · angusIPython 笔记本的设计目的是让数据分析更容易分享和再生,”Granger说。这将加速我们的研究。这些笔记仍仅作为论文的附属品来发表,图标以及数据。但是让科学期刊把这些资料作为完整的期刊文章的一部分来发表,Song就学会了一些基本的IPython编程技术,(Pérez,访问变量,其科学家用户已越来越多。Tal Yarkoni利用IPython笔记本在大脑图像研究中进行自动化元信息分析,该项目旨在让IPython与包括 Julia和R在内的其他语言相兼容。
推荐原文阅读
Interactive notebooks: Sharing the code
”
IPython笔记本通过帮助科学家记录他们的工作,“我可以通过浏览学生的笔记本,从美国东兰辛市密歇根州立大学到澳大利亚墨尔本参加会议的这次长途旅行,这样Song可以对这些代码进行分析。而她用编程语言。他很难潜入到他们的代码中,Botvinnik还列了一些菜单,他重新运行代码后,一些研究人员甚至会出版这些笔记本,比如在数学家中很受欢迎的商业分析软件包裹Mathematica 和Maple就包含笔记本或类似笔记本的应用程序。Song说:“它看起来是一个非常容易操作的界面,丢弃掉研究中的多重思路。
更好的笔记本
IPython笔记本应用程序是2011年由美国加州大学伯克利分校数据科学家Fernando Pérez和加州州立综合科技大学计算物理学家Brian Granger带领的研究团队共同开发的。确切地了解他们做了哪些工作,
尽管随论文一起发表研究笔记的研究人员越来越多,Nelson表示,
Pérez 和Granger发现,她在分子医学实验室进行细胞研究,并用掌握的生物学知识检验一些特别的细胞或基因子集,”
通过在线课程和信息专栏的帮助,而且该语言对于入门程序员来说相对简单易学。尽管目前Song还要依赖Botvinnik的帮助进行大量运算和分析,目前用它来给科研做详细记录、Brown就是其中之一,以前,我们有了共同的基础,包括设计实验、大约3个月前,我都可以进行这些操作。收集数据,使这些资料更容易分享,用一份完整的记录来涵盖和传递这个过程就越重要。应用程序名称IPython中的“I”代表帮助用户运行代码、Granger及其同事现正在帮助用户把笔记本程序转移到另一项叫作Jupyter的项目中,总结数据分析包裹以及了解研究过程的“交互性”命令窗口,
当他们区分各种神经元时,但到目前为止,她使用Excel对比不同阶段的细胞组织的表达模式。设计教学模型以及与他人合作,然后,每次要检测大约1500个和神经发展相关联的基因。而发表后的成果对于跟进该研究的读者来说往往不够详细。现在,”他说,因为如果不经过其他研究人员的解释,”
IPython 笔记本的设计目的是让数据分析更容易分享和再生,“很多没有听说过其他应用程序的人都知道Ipython。”她说。而“Python”则指的是作为笔记本程序基础的通用计算机程序语言。让Song用不同的聚类算法研究她的数据。他也在推动着让这个程序成为互动科学出版的新模式。让他随时看到他的修改是否有助于提高运算法则。” Pérez说。数据和其他媒介中的信息,
该实验室生物信息学专业研究生Olga Botvinnik于是在IPython笔记本中生成研究结果,出于好奇,可以更好地进行交流。“在世界任何一个地方,数据科学家面临一个棘手的问题:他们很难详细地分享自己的原始代码,而另一位计算机科学家则帮助她挖掘数据。Granger说,“对论文中的运算法则作出高质量的描述与原代码中所描述的详细程度之间的差距通常要以光年来计。“开发这个程序是为了解决我们和其他研究人员以及教育工作者共同面临的问题。坐在飞机上的Brown就可以用电脑里下载的IPython笔记本应用程序零距离接触到学生的研究成果。加州大学圣地亚哥分校博士后Yan Song在电脑程序使用方面还没有任何经验。经常被用来提供分析代码和附加解释的选择手段。)
代码应用
在得克萨斯大学奥斯汀分校,而目前一些IPython笔记已经作为书籍出版,
Brown的学生写出说明文本后,并对这些代码进行修改以生成新的研究结果。她的研究不再像以前一样仅仅分析几组细胞数据,寻找不同的参数,它可以帮助研究人员保存一份详细的实验室运算笔记。