Note
再現性は科学の基礎をなし、同時に科学の信頼性を高めるために不可欠な要素です。データ分析者は、分析結果の信頼性を担保するために、分析手法や使用したデータを公開し、再現可能な環境を提供することが望まれます。しかし、計算機を活用した研究では、使用する端末やオペレーティングシステムの違いに起因する再現性の問題が発生し得ます。さらに、ソフトウェアやツールの更新により、同一のコードであっても結果が変わる場合があります。第三者による分析結果の再現を試みる前に、自身が同じ結果を得ることができない状況も少なくありません。 本書では、これらの課題に対する解決策として、コンピュータ上で利用可能なツールや手法を、Rを用いたデータ分析環境を例に紹介します。データ分析をプロジェクト単位で管理する方法、データやコードのバージョン管理、ドキュメンテーションの作成方法、分析プロセスのパイプライン化について詳しく述べます。このアプローチにより、研究者が再現可能な研究を実現するための手段を一歩前進させることを目指します。
CC BY-NC-ND 4.0 (Creative Commons 表示-非営利-改変禁止 4.0 国際) ライセンスの下で提供されています。