CERNが大型ハドロン衝突型加速器から得た300TB分のデータを一般公開 | TechCrunch Japan

今週末の予定はなしにしてこれに取り組もう!CERNは本日、300TB分の衝突型加速器のデータを世界に開放した。きみも見てみたいだろう?

Compact Muon Solenoid (あのCMSだ!)を扱う物理学者のKati Lassila-Periniは、今回の大規模なデータ公開について直球で簡潔な説明を行った。

「私たちはくまなくデータを分析しました。このデータを公開しないでいる理由はありません」とデータに伴うニュースリリースで彼女は伝えた。「公開するメリットは多くあります。高校生に興味を持ってもらったり、未来の素粒子物理学を育てるトレーニングに使ったりすることができます。CMSのデータ保持コーディネーターとして個人的にもそういったことはリサーチデータが長期的に利用可能であるために重要なことだと考えています」。

この考えが広まっていないことは驚くべきことだ。少なくとも科学者の間では広く認識されていることなのかもしれない。パブリッシャーや部門長であれば収支を考えなくてならないだろう。

データ自体は2011年のものだ。その多くはほとんど理解することができないが、私たちが愛して止まないプロトンが7 TeV(テラ電子ボルトの意味だ)で衝突し、希少で素晴らしい粒子が滝のように放たれる様子を表すデータだ。CMS検知器で集めた総データの半分ほどで、2.5 inverse femtobarns(fb−1)分だという。

cmsgiffy

検知器からの生データ(なので結果が検証可能)とより簡単に分析ができる「抽出」データセットの用意がある。そして、心配しなくてもCERNはそのためのツールも用意している。包括的なCERNのLinux環境も準備され、仮想マシーン、スクリプト、アプリ(いくつかはGitHubにもある)を走らさることができる。

深淵な世界の真理に迫る研究者たちと同じコンピューター環境でデータを試すことができるのは、高校の物理の授業の何コマかを費やす楽しい方法になるかもしれない。それにCERNは高校生向けに特別にキュレートした「マスタークラス」版データセットとツールもある。

今回の新たなデータ公開は、これまでで最大のものだ。より詳細のデータの種類の説明やアクセス方法についてはこちらを見てほしい。

[原文へ]

(翻訳:Nozomi Okuma /Website/ twitter