1: ノチラ ★ 2017/12/23(土) 20:36:54.90 _USER

img_ac2aed187b02d600ba5549240896eed91348640

中略

「ITと統計学の素晴らしき結婚」で生み出されたもの

では、高校までの数学教育はどのようにすればよいのでしょうか?

私の個人的な考え方は「統計学と機械学習の専門的な勉強がはじめられることをゴールとして、高校までの数学のカリキュラムは再編成されるべきである」というものです。

統計学に加えてここで突然機械学習の話が登場したことに驚いた方もいらっしゃるかもしれません。「統計学と機械学習」あるいは「統計学と人工知能」と言われると、多くの人がなんだか全く別のもののように感じるはずです。しかし、実はその背景にある数学的な道具立ては「全く一緒」と言っても過言ではありません。

初代『統計学が最強の学問である』では、この20年ほどで統計学がとんでもなくパワフルになった理由として「ITと統計学の素晴らしき結婚」という表現をしました。多くの人が大学の教養課程で習う「紙とペンの統計学」が、コンピューターサイエンスという強力な伴侶を得たことにより、現実的な問題の意思決定に際して大きな力を持つようになったわけです。しかし、この結婚によって生まれたのは「現代的な統計学」だけではありません。もう1つ「現代的な人工知能」というとてもパワフルな兄弟をも産み落としました。

1950年代にはじめて「人工知能」という言葉が使われるようになってからの第一次人工知能ブーム、そして1980年代の第二次ブームのそれぞれで、人工知能研究の主流は「コンピューターに人間の持つ論理や知識を教え込むことで知能を生み出せるのではないか?」という考え方でした。当時のこうした考え方に基づき書かれた人工知能研究の論文や書籍を見てみると、そのほとんどは記号論理学のような話ばかりが記述されており、統計学とは全く別の分野であると言えます。ただし、こうした「人間がコンピューターに論理と知識を教え込む」というやり方は行き詰まりを見せ、これら二度の人工知能ブームは廃ってどちらも冬の時代を迎えました。

一方で少なくとも1960年代の終わり頃からちらほらと、一部の人工知能の研究者たちは「確率」や「データへのあてはまり」といった統計学の概念を取り入れはじめます。たとえばディープラーニングは専門的には「層の数がとても多い(ディープな)ニューラルネットワーク」であると表現されますが、実は世界に先がけて多層ニューラルネットワークによる画像認識を研究した日本の甘利俊一は、ニューラルネットワークに統計学のような確率や微分といった考え方を持ち込みました。こうした「データとデータの間の最もあてはまりのよい数学的な関係性を推定する」という統計学的な考え方は、現代のディープラーニングの中でも大きく役に立っています。

話をまとめると、「ITと統計学の素晴らしき結婚」によって次の2つがこの世に生み出されたということです。

1つは統計学において、紙とペンの手計算だけでは難しい分析がコンピューターによる計算アルゴリズムで実現できるようになりました。これが「現代的なITによる統計学」です。一方で、コンピューターサイエンスの世界で生まれた人工知能研究においても、記号論理学のような理屈や知識表現だけではうまくいかなかったことが、統計学の理論と計算方法によって実現できるようになりました。このようなクロスオーバーが、現代のデータ社会の中でとても大きな力を発揮しているのです。そしてそれゆえに、統計解析手法と機械学習手法を数学的に記述するやり方は、細かい慣例などの違いこそあれ「基本的に全く同じ」というわけです。違いがあるとすれば数学的な理屈の後の、「どういうアルゴリズムでコンピューターを働かせるか」という部分ぐらいでしょうか。

そうすると、いまエンジニアたちが統計学と機械学習の背後にある数学に慣れておくことは、前述のような品質の向上や、生産計画の最適化に使うという以上の意味を持ちます。蒸気やガソリンを使ったエンジンを使いこなすために熱力学を理解するとか、電子部品を使いこなすために電磁気学を理解する、といったのと同じようなレベルで、これからのものづくりにおいてその競争力の少なからぬ割合が、機械学習技術をどう活かすか、というところと関係してくるからです。


http://diamond.jp/articles/-/153736
引用元: http://egg.5ch.net/test/read.cgi/bizplus/1514029014/


32: 名刺は切らしておりまして 2017/12/23(土) 22:12:42.00

線形代数 → 確率統計学 → 機械学習
の理論的展開が分かっていない人のための>>1だと分からないか?

33: 名刺は切らしておりまして 2017/12/23(土) 22:14:35.60

>>32
まあ、確率を使わないというのも俺を認知症にしようって罠だしね

49: 名刺は切らしておりまして 2017/12/23(土) 22:37:50.80

>>32
その分野をまとめて同じというなら、線形代数とその応用分野は同じということになるから、ORも代数解析も、数理計画法も確率論も全部同じ数学という話になる。

2: 名刺は切らしておりまして 2017/12/23(土) 20:38:40.92

どれもこれも、俺が使ってる名古屋大学設計の伊藤製作所の椅子を真似した嘘です

4: 名刺は切らしておりまして 2017/12/23(土) 21:04:51.48

まったくいっしょじゃないよ
数学は公理体系がちがえばまったくちがうものになる
そんなのもしらんのか

70: 名刺は切らしておりまして 2017/12/24(日) 01:21:51.11

>>4
何も分かってないやつが利いた風な口を利くと、本当に痛いなw

5: 名刺は切らしておりまして 2017/12/23(土) 21:06:54.22

それが、トヨタ自動車の名古屋がからんだ途端に舌の枚数を増やした

7: 名刺は切らしておりまして 2017/12/23(土) 21:34:51.00

やれやれ、両方とも線形代数の上に作られた学問なんだが、
統計学には2つあって、
1) 1万人のデータがあればそれを絶対視して、1万1人目のデータを○×で判断する
 検定主義
2) 1万人のデータがあれば、1万1人目のデータはその一つでしかないと考えるベイズ
 統計学
がある。1)なら1万100人目でも、すーっと同じ判断をするから学習しない。2)なら
1万100人目は学習して違う判断をするはず。そこまで言えば機械学習がどちらの理屈で
動いているか分かるだろ。

8: 名刺は切らしておりまして 2017/12/23(土) 21:36:54.08

iMacのCPUのHaswellの洒落でも、アメリカ人はこれを幽霊船と言ってますが

10: 名刺は切らしておりまして 2017/12/23(土) 21:44:38.48

1万人のデータから得られた平均μ、標準偏差σがあったとして、
30人の実験をしてみて得られたデータXがあるとする。
検定主義なら平均μ、標準偏差σを絶対として、実験が正しいか
誤りかを判断するしかない。
ベイズ統計学ならこの実験結果を基に平均と標準偏差がどう分布
しているか、をμ(X), σ(X)を考える。Xが増えるごとにこの推定値が
変化していく=学習なわけだね。

11: 名刺は切らしておりまして 2017/12/23(土) 21:50:12.16

構文解析とか機械学習とか言うけど、古いパーシングミサイルの再開発でしょ
危ないわ

12: 名刺は切らしておりまして 2017/12/23(土) 21:51:47.06

多変量解析やし

13: 名刺は切らしておりまして 2017/12/23(土) 21:54:33.91

もっと具体的に行こう。

表裏同一の確率で出る本物のコインと表60%裏40%のニセのコインがそれぞれ

入っている2つの袋A, Bがあるとする。2つの袋にどちらが入っているかはまったく分からない。

ニセである確率は1/2ずつである。

Aの袋から1枚コインを取り出しトスしてみたら表が出た。表が出たことでAがニセコインの

袋である確率は上がったか上がらないか、そういうことだ。

17: 名刺は切らしておりまして 2017/12/23(土) 22:05:18.88

>>13
悪いけど、今の統計学では確率の話はしないんだ。

19: 名刺は切らしておりまして 2017/12/23(土) 22:07:15.21

>>17
フジテレビの柳沢慎吾にやった詐偽を再現するかどうか言ってるだけ

14: 名刺は切らしておりまして 2017/12/23(土) 21:57:13.80

結局ただの多変量解析だし。
ソフトがあれば十分。
weka使え。

15: 名刺は切らしておりまして 2017/12/23(土) 22:01:33.88

Weでいま大問題なんですが、嘘ぶいたのがまずかった

16: 名刺は切らしておりまして 2017/12/23(土) 22:04:18.40

あとは文系も含めて行列を必修にするとか。

21: 名刺は切らしておりまして 2017/12/23(土) 22:07:45.37

>>16

まあ、最近は機械学習でまOLE使うようになったけど、まだ勾配降下法の方が多いだろう。

機械学習って基本は問題解決の話であって、統計分析の話じゃないから。

20: 名刺は切らしておりまして 2017/12/23(土) 22:07:27.60

きのこの山とたけのこの里がそれぞれ入っている袋がある。

外側から見ても、それぞれの確率は1/2である。

画像をカメラで取り込める機械学習できるコンピュータが

あったとして、100回どちらか判断させたら60%正解

40%不正解であった。101回目の結果をコンピュータに

教えたら、その正解の確率が上がる=ベイズ統計学的な

学習であるわけだね。

24: 名刺は切らしておりまして 2017/12/23(土) 22:08:51.71

>>20
そういう学習をしているニューラルネットはないわけではないが、主流ではない。

29: 名刺は切らしておりまして 2017/12/23(土) 22:10:08.24

>>24
原理の説明だ。じゃあどうやっているか説明してもらおう。

47: 名刺は切らしておりまして 2017/12/23(土) 22:35:58.05

>>29

ググレカス。

検索エンジンの要約だってもう少しまともだ。

23: 名刺は切らしておりまして 2017/12/23(土) 22:08:37.44

純粋数学は別として応用数学では統計学が重要だよな。
とくに最近のビッグデータ処理技術と結びつくと無敵だわ。
世の中、正確な答えよりも、最適な答えの方が価値があるか