秩序と情報とブロッコリー

2021年2月2日火曜日

ベイズ学習の枠組み②

前回の投稿では、ベイズ学習は以下の２ステップで行っていくことを述べた。確率モデルの構築：グラフィカルモデルなどを利用しながら、事象の同時確率を定式化する。推論：上で定式化した同時確率分布と、その未知のパラメータに対する周辺確率から事後確率を求める実際にこのステップに従...

2021年2月1日月曜日

ベイズ学習の枠組み①

ベイズ学習は、観測できない未知の変数\(W\)の確率分布\(P(W)\)を、観測された事象（データ）\(D\)が得られたという条件のもとで推論するものです。すなわち事後分布\(P(W|D)\)を求める作業になります。例えば、赤玉と白玉が入っている箱がありそれぞれの色の個数の割合...

2021年1月17日日曜日

Artificial Life(ALife)とはなにか？

最近、ちょくちょくと人工生命（Artificial Life: ALife）というワードを聞くようになった。単語から読み取れるところなんとなくイメージできるけど、具体的にどういう研究なのか？どういう応用が期待できるか？人工知能（AI）と何が違うのか？などのイメージが沸かない。 ...

2020年11月15日日曜日

分散や標準偏差のオンライン計算 → Welfordアルゴリズム

データが逐次追加されていく際に、追加されるたびにその時点での「分散」や「標準偏差」を計算したい場合がある。その時点での全てのデータから毎度計算しても良いが、やはり計算量が馬鹿らしい。そこで欲しくなるのが、これらの量をオンライン（ストリーム処理）で計算できるアルゴリズムだ。安心し...

2020年11月14日土曜日

Gradient Boosting（勾配ブースティング）とは

最近、Kaggleだとかその周辺では、XGboostだとかcatboostだとか、Gradient Boosting（勾配ブースティング）の手法が流行っているらしい。最終的にcatboostを勉強する目的で、その前段階として勾配ブースティングをひととおり勉強したので、そのメモ。 ...

2020年9月26日土曜日

データは寡黙である。

これまで十数年間、いくつかの企業でデータ分析に携わってきた。その間にビッグデータや人工知能、ディープラーニングというようなバズワードが流行り「データ至上主義」ともいえる風潮が流れ始めているふうに感じる。確かに画像などの判別技術や購買予測、レコメンデーション技術など、大量データ...

2020年7月23日木曜日

RandomForestはホントに交互作用を拾うか？

木構造系のモデルは、分岐の組み合わせにより説明変数間の交互作用もモデルに自動的に組み込まれそうな「気がする」。しかし実際に実際に動かしてそのことを確認した記事がネット上になかったので自分自身で確認することに。まずはトイデータを用意。ここでX[:, 2]とX[:, 3]が交互作用...

ウェブバージョンを表示

自己紹介

amitani

詳細プロフィールを表示

Powered by Blogger.