Python データ可視化ライブラリ altair で高解像度 png 画像を保存するには

Python データ分析

Python のデータ可視化ライブラリは複数あり、matplotlib や seaborn を使う場合が多いのではないかと思います。特に seaborn は出版品質の図が手軽に作れるため便利で、実際に機械学習系の論文ではこのライブラリで用意したであろうグラフをよく見かけます…

2020-06-21

『モンテカルロ統計計算』章末問題を Julia で解く：第3章「積分法」

julialang データ分析ベイズ確率・統計機械学習 MCMC

『モンテカルロ統計計算』（講談社、鎌谷研吾著、駒木文保編）の章末問題を Julia で解くシリーズ第2回で、今回は第3章「積分法」です。解析計算するだけの問題は割愛。

2020-06-19

『モンテカルロ統計計算』章末問題を Julia で解く：第2章「乱数」

julialang データ分析ベイズ確率・統計機械学習 MCMC

Julia 言語と MCMC の勉強のため、R 向けに書かれている教科書『モンテカルロ統計計算』（講談社、鎌谷研吾著、駒木文保編）の章末問題を解いていこうかと思います。また、単に問題解くだけでは面白くなかったりもするので、適宜 Python との比較などを追…

2020-06-07

Optuna で混合ガウス分布の混合比を推定（パラメータ間に依存関係・制約条件がある場合の例）

Python データ分析機械学習 Optuna

機械学習モデルのハイパーパラメータを最適化するのに Optuna を使っている人も多いと思います。最適化目標（深層学習のロスや RMSE など）を決め、探索空間を適当に設定するだけでいい感じにパラメータを求めてくれるので便利ですね。ところで、Optuna にお…

2020-05-19

GitHub stars に見る Julia 言語の人気ライブラリトップ30

julialang データ分析機械学習確率・統計

私は普段 Python を使った機械学習アルゴリズムの開発とか統計分析に関わっていますが、最近どうも Julia 言語 julialang が気になっています。よくある scikit-learn や pandas もしくは PyTorch などに不満を感じることはあまりないのですが、みんな Julia…

2019-04-19

pandas.Series を使うときには index に注意しよう

Python データ分析 pandas

Python でデータ分析をする際、pandas.DataFrame を基本的な道具として使うことは多いと思います。また、DataFrame の各カラムは pandas.Series で自然に表現されており、新しいカラムを Series として書いた上で、DataFrame に追加することもあるでしょう（…

2017-05-11

Pandas メジャーアップデート（0.20.1）の要点〜高速 I/O、集約関数強化など

Python データ分析

こんにちは。吉田弁二郎です。先日（5月5日）、pandas の最新版 0.20.1 がリリースされました。agg/transformメソッドがgroupbyしなくても使えるようになり、10倍以上高速な I/O を実現する feather-format が（試験的に）導入され、スライスの際に頻繁に利…