ysaz (ImanazaS) blog

最近はデータ分析や機械学習が中心。たまに音楽や書評。

機械学習

機械学習モデルによる予測結果の解釈(Shap値の使い方)

なぜ予測結果の解釈が必要か 機械学習というか広義のAIは、予測や認識を高い精度で実施することは得意です。 しかし、その演算過程がブラックボックスになりがちで、人間がその結果の背景にある根拠や判断理由を理解することが困難という課題が存在します。…

機械学習に関する、読んだ/読みかけの論文集

Deep Learningに関する無料のオンライン学習コンテンツ、fast.aiを受講して以来、理解ができるかどうかはさておき、重要な論文にも目を通すよう心がけています。 出典:DeepLearning-Lec8-Notes学生時代の専攻が化学系だった自分にとって、馴染みの薄いアル…

機械学習モデルのBlendingに対する重みの最適化手法について

アンサンブル学習 Blendingに対する重みの最適化事例 様々な最適化手法 まとめ Kaggleなどの機械学習コンペにおいて、複数のモデルを平均等により組み合わせることで、新たな推論結果を作る手法(blendingと呼ばれる)があります。 平均を取る際にモデルの重…

Dive Into Deep Learning

UCバークレーの講義から派生したプロジェクトとして、「Dive Into Deep Learning(通称 D2L)」の執筆が進められているようです。d2l.aiちらっと覗いてみましたが、数式だけでなく、コードや図を使ってわかりやすいものに仕上げていくという姿勢が感じられま…

Jupyter NotebookからJupyterLabへの移行

Jupyter Notebookにはその前身のIpython Notebook時代からお世話になっています。 そのJupyter Notebookの後継と言われるJupyterLabを今更ながらインストールし、少し試してみました。 JupyterLabとはなんぞや では、なぜ今なのか 使ってみた感想 IDEとして…

Pythonで実行した処理の終了を通知してくれるツール

大規模データの処理やら機械学習やらで、演算に時間がかかるときがあります。 放ったらかしにしつつも、都度パソコンの前まで行って進捗を確認するのが面倒で、なんとかできないかと思っていたところ、以下の記事を見つけました。 時間のかかるデータ処理や…

カテゴリカル変数のEncoding手法について

Structured Data(構造化データ)の下処理をおこなう際に避けて通れないのがFeature Engineering(特徴量エンジニアリング)。 特に悩ましいのがカテゴリ変数の扱いで、どのように扱えば良いか困ることが多く、また、使った手法もすぐに忘れてしまいがちなの…

機械学習や人工知能、AI関連分野を取り巻く情勢

機械学習や人工知能、AI関連の記事で気になったものをピックアップし、Google Keepにメモする習慣をつけている。 メモに残す記事の数はだいたい一日2、3件。 (日本語英語問わずチェックしているが、ひと目見た時の情報量の多さから、日本語記事をメモに残し…

ブログを綴るということ

去年取り組んでいたDeep LearningのMOOC (Massive Online Open Course) 、Fast.ai。fast.ai · Making neural nets uncool againここではDeep Learningの概念や実装上の具体的な手法を学ぶとともに、学習を続けていく上でのマインドセットも鍛えられた。(ち…

再現率と適合率

検索システムや検査などの識別問題でよく使われる「再現率」と「適合率」。 教科書に書かれている説明でなんとなく理解はしているものの、ふと思い出そうとしたときにどっちがどっちだったか曖昧になることが多い。 そこで、理解を深めることを目的に、わか…