ysaz (ImanazaS) blog

最近はデータ分析や機械学習が中心。たまに音楽や書評。

機械学習

カテゴリカル変数のEncoding手法について

Structured Data(構造化データ)の下処理をおこなう際に避けて通れないのがFeature Engineering(特徴量エンジニアリング)。 特に悩ましいのがカテゴリ変数の扱いで、どのように扱えば良いか困ることが多く、また、使った手法もすぐに忘れてしまいがちなの…

機械学習や人工知能、AI関連分野を取り巻く情勢

機械学習や人工知能、AI関連の記事で気になったものをピックアップし、Google Keepにメモする習慣をつけている。 メモに残す記事の数はだいたい一日2、3件。 (日本語英語問わずチェックしているが、ひと目見た時の情報量の多さから、日本語記事をメモに残し…

ブログを綴るということ

去年取り組んでいたDeep LearningのMOOC (Massive Online Open Course) 、Fast.ai。fast.ai · Making neural nets uncool againここではDeep Learningの概念や実装上の具体的な手法を学ぶとともに、学習を続けていく上でのマインドセットも鍛えられた。(ち…

再現率と適合率

検索システムや検査などの識別問題でよく使われる「再現率」と「適合率」。 教科書に書かれている説明でなんとなく理解はしているものの、ふと思い出そうとしたときにどっちがどっちだったか曖昧になることが多い。 そこで、理解を深めることを目的に、わか…