ysaz (ImanazaS) blog

最近はデータ分析や機械学習が中心。たまに音楽や書評。

2018-01-01から1年間の記事一覧

Pythonで実行した処理の終了を通知してくれるツール

大規模データの処理やら機械学習やらで、演算に時間がかかるときがあります。 放ったらかしにしつつも、都度パソコンの前まで行って進捗を確認するのが面倒で、なんとかできないかと思っていたところ、以下の記事を見つけました。 時間のかかるデータ処理や…

(続)Pandasでのデータ集計

以前に以下の記事でPythonのPandasライブラリを使った集計方法をまとめていた。 nami3373.hatenablog.com今になって、これよりもシンプルなやり方に気づいたのでメモ。 import pandas as pd # データフレームを適当に作成 df = pd.DataFrame(data=[('2016-04…

カテゴリカル変数のEncoding手法について

Structured Data(構造化データ)の下処理をおこなう際に避けて通れないのがFeature Engineering(特徴量エンジニアリング)。 特に悩ましいのがカテゴリ変数の扱いで、どのように扱えば良いか困ることが多く、また、使った手法もすぐに忘れてしまいがちなの…

機械学習や人工知能、AI関連分野を取り巻く情勢

機械学習や人工知能、AI関連の記事で気になったものをピックアップし、Google Keepにメモする習慣をつけている。 メモに残す記事の数はだいたい一日2、3件。 (日本語英語問わずチェックしているが、ひと目見た時の情報量の多さから、日本語記事をメモに残し…

ブログを綴るということ

去年取り組んでいたDeep LearningのMOOC (Massive Online Open Course) 、Fast.ai。fast.ai · Making neural nets uncool againここではDeep Learningの概念や実装上の具体的な手法を学ぶとともに、学習を続けていく上でのマインドセットも鍛えられた。(ち…

メモツールについて

Evernoteが1年半ほど前に無料版で2台までと利用が制限されてしまって以来、 しっくりくるメモアプリ探しを続けている。 ツールはあくまでツール。当たり前だけども何をやりたいのかを明確にすることは必要。 そもそもメモアプリの機能は淘汰されたり、サー…