ysaz (ImanazaS) blog

最近はデータ分析や機械学習が中心。たまに音楽や書評。

2016-01-01から1年間の記事一覧

七月二十六日のこと(アイスランド)

2年前(2014年)の旅行記で、ほとんど記憶が薄れてしまっているけれど、せっかく途中まで下書きをしていたので、記事として形にしておこうというのが趣旨。 ============================================= この日は朝からゴールデン・サークルツアーに出か…

日本への一時帰国

久しぶりに日本へ一時帰国して感じたこと。 ・エレベーターに乗ったとき、Ground Floorがなくてちょっと戸惑う。・エレベーターのドアが開くときに、「こちらのドアが開きます」というアナウンスが流れると、どっちやねんと突っ込みたくなる。・通勤ラッシュ…

Pythonを使ったRFM分析

今回はこれまでと趣向を変えて、サンプルデータを使った分析手法(RFM分析)について取り上げる。RFM分析は、Recency(直近)、Frequency(頻度)、Monetary(購入額)の略であり、マーケティングの分野において、顧客をグループ化した上で優良顧客を抽出し…

Pandasを使った行列のセレクティングについて

pandasでのiloc[行, 列]を使った操作に関する備忘録。 特定のデータを行あるいは列から抜き出して表示したり、違う数値へ置き換えたりする方法について記す。 import numpy as np import pandas as pd # データフレームの作成 df = pd.DataFrame(data= [('20…

Pandasでの複数ファイル読み込み

指定したフォルダ内に格納されている複数のファイルを読み込み、データフレームを作成する方法についての備忘録。 # 必要なパッケージの読み込み import pandas as pd import numpy as np from datetime import date, datetime, timedelta import time impor…

Pandasでのデータ集計

pandasを使ったデータフレームの成形について。meltやpivot_tableの使い方に関する備忘録。例: 都市ID毎の日別気温、湿度データが与えられているが、各列にデータがまとめられている(例えば、気温の列に全ての都市IDに紐づくデータが一纏めになっている)…

Pandasでの時系列操作

python、主にpandasの基本的な使い方について、備忘録として記述していく。 まずはタイトルの通り、時系列操作について。例1 あるデータフレームに年(Year)列と月(Month)列データが入っているとき、 この2つを年月として合わせて、データフレームのイ…