統計学、機械学習などを使って身近な世界を分析したりするブログです

前処理

データアナリティクスによる『体感』で雨を予測する方法

我々の身の回りはデータで溢れています。人口統計、視聴率、売上、株価、内閣支持率、例を挙げれば枚挙に暇がありません。その中でも、最も身近なデータといえば、天気予報でしょう。外出する前に、傘を持っていくべきかどうかの判断に必要なデータが天気予…

機械学習を使って東京23区のお買い得賃貸物件を探してみた 〜前処理編〜

さて、前回のブログで足立区の賃貸物件を取得しました。www.analyze-world.com同様にして、東京都23区の物件も取得してしまいましょう。今回僕が取得したところ、合計で200,060件になりました。csvファイルで70MBほどですので、Excelだと重すぎて処理スピー…