Masassiah Blog

現役サラリーマンのスキルアップのための読書まとめ

機械学習ソフトウェアの概要

2019年11月30日更新

データサイエンティスト養成読本 機械学習入門編で取り上げられている機械学習ソフトウェアの概要。

R

R は,1992 年にニュージーランドオークランド大学の Ross Ihaka 氏と Robert Clifford Gentleman 氏により開発された統計解析言語。

データ解析の代表的なソフトウェア。

基本的にオンメモリ処理なので大規模なデータを扱うのは難しい。

www.r-project.org

Python

Python は,1991 年にオランダの Guido van Rossum 氏により開発された汎用的なスクリプト言語

Numpy,Scipy,scikit-learn,Pandas などのパッケージの開発が進み,データ解析分野でも注目が集まっている。

www.python.jp

Julia

Julia は,マサチューセッツ工科大学(MIT)のJeff Bezanson 氏を中心として開発され,2012 年に公開された科学計算のための新たな言語。

また発展途上だが,今後の開発が期待される。

julialang.org

Apache Mahout

Apache HadoopApache Spark 上で動作する機械学習ライブラリであり,大規模並列分散処理の草分け的存在。

mahout.apache.org

Spark MLlib

Apache Spark 上で動作する機械学習ライブラリ。

Spark とともに,今後の進展が期待される。

spark.apache.org

 

データサイエンティスト養成読本 機械学習入門編 (Software Design plus)

データサイエンティスト養成読本 機械学習入門編 (Software Design plus)