2019年11月30日更新
データサイエンティスト養成読本 機械学習入門編で取り上げられている機械学習ソフトウェアの概要。
R
R は,1992 年にニュージーランドのオークランド大学の Ross Ihaka 氏と Robert Clifford Gentleman 氏により開発された統計解析言語。
データ解析の代表的なソフトウェア。
基本的にオンメモリ処理なので大規模なデータを扱うのは難しい。
Python
Python は,1991 年にオランダの Guido van Rossum 氏により開発された汎用的なスクリプト言語。
Numpy,Scipy,scikit-learn,Pandas などのパッケージの開発が進み,データ解析分野でも注目が集まっている。
Julia
Julia は,マサチューセッツ工科大学(MIT)のJeff Bezanson 氏を中心として開発され,2012 年に公開された科学計算のための新たな言語。
また発展途上だが,今後の開発が期待される。
Apache Mahout
Apache Hadoop や Apache Spark 上で動作する機械学習ライブラリであり,大規模並列分散処理の草分け的存在。
Spark MLlib
Spark とともに,今後の進展が期待される。
データサイエンティスト養成読本 機械学習入門編 (Software Design plus)
- 作者: 比戸将平,馬場雪乃,里洋平,戸嶋龍哉,得居誠也,福島真太朗,加藤公一,関喜史,阿部厳,熊崎宏樹
- 出版社/メーカー: 技術評論社
- 発売日: 2015/09/10
- メディア: 大型本
- この商品を含むブログ (7件) を見る