Yuki猫のおうち

気ままに自由に日々を生きるエンジニアのブログ

DeepLearning4jのword2vecを使ってみる〜設定編〜

Javaを使ってDeepLearning

最近話題のword2vecですが、有名なのはPythonライブラリのgensimですね。

でも僕はPython書けないし、Javaでできないのかなと思って探していたら、ありました。DeepLearning4jというライブラリが提供されていました。

deeplearning4j.org

しかしこのdl4j、使っている人が少ないのかTipsのページが少ない...
公式のリファレンスも英語だし、使い方がよくわからない中とりあえず手探りで使ってみることにしました。

dl4jをEclipse上で使えるように設定

今回の記事では、まずdl4jを使って開発する環境を整えます。

用意する物
  1. Eclipse
  2. Java SDK
  3. Maven

dl4jはMavenリポジトリが公開されているので、EclipseMavenプラグインを使えば簡単に導入することができます。

手順

1. 新規Mavenプロジェクトの新規作成
 Mavenプロジェクトを立ち上がるところは本筋じゃないので省略。
 以下のサイトがとてもわかりやすく解説されています。
qiita.com

2. pom.xmlの編集
 pom.xmlの[Dependencies]タブのAddボタンから、各種ライブラリを登録します。
 登録するのは、以下の三つです。

  1. nd4j
  2. deeplearning4j-core
  3. deeplearning4j-nlp

 それぞれ、こんな感じで入力すればOKです。

nd4j

f:id:yukineko4you:20160222190428p:plain

deeplearning4j-core

f:id:yukineko4you:20160222190442p:plain

deeplearning4j-nlp

f:id:yukineko4you:20160222190526p:plain

設定完了

これで、設定が完了しました。

次回は、このプロジェクト内でword2vecを使うために、コーパス生成を行っていきます。

 続き -> DeepLearning4jのword2vecを使ってみる〜コーパス生成編〜