はじめに
Apache Zeppelin というウェブベースのノートブックプロダクトがあります。
ノートブックとはブラウザ上で動作する、対話型のプログラム実行環境で、プログラムやその実行結果、説明のテキストなどを同一のページ上で保存・管理するためのものです。試行錯誤の過程をそのまま記録として残すことができるので、データ分析でよく利用されます。
有名なノートブックとして Jupyter Notebook があります。
Zeppelin は Spark や各種 RDBMS など、様々なデータソースやインタープリタと連携させることができます。Solr との連携も可能です。
Zeppelin インストール
https://zeppelin.apache.org/docs/latest/quickstart/install.html
からダウンロードして展開後、以下を実行。
$ ./install-interpreter.sh --name solr --artifact com.lucidworks.zeppelin:zeppelin-solr:0.1.6 Install solr(com.lucidworks.zeppelin:zeppelin-solr:0.1.6) to /home/splout/zeppelin-0.10.1-bin-all/interpreter/solr ... Interpreter solr installed under /home/splout/zeppelin-0.10.1-bin-all/interpreter/solr. 1. Restart Zeppelin 2. Create interpreter setting in 'Interpreter' menu on Zeppelin GUI 3. Then you can bind the interpreter on your note
Zeppelin 起動
$ ./zeppelin-daemon.sh start
Solr との連携を設定
- http://localhost:8080/ にアクセスしてメニュー「Interpreter」を開く。
- Solr の Properties を設定する
- solr.baseUrl, solr.collection, jdbc.url, jdbc.driver
- 「Create New Note」で新しいノートブックを開く
- Default Interpreter を solr にする
実行例
以降の操作対象をコレクション test1 にする
use test1
全件検索
search q=*:*&fl=area,name,address,type,address_p
検索対象のコレクションを実行時に指定することもできる
search(test1,q=area_str:中央区,fl="name_str,area_str,address_str,type_str,address_p",rows=100)