nyarn.tech

にゃーん

形態素解析のOSXアプリ shirakabaをつくりました

つくったもの

mac向け形態素解析アプリを作りました。名前はshirakabaです。

f:id:asayamakk:20160523155011p:plain

[shirakabaのダウンロード]
https://www.dropbox.com/s/1sah7lsedoen9kt/shirakaba.app.zip?dl=0

ソースはこちらです。
https://github.com/asayamakk/shirakaba

AppleのDeveloper IDを取得していないため、初回起動時は設定によっては起動できない旨が表示されます。

もとになったもの

jsの形態素解析ライブラリといえばkuromoji.jsがとても有名かと思います。
今回はkuromoji.jsのデモをmacアプリに移植してみました。

[ブラウザで自然言語処理 - JavaScript形態素解析器kuromoji.jsを作った]
http://stp-the-wld.blogspot.jp/2015/01/javascriptkuromojijs.html

kuromoji.jsがあれば本当に簡単に言語処理に入門できます。

ちなみにkuromoji(黒文字)とは和菓子を切ったりする道具という意味もあるらしいです。
[kuromoji公式サイト]
https://www.atilika.com/ja/products/kuromoji.html

Kuromojiはどういう意味ですか?
いい質問ですね!文字通りだと「黒い」と「文字」ということになりますが、実は別の意味もあります。
「黒文字」というものは茶道でよく見られますが、和菓子をお盆から懐紙へ移動したり、食べやすい大きさに切ったりするための道具です。
– 基本的に入力処理のツールということです。;)

とってもおしゃれだなあと思ったので、黒文字(楊枝)よりも切ったり持ったりしやすいお箸のイメージでshirakabaにしました。白樺はメジャーな割り箸(元禄橋)の素材です。

使い方と機能説明

使い方はとてもシンプルです。
解析したいテキストをテキストエリアに入力すると、解析結果が下のテーブルに表示されます。
解析結果をダウンロードしたい場合は [Export as CSV] からダウンロードできます。

TODO: やり残したこと

今後追加したい機能としては

  • tsv/csv形式の選択
  • 解析結果の表示項目の切り替え
  • 辞書追加(難しそう・・)

をゆっくりできればなあと思っています。

機能面以外では

  • windowsの対応・配布
  • アプリアイコンの作成
  • READMEの追加

もやってしまいたいです。というかREADMEは必須ですね。。

あとはインストールから配布までの記事を余裕があれば書こうと思います。
v1.1.0のメニューのハマりポイントだけ、Qiitaに書いてみました。
[Electron v1.1.0でMenuの実装をするお話]
http://qiita.com/asayamak/items/00194a9d4ac2a8a5f8cb

おわりに

そもそも何故こんなものを作ったのかというお話です。

以前に非プログラマの研究のお手伝いで、ある語句の出てくる回数をカウントしたいという依頼を受けました。
そのときはまだWeb茶まめ もありませんでした。 (論文公開が2015年なので恐らく)

結果をExcelでいじいじしたいとのことだったので、csvで出せるやつがいいなーと思って探すと
winchaが見つかったのですが、手持ちのwin8では動作せず、mac版もないため結局ruby + nattoでcsvを吐き出して渡していました。

お手軽にcsvなどの形式でダウンロードできるアプリがあったら便利だろうなーと思って早一年。 Electronに触れたときにぴったりだと思い制作しました。
(あとで調べたらweb茶まめを発見して(˚ ˃̣̣̥ω˂̣̣̥ )ってなりましたがw)

プログラミングできる人もできない人も楽しく自然言語処理・分析が出来るようになればとっても幸いです。