Takunojiのプログラミング・プレイグラウンド(遊び場)

プログラミングのススメとか記載します、今までにやったのは、環境構築、実装方法の説明など、Java, UnrealEngine, Unity, BlenderPython, Discord, OpenCV, TensorFlow(Python), ラズパイ(RPi)などやりました。まだ中途半端ですが。。。

Mecabを使って文章解析をするために〜Mecabのインストールから〜

イントロダクション

最近(結構前からですが。。。)は、人工知能が流行っていますね。じゃやってみようとやってみました。やっぱり難しい、と思いましたが。。。

「数学的な部分が難しい!APIの扱い自体はそんなに難しくない」

と言うのが全体的な感想です。

上のリンクは初めの部分です、全体のやったことは以下のようなものです。

  1. Tensorflow Keras 〜初めてのKeras
  2. Tensorflow Keras Errors”python is not installed as a framework.”
  3. Python Tensorflow 〜初めての人工知能(TensorFlowインストール)
  4. Tensorflow Keras〜初めのトレーニング_1
  5. Tensorflow Keras〜初めのトレーニング_2:前処理〜
  6. TensorFlow Keras〜テキストの分類〜
    1. TensorFlow Keras 実行結果〜テキストの分類〜
  7. Python TensorFlow tutorial〜チュートリアルを進めるコツ、ワンポイント〜
  8. TensorFlow Keras〜回帰、準備から予測まで〜
  9. TensorFlow Java 環境構築〜JavaでもTensorFlow〜

TensorFlowのチュートリアルをやってみて

結局のところ以下のような手順で操作を行いました。

  1. データセットの準備
  2. データセットを読んで、学習するモデルを作る
  3. 学習処理の実行
  4. 予測処理を行い、判定結果を表示する

Pythonでの実装を行ったのですが、最後の「判定結果」を表示するときに結果が「NumPy」→数値配列だったので意味が理解できませんでした。

結論

TensorFlowを使いこなすために必要な知識は、以下のようになると思いました。

  1. 上記の「4」に当たる「予測処理」での結果を理解するための「数学力」
  2. モデルを作るための「数学力」※計算結果が何を示すのか、わかるレベル
  3. モデルの構築方法(レイヤーの組み合わせかた)

そして、細かい計算方法はわからないけど、自分なりに文章解析を行うための方法を考えています。そこで使用するのが「Mecab」文を品詞分解したり単語に分割してくれるプログラムです。(日本製オープンソース)

taku910.github.io

Mecabのインストール方法>※表示されている文言が違う

zenryokuservice.com

 

Python Mecab〜日本語を分解してみよう〜 – PGボックス

JavaからMecabを起動する

Mecabの使い方(ワンポイント)