Java で Cognitive Services の Computer Vision API - OCR を利用する

kameyatakefumi.hatenablog.com

勉強会に行って満足するのではなく、実際に触ってみよう。
公式に Java のサンプルがあるので助かります。

Computer Vision API Java quick starts | Microsoft Docs

GitHub - kameyatakefumi/CognitiveServices4J: Cognitive Services for Java

実行してみると、ちゃんと動きました。
素晴らしい。

APIを試しに使ってみるだけなら以下のサイトでも行える。

Computer Vision — 画像処理および画像分析 | Microsoft Azure

試しに三国志大戦4の画像 SR董卓 を読み込ませてみる。

f:id:kameya_takefumi:20171013133242p:plain

結果は以下の通り。

No. 9196 5814 9182 2459 5557

ア ー ケ ー ド

SRT 卓

1 彈

解 任 日 時 .

◇ 復 活 ◇ 復 活 ・ 攻 城 登 用 期 限

17 / 10 / 10 20 : 33

: 11 / 08 03 : 59 : 59

辛い。
他にも何点か画像を読み込ませて結果を見てみました。

画像サイズも重要なんだけど、フォントの種類で認識精度が変わりそうだと思いました。
フォントの種類は環境で違うので辛い所がありますね。

どの画像を読み込ませても、上の画像の「速度」の部分が文字と認識されない。
API的には記号でしかないようです。

人間の認識って凄く曖昧で、わかった気になっているって事が多いのかな。
それがある意味で凄いって事なんだろうけど。

文字の認識は、記号を読み取って、それを文字フィルターで拾っている感じになっているんだろうか。

使ってみるとAPIの特徴がわかってきていいですね。

kameyatakefumi.hatenablog.com