科学勝利 #0

2015年5月3日 / 未分類

Rストーリーのテキスト化――。
考察のため、或いは楽しみのため。持ち歩きの便に優れた其れを目指した導き手は、決して少なくないだろう。
今、リアルエンジニアの成果たる「OCR」を武器に、とある導き手(文系)が立ち上がる。



■前もやんなかったっけ
前回は、テキスト出力可能な段階にもっていく道筋は見えましたが、その道筋が効率悪すぎるという結果でした。
が、友人の知恵を借りて、ImageMagickによる画像の「減算→色反転→垂直結合」処理に成功し、
その「画像処理めんどすぎる」が割と解決。

ということでちまちま記事を分けて、「どうやるの」を書き連ねていこうかと思います。
あくまで「僕はこうやってる」なので、もっと良いやり方は色々あるんじゃないかね。
各々改善していってね!改善はエンジニアリングの基本って誰かが言ってた。

読みつつ実際にやってみれば分かるよう書いてくつもりだけど、
もし「なるほどわからんkwsk」ということであれば適宜詳細を書き足すかと思います。


■お品書き
#0……概要(←今ココ!)
#1……窓フォト & SnippingToolによるスクショ + BTJ32によるトリミング編集
#2……ImageMagick & GoogleDriveによるOCR変換




■大体の流れ
1.Rストーリーのスクショを用意します
2.画像を処理して文字のみの画像を作り、OCRに突っ込んでテキスト出力させます

1において。
サイズと保存形式が統一されたスクショを用意します。
ストーリーを撮影したものの他、文字の無い画像も必要となります。

2において。
文字入り画像を文字無し画像で減算処理をし、文字のみの画像を作ります。
黒背景に白文字の画像となるので、これに色反転処理をし、白背景に黒文字の画像を出力します。
更に各ページを垂直に結合し、OCR機能を使うにあたり画像1枚で済むようにします。
そしてOCR機能を持つ何らかのsomethingに、処理を終えた画像を突っ込んでテキストを出力させます。


■現状ある問題
GoogleDriveのOCR機能を使いましたが、テキストの精度が微妙です。
何故かタイトルを読み取ってくれなかったり、あとかぎ括弧の”」”を読み取らないことが多いような。
出力後、さっと読み返して適宜手入力で修正を加える必要があります。
まぁOCR機能に手を加えられるような知識はマジで無いので…これ以上の改善は望めないかな…
考察はなるべく最新の原文(ゲーム内のRストーリーそのもの)をあたること、
スクショやテキストはあくまで検索用などの補助として、と割り切るしか無かろうかね。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

2024年11月
 123
45678910
11121314151617
18192021222324
252627282930  

最近の投稿

TOPへ戻る