科学勝利 #0

2015年5月3日 / 未分類

Rストーリーのテキスト化――。
考察のため、或いは楽しみのため。持ち歩きの便に優れた其れを目指した導き手は、決して少なくないだろう。
今、リアルエンジニアの成果たる「OCR」を武器に、とある導き手（文系）が立ち上がる。

■前もやんなかったっけ
前回は、テキスト出力可能な段階にもっていく道筋は見えましたが、その道筋が効率悪すぎるという結果でした。
が、友人の知恵を借りて、ImageMagickによる画像の「減算→色反転→垂直結合」処理に成功し、
その「画像処理めんどすぎる」が割と解決。

ということでちまちま記事を分けて、「どうやるの」を書き連ねていこうかと思います。
あくまで「僕はこうやってる」なので、もっと良いやり方は色々あるんじゃないかね。
各々改善していってね！改善はエンジニアリングの基本って誰かが言ってた。

読みつつ実際にやってみれば分かるよう書いてくつもりだけど、
もし「なるほどわからんｋｗｓｋ」ということであれば適宜詳細を書き足すかと思います。

■お品書き
#0……概要（←今ココ！）
#1……窓フォト & SnippingToolによるスクショ + BTJ32によるトリミング編集
#2……ImageMagick & GoogleDriveによるOCR変換

■大体の流れ
1.Rストーリーのスクショを用意します
2.画像を処理して文字のみの画像を作り、OCRに突っ込んでテキスト出力させます

1において。
サイズと保存形式が統一されたスクショを用意します。
ストーリーを撮影したものの他、文字の無い画像も必要となります。

2において。
文字入り画像を文字無し画像で減算処理をし、文字のみの画像を作ります。
黒背景に白文字の画像となるので、これに色反転処理をし、白背景に黒文字の画像を出力します。
更に各ページを垂直に結合し、OCR機能を使うにあたり画像1枚で済むようにします。
そしてOCR機能を持つ何らかのsomethingに、処理を終えた画像を突っ込んでテキストを出力させます。

■現状ある問題
GoogleDriveのOCR機能を使いましたが、テキストの精度が微妙です。
何故かタイトルを読み取ってくれなかったり、あとかぎ括弧の”」”を読み取らないことが多いような。
出力後、さっと読み返して適宜手入力で修正を加える必要があります。
まぁOCR機能に手を加えられるような知識はマジで無いので…これ以上の改善は望めないかな…
考察はなるべく最新の原文（ゲーム内のRストーリーそのもの）をあたること、
スクショやテキストはあくまで検索用などの補助として、と割り切るしか無かろうかね。

«前の記事へ次の記事へ»

月	火	水	木	金	土	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

科学勝利 #0

コメントを残すコメントをキャンセル

最近の投稿

最近のコメント

アーカイブ

カテゴリー

メタ情報

科学勝利 #0

コメントを残す コメントをキャンセル

最近の投稿

最近のコメント

アーカイブ

カテゴリー

メタ情報

コメントを残すコメントをキャンセル