【Python】CentOS で画像から文字起こしをするサイトをつくったよ!
ijmaki / Pixabay
Pythonで画像から文字起こしをするサイトをつくりました!!!

 

 

どーもTakeです。

このたび兄弟ブログである「スーパー開発ブログ」で Pythonで画像から文字起こしをするサイトをつくりました!!!

記事はこちらです。

 

このページを作るのがかなり大変でした。。。。

CentOs7というサーバ上で「tesseract-ocr」と「pytesseract」というパッケージを使ってやったんですが、うまくいかないことばかり、、、

なので、構築手順を簡単にページにまとめました!

よければこのページを参考に作ってみてください!

 

この記事でわかること!
  1. 画像から文字起こしするための環境構築する方法
  2. 実際にテスト用の Python スクリプトをつくって動作させるまで

 

スポンサーリンク

画像から文字起こしするための環境構築

 

画像から文字起こしするための環境構築の方法について記述します。

この通りやればいけますが、下記を実行してエラーが出たら大抵うまくいきませんので、全部うまくいったことを確認してください。

 

「tesseract-ocr」と「pytesseract」をインストールする

 

下記コマンドを実行してパッケージを入れます。

 

つぎに「tesseract-ocr」を実行するために必要な「leptonica」を入れます。

 

つぎに vim コマンドで「/etc/profile」に下記内容を追記します。

 

そんで「tesseract-ocr」を入れます。

git コマンドが入っていない場合「yum install git」で入れます。

 

「tessdata」で言語パッケージをとってくる

 

「tessdata」っていう言語パッケージを取ってきます。

下記コマンドを実行します。

 

あとは実際に動くか試してみます。

 

上記は「img.png」って画像を読み込ませて「out」(テキストとして出力)されます。

日本語を文字起こししたい場合は jpn で言語指定します。

実行後に「Error」となく実行できればOK、out.txtの中身を確認して正常に動いていれば問題なしです。

 

ポイント!

 

「mv tessdata /usr/local/share/tessdata」を絶対に忘れないこと!!!

しかも「cp」コマンド(コピー)ではなく「mv」コマンド(移動)であること!です!

なんでかわからないですが、「cp」コマンドだと旨く読み込まれなかったです。

 

わたしはそもそも「mv」コマンドを忘れて実行してしまい下のようなエラーがでて私は詰みました笑

 

「pytesseract 」をインストールする

 

ここまでくればあとは「pip install pytesseract 」を実行します。

ここまでエラーなしでいけていればOKです。

 

参考サイト:

 

実際にPythonコードを書いてみる

 

実際に「tesseract」を python上で動作させます。

下記内容を pythonファイルとして保存(今回は test.py)とします。

 

 

そして「python test.py 」と実行すればコマンドライン上に画像に含まれるメッセージが出力されます。

 

処理の中身は超簡単です。

まず img.png っていう画像ファイルを読み込んで「/usr/local/tesseract」を呼び出して実行して変数に格納し、

その変数を出力するだけのスクリプトです。

 

最後に

 

いかがでしたでしょうか?

Pythonで画像から文字起こしをする方法を解説しました。

 

わたしの兄弟ブログである「スーパー開発ブログ」のこちらの記事に実際に動作するものが乗っています。

ただ英語は精度がかなりいいんですが、日本語が精度が悪いです。。。

ですが、結構面白いサイトなのでぜひチェックして見てください!

ではでは。

スポンサーリンク
おすすめの記事