LinuxでTesseractを使って画像ファイルに書かれたテキストデータをテキストファイルに出力する

Tesseractのインストール
$ sudo apt install tesseract-ocr
$ sudo apt install libtesseract-dev
日本語の訓練済みモデルのインストール
$  sudo apt install tesseract-ocr-jpn tesseract-ocr-jpn-vert
$  sudo apt install tesseract-ocr-script-jpan tesseract-ocr-script-jpan-vert
Tesseractの実行

日本語が書かれた「test.png」ファイルのテキストデータを「test.txt」に出力する

$ tesseract test.png test -l jpn