台本ビューアの文字認識OCRについて

現行のバージョンの台本ビューアでは、画像からの文字認識技術に下記のTesseract OCR iOSを使わせて頂いています。

https://github.com/gali8/Tesseract-OCR-iOS

大変感謝している反面、iOSのバージョンアップやSwiftのバージョンアップの速度に比べて、このフレームワークの更新が遅く、台本ビューアのアップデートのある意味「壁」になっていたという面もありどうしようか考えていた所、iOS13からアップル純正の文字認識が搭載されるので(英語だけですが)今後はそちらを使おうと思います。

なので、iOS12で今後アップデートするバージョンでは文字認識機能を削除。iOS13対応バージョンから文字認識復活の予定になります。

そもそも、なぜ自炊したような台本が存在するのか?個人的には理解できません。コピー対策なのかなんなのか???

また今現在の台本ビューアに入っているTesseract OCR iOSは、メモリーの解放のタイミングが遅くて古い機種では落ちる原因にもなっています。一部改造してメモリーの解放を早めてみたのですが、こういう著作権のあるframeworkの扱いに慣れていないため、ある意味放置したままになっています。

現在画像認識技術を使用しているのは、シーンの柱の検出のためのシーンナンバー読み取りだけなので、特に日本語に対応していなくても当面問題ないと思われます。いつか全文書画像認識などするとしたら問題ですが。。。

まとめると

  • 次期iOS12バージョンでは画像認識を削除
  • iOS13対応バージョンから画像認識復活(アップル純正)
  • 次期バージョンからShotsDataと連携する予定