HOME > ソフトウェア > OCR de Paws > Azureの制限事項


Azureの制限事項  2021/06/02 Update

PaaSを提供する各プロバイダーは、サービスの品質を維持するために一定の制限事項を設けています。 ここでは、Azureが提供するOCRと翻訳サービスに関連する制限事項について説明します。
また、それらの制限に基づいたアプリの仕様についても記載しています。

なお、制限事項については、プロバイダー側で常に変更される可能性があります。 そのため、ユーザー自身で最新の情報を参照するようにして下さい。

OCRサービス

AzureのOCRサービスでは、Read APIとOCR APIを利用したサービスが提供されています。
Read APIは、Microsoftによる最新の認識モデル(AI)を使用したサービスです。 通常のテキストに加えて手書きのテキストもサポートしています。 従来の認識モデルを使用したOCR APIと比較した場合、認識精度が飛躍的に向上しています。
ただし、正式なバージョンでサポートされている言語は、欧米系のみです。

OCR de PawSは、これらのAPIを自由に切り替えて利用できるようにデザインされています。

また、プレビュー版となるv3.2 Preview 2以降では、73言語がサポートされました。(2021年4月に正式版 v3.2 GAがリリース) OCR de PawSでは、このv3.2 GA版を利用できますので、日本語等を利用したい場合はお試しください。



サポート言語(全サブスクリプション共通)
API サポート言語
Read API 英語、スペイン語、ドイツ語、フランス語、イタリア語、ポルトガル語、オランダ語
v3.2 GAでは、日本語と簡体中国語が新たにサポートされています。
また、v3.2では、73言語のサポートに対応しています。 なお、OCR de PawSでは、Version 2.11.5で上記v3.2 GAにも対応しています。

手書き文字の検出に関しては、英語のみサポート

サポート言語の詳細に付いては、下記Azureのドキュメントを参考にして下さい。
Computer Vision の言語サポート
OCR API アラビア語、簡体中国語、繁体中国語、チェコ語、デンマーク語、オランダ語、英語、
フィンランド語、フランス語、ドイツ語、ギリシャ語、ハンガリー語、イタリア語、日本語、
韓国語、ノルウェー語、ポーランド語、Portuguese、ルーマニア語、ロシア語、
セルビア語 (キリル)、セルビア語 (ラテン)、スロバキア語、スペイン語、スウェーデン語、
トルコ語


制限事項
サブスクリプション Azureによる制限 アプリ内制限
F0(無料) Read APIでは、複数ページを持つPDF及びTIFFファイルの場合、先頭2ページのみ処理される。 また、複数の画像ファイルの一括処理が制限されている。
OCR APIの場合、上記制限は明記されていないが上限の詳細については不明。(筆者の環境では30ページ程度のPDFファイルは処理可能であった)

なお、どちらのAPIでも1分間に20トランザクション及び、トータルで1月毎に5,000トランザクションの制限がある。

画像解像度:50 x 50ピクセル以上、10,000 x 10,000ピクセル以下。
画像データサイズ:4MB未満。
※OCR APIに関しては、不明。(4,912 x 3,264程度でサイズエラーが返却された)

トランザクション回数: 検出に成功した場合は、1画像につき最低でも2回発生する。 発生した回数分だけ、無料で利用できるトランザクション数から減算される。
なお、最初の要求(検出画像送信時)でエラーが返却された場合は、カウントされない。
アプリ内でも、Azureの制限を超えないように同様なページ制限と速度調整を行っている。
また、Read APIでは、複数の画像ファイルを指定された場合に、先頭の3ファイルのみ処理を行うことができる。

OCR APIでは1分間で20ページ未満に収まるように制限している。
なお、上限が不明であるため多くのページを含むドキュメントを処理したい場合は、SLAが提供されている有料サブスクリプションのS1を契約することを推奨。
また、複数の画像ファイル指定時に、最大100ファイルを一括して処理することができる。
処理可能な画像フォーマットに関しては、アプリ内で全てBMP形式に変換しているため気にしなくても問題ない。不正な場合はエラーが表示される。
TIFFファイルに関しては、現在調整中のため未サポートとしている。
S1(標準) 全APIで、複数ページを持つPDF及びTIFFファイルは1分間で最大2,000ページの制限がある。
また、複数の画像ファイルを指定した一括処理が可能。

なお、どちらのAPIでも1秒間に10トランザクションの制限がある。(最大 200ページ(1分間))
1ヵ月のトランザクション制限数は1,000,000。

画像解像度:50 x 50ピクセル以上、10,000 x 10,000ピクセル以下。
画像データサイズ:50MB未満。
※OCR APIに関しては、不明。(4,912 x 3,264程度でサイズエラーが返却された)

トランザクション回数: 検出に成功した場合は、1画像につき最低でも2回発生する。 発生した回数分だけカウントされる。 ただし、1画像の検出で複数回のトランザクションが発生しても料金としてカウントされるのは1トランザクションとなっている。 なお、最初の要求(検出画像送信時)でエラーが返却された場合は、カウントされない。
アプリ内でも、Azureの制限を超えないように念のため速度調整しているが、一般的な回線速度を考慮すると未調整でも1分間に200ページの処理は難しい。
Read API及びOCR APIとも、複数の画像ファイル指定時に、最大100ファイルを一括して処理することができる。

対応する画像フォーマットに関しては、F0と同様。

OCRサービスでは、テキスト検出のみに対応しています。そのため、厳密では有りませんがS1の場合は、1トランザクションは1画像の認識で問題ありません。
PDFなどの複数ページを持つドキュメントの場合は、1ページ毎にトランザクション数がカウントされます。




翻訳サービス

V3 translation APIを使用し、翻訳元テキストの言語については自動検出に対応しています。

カスタム翻訳については調整中です。



制限事項
サブスクリプション Azureによる制限 アプリ内制限
F0(無料) 1回の翻訳で可能な最大要求文字数は、5,000文字。
1時間あたりの最大文字数は、200万文字。
1ヶ月あたりの最大文字数は、200万文字。
現バージョンでは複数ファイルの連続翻訳をサポートしていないため、速度調整は行っていない。
また、1回の翻訳で可能な最大要求文字数に関しては、4万文字を最大として1リクエスト5,000文字以内に収まるように分割して処理している。

なお、5,000文字以内に改行を全く含まないテキストは、エラーになる可能性があるため注意する。
S1(標準)/S2/C2 1回の翻訳で可能な最大要求文字数は、5,000文字。
1時間あたりの最大文字数は、4,000万文字。
1ヶ月あたりの最大文字数は、従量制。
F0と同様。
S3(標準)/C3 1回の翻訳で可能な最大要求文字数は、5,000文字。
1時間あたりの最大文字数は、12,000万文字。
1ヶ月あたりの最大文字数は、従量制。
F0と同様。
S4(標準)/C4 1回の翻訳で可能な最大要求文字数は、5,000文字。
1時間あたりの最大文字数は、20,000万文字。
1ヶ月あたりの最大文字数は、従量制。
F0と同様。

文字数は、マルチバイトも1文字としてカウントされます。空白や改行も1文字としてカウントされます。





更新履歴

2021.06.02

 
  • OCRサービスに、v3.2 GAサポートの情報を追記

2021.02.26

 
  • OCRサービスのサポート言語に、v3.2 Preview2の情報を追記
  • OCRサービスのトランザクション回数の詳細を追記

2021.02.06

 
  • OCRサービスのサポート言語に、日本語と簡体中国語を追加
  • OCRサービスの画像データサイズ制限を修正

2020.07.24

 
  • OCRサービスの制限事項に、複数の画像ファイル指定時の制限事項を追加

2020.07.15

 
  • OCRサービスにサポート言語を追加

2020.05.19

 
  • 新規追加