VNダイレクトは、ベトナム市場で最も評判の高い証券会社の一つであり、すべての投資家の最初の選択肢になるというビジョンを持っています。しかし、現在の最大の問題は、入力が100%人間によって行われ、プロセスが複雑で、生産性が低いことです。BlueOCチームはこの問題を解決するため、AIエンジンの構築に取り組んできました。
メーカーやチェッカーは、一度に多くのツールを使ったり切り替えたりしなければならないため、作業に時間がかかり、入力の生産性が低下します。複雑なツールの使い方を新メンバーに教育するには時間と労力がかかるため、VNダイレクトでは、棚卸を完了し、1日以内にリリースされるすべての書類を処理するために、データ入力の生産性を60~70%向上させるための新しいツールをいくつか必要としています。
新しいツールには、混合データを認識して処理するためのAIエンジンの壁がありました。
データの標準化を支援する入力ツールを構築します。当社のOCRソリューションは、スマートな前処理と最新の最新モデルを使用することで、ほぼすべてのPDF文書をテキストに変換し、データ抽出のためのモデルに投入します。
株式発行に関するいくつかの文書からデータを抽出しました。現在のところ、この問題のニーズを満たす最新のモデルは存在しないため、この問題に適合するカスタムモデルを作成しました。ESOP、現株主、名前付きエンティティ認識などの銘柄タイプ分類を適用し、証券コードや証券銘柄のような、テキスト中の特徴的なフィールドを検出し、それらをマッピングします。テスト結果は比較的良好で、精度は85%を超え、手入力の労力を80%以上削減しました。
モデルを3つのヘッドに分けます:
OCRを使用した当社のソリューションは、上記のすべてのペインポイントを処理することができます。スマートな前処理と最新のモデルを使用することで、ほとんどすべてのPDF文書をテキストに変換し、データ抽出のためのモデルに入力することができます。
例えば、PDFをOCRすることができます: