概要
企業サイトのURLを入力するだけでロゴ画像を自動検出・ダウンロードするSPA。Excelの企業リストを使った一括処理に対応し、検出結果を精度別に分類して、ZIPで一括ダウンロードできる
解決する課題
- ・数百社規模のブランドロゴを、手作業で1件ずつ収集するのは非常に非効率だった
- ・企業サイトのHTML構造がさまざまで、単一のロジックでは検出精度が安定しなかった
使用技術
TypeScriptNext.jscheerioxlsxJSZip
開発背景
企業サイトからのブランドロゴ収集作業を自動化する必要があり、ファイル名・パス・タグ・DOMクラスなど複数の検出ロジックを組み合わせて精度とカバレッジを両立させるクローラーを開発