この記事はMobility Technologies Advent Calendar 2022の21日目です。
DRIVE CHARTではMoT統合以前よりDeNA時代からデータ作成時のアノテーションツールとしてNotaを利用しています。近年では多数のOSS版アノテーションツールが普及しています。本記事ではNotaの代表的な機能の紹介に加え、様々なコンピュータビジョンタスク用のOSSアノテーションツールについて紹介します。
はじめに
機械学習における分類タスクなどのモデル開発ではラベルのついたデータセットが必要になります。一般的にコンピュータビジョンタスク、自然言語処理タスクなどにおいて複雑なラベルを付与する場合、専用のツールがあるとアノテーション作業の効率が向上します。世の中には商用版、OSS版など様々なアノテーションツールが普及しています。DRIVE CHARTではMoT統合以前よりDeNA時代からNotaというDeNAが開発するOSSアノテーションツールを利用しています。本記事ではNotaの代表的な機能や特徴について紹介します。それ以外にも昨今普及しているコンピュータビジョンタスク用OSS版アノテーションツールをいくつか調査したので合わせて紹介します。
Nota
- 代表的な特徴
- 組織という視点で見たときに必要となる権限管理やタスクのアサイン、進捗の可視化などの管理機能が充実しています
Label Studio
https://github.com/heartexlabs/label-studio
CVAT
https://github.com/opencv/cvat
- 代表的な特徴
- Notaにはない自動アノテーション機能が備わっています
LabelBee
https://github.com/open-mmlab/labelbee-client
- 代表的な特徴
- mmdetectionやmmcv等を提供するopen-mmlabが開発するアノテーションツール
- シンプルな機能を提供しています
VoTT
https://github.com/microsoft/VoTT
おわりに
Notaを中心に複数のアノテーションツールを紹介しました。昨今では個人情報などのセンシティブなデータを運用するケースも多くセルフホスト版の導入ニーズが高まっているかもしれません。またアノテーターの方たちの生産性を損なわないためにショートカットキーなど使い勝手に関する機能も必要となってきます。Notaはアノテーターの方たちとAI開発者でPDCAを回しながら開発してきた現場指向のアノテーションツールです。興味のある方はぜひ使ってみてください。
それでは皆様よいアノテーションライフを!