転移学習で精度向上 転移学習有無の比較
※この記事は、機械学習に関心がある初心者のエンジニア向けとなります。
皆さん、こんにちは!
LAplustの中村です。
今回のテーマは、「転移学習で精度向上 転移学習有無の比較」です。
転移学習は、ある領域で学習したこと(学習済みモデル)を別の領域に役立たせ、効率的に学習させる方法です。
転移学習のメリットとして、生成されるモデルの精度が向上する、学習時間を短縮できる、ということが挙げられます。
今回LAplustは、転移学習の有無による精度や学習時間を比較しましたので、皆様に紹介したいと思います。
大前提として「学習に用いることができるデータが少ない」(数千点未満)場合を想定した話を行います。
結論から言うと、基本的に転移学習をやることによって学習時間が短くなり、精度も高まるため特殊なケースを除き基本的には採用した方がよい、というのがLAplustの意見です。
そのため、LAplust Eyeでは転移学習を利用することを基本として開発を進めています。
このブログが、皆様の転移学習の基礎知識習得に貢献することができ、転移学習有無の比較から転移学習の効果を実感できる場となれば幸いです。
是非最後までお読みください。
※一部の文章を生成AIによって生成しています。内容の誤り等がないよう細心の注意を払っていますが、万が一お気づきの場合はご指摘いただけますと幸いです。
目次
1. 転移学習とは
2. 転移学習有無の比較
3. まとめ
1. 転移学習とは
転移学習とは、ある領域で学習したこと(学習済みモデル)を別の領域に役立たせ、効率的に学習させる方法です。
通常、モデルは大量のデータセットに対して学習し生成されます。
一般的にこの「モデル」が皆さんがイメージする「AI」の本体になります。
しかし、少量のデータセットしか用意できない状況が発生することがあります。
その少量のデータセットで学習すると、生成されるモデルの精度が低くなってしまいます。
このような場合に、転移学習を行い、効率的に学習させます。
転移学習のメリットは以下になります。
- 用意するデータセットが少量の場合でもある程度の精度が出せる(当然データは多い方が良い)
- 生成されるモデルの精度が向上する
- 学習の時間を短縮できる
一方で、デメリットとしては「負の転移」です。
「転移学習に利用する事前学習済のモデル」と「転移学習を利用し生成するモデル」の関連性が低いと、モデルの精度が落ちてしまう「負の転移」と呼ばれる現象が起こります。ただし、これは現在ではあまり気にする必要はないかと思います。なぜなら、事前に莫大かつ多様なデータで学習されているモデルを活用できる環境が整っており、「データ関連性の依存」「未知の領域に利用不可」という点は多くの場合克服できるようになったためです。(一昔前は事前に莫大なデータで学習されたモデルが簡単には手に入らなかったため、転移学習するにしても「負の転移」を考慮した学習が必要でしたが、現在はそこまで気にする必要はないです。)
むしろ転移学習を利用しない方が良いケースを考慮しておく方が重要です。ここでは「そもそもデータが大量に入手できない」という前提を想定し話を進めていますが、「そもそもデータが大量に入手できる」場合においては、転移学習を利用しない方が良いこともあります。モデルを作成する目的が何で、何を成し遂げたいのか、またどのような品質のデータがどれくらい集まっているのかなど、これらの点を留意した上で、適切な使いどころを見極めることも重要です。
2. 転移学習有無の比較
今回LAplustは、前項で記載したメリットに注目し、転移学習を試してみました。
繰り返しになりますが、「データがそもそも少ない場合」について論じています。
「転移学習有り」と「転移学習無し」の比較を行いました。
学習の前提条件
- こちらのブログで紹介したガンガゼのデータセットを使用
- 「転移学習有り」と「転移学習無し」で学習
- 転移学習有り:「COCOデータセットで学習済のモデルを使用して」ガンガゼのデータセットを学習
- 転移学習無し:「学習済のモデルを使用せず」ガンガゼのデータセットを学習
以下に学習結果のグラフを示します。
(一部学習途中のモデルもありますが、このグラフでも転移学習有無の比較は可能だと思います。)
縦軸:平均適合率(値が高いほど誤検出が少なくなり、物体を正しく検出できています)
横軸:学習回数
となります。
赤四角で囲んである部分が転移学習有りの結果です。(学習回数30回)
また、赤四角で囲んでいない部分が転移学習無しの結果です。(学習回数300回、一部学習途中)
転移学習有りの方が、転移学習無しよりも圧倒的に平均適合率が高くなっており、学習回数(学習時間)も大幅に短縮されていることが分かります。
ここまで差が開くと思っていませんでしたので、はじめはとても驚きました。
(但し、この結果はデータ数がそもそも少ない場合に当てはまる結果と言えます。データ数がそもそも豊富に取り揃えられる場合は、転移学習したモデルと転移学習していないモデルでここまで大きな差が開くことはないです。そういう意味では何に利用したいかという目的によって使い分けていくことが重要とLAplustは考えます。)
このことから、転移学習を利用できる場合は、積極的に利用した方が良いということが一目瞭然であることがお分かりいただけると思います。
3. まとめ
今回のブログは、転移学習と転移学習有無の比較について記載しました。
転移学習は、ある領域で学習したこと(学習済みモデル)を別の領域に役立たせ、効率的に学習させる方法です。
転移学習のメリットとしては、生成されるモデルの精度が向上する、学習時間を短縮できる、ということが挙げられます。
また、転移学習有無の比較から、転移学習の有無によるモデルの精度向上と学習時間短縮の効果を確認できたかと思います。
今後LAplustは、転移学習をLAplust Eyeで利用できるように開発を進め、皆様により良い技術を提供できるよう邁進していきます。
このブログが皆様にとって有益な情報となれば幸いです。
LAplustではChatGPTをはじめとした「生成AI」の機能を飛躍的に向上させたTransformerを画像や物体検出に応用し、高精度な「人の目視と判断」を提供するLAplust Eyeを開発しております。
- 製品外観検査の省力化・省人化
- 出荷前の不良品検出
- 生態調査の半自動化
など省人化と活人化を実現したい現場の課題について声をお聞かせいただけると幸いです。
上記のような課題をお持ちであったりLAplust Eyeにご興味をお持ちいただけましたら、ぜひ、お問い合わせください。
最後までお読みいただきありがとうございました。