- Metaがユネスコと提携し、音声録音と文字起こしの収集プログラムを開始
- 収集データは音声認識と翻訳AIの精度向上に活用予定
- プログラムは多言語対応を強化し、グローバルなコミュニケーションの促進を目指す
Meta、UNESCOと協力し音声データ収集プログラムを開始
Metaは、ユネスコと提携して音声録音と文字起こしを収集する新たなプログラムを開始した。この取り組みは、音声認識と翻訳AIの精度向上を目的としている。
このプログラムであるLanguage Technology Partner Programは、10時間以上の音声録音に文字起こし、大量のテキスト、および「多様な言語」の翻訳された文章のセットを提供できる協力者を求めている。Metaによると、パートナーは同社のAIチームと協力して、これらの言語をAI音声認識および翻訳モデルに統合し、最終決定時にはオープンソースになるという。
収集データの活用と多言語対応の強化
収集されたデータは、メタの音声認識および翻訳AIの精度向上に役立てられる予定である。これにより、多言語対応が強化され、グローバルなコミュニケーションの促進が期待されている。
Metaはブログ記事で、「私たちの取り組みは、ユネスコの活動を支援するために、特に十分なサービスを受けていない言語に焦点を当てています」と述べており、「私たちの最終的な目標は、言語や文化的背景に関係なく、複雑な人間のニーズを理解し、それに応えることができるインテリジェントなシステムを作ることです」としている。
これまでのパートナーには、カナダ北部の人口密度の低い地域であるヌナブト準州政府が含まれる。ヌナブト準州の一部の住民は、イヌクトゥット語と総称されるインテュイット語を使用している。
オープンソースの機械翻訳ベンチマークをリリースか
Metaは、新しいプログラムを補完するものとして、言語翻訳モデルのパフォーマンスを評価するためのオープンソースの機械翻訳ベンチマークをリリースすると述べている。このベンチマークは、言語学者が作成した文章で構成されており、7つの言語をサポートしており、AI開発プラットフォームであるHugging Faceからアクセスし、貢献することができる。
Metaは、この2つの取り組みを慈善活動と位置づけているが、同社はアップグレードされた音声認識および翻訳モデルの恩恵を受ける立場にある。
Metaは、AI搭載アシスタントであるMeta AIがサポートする言語の数を増やし続けており、クリエイター向けの自動翻訳などの機能を試験的に導入している。昨年9月、Metaは、クリエイターが自分の音声を吹き替えて自動リップシンクできるようにする、Instagram Reelsの音声を翻訳するツールのテストを開始すると発表している。
メタの方向性への批判
Metaがプラットフォーム全体で英語以外の言語でコンテンツを扱っていることは、多くの批判の的となっている。ある報告によると、Facebookはイタリア語とスペイン語のCOVIDの誤情報のほぼ70%を放置しているのに対し、同様の英語の誤情報ではわずか29%であった。また、同社からリークされた文書によると、アラビア語の投稿にはヘイトスピーチとして誤って登録されていることが定期的にある。
Metaは、翻訳とモデレーションの技術を改善するための措置を講じていると述べている。
引用元:TechCrunch
Meta launches new program to improve speech and translation AI