マイクロソフトは、エッジの画像に自動的に生成された字幕を発表しました

マイクロソフトは、エッジの画像に自動的に生成された字幕を発表しました

マイクロソフトは、視力を弱めた人々のユーザーエクスペリエンスを向上させるために、彼のブラウザの特別な機能の新機能を発表しました。 Edgeは、スクリーンリーダーが補助技術に応じて視覚的コンテンツを記述できるように、画像への字幕を自動的に作成します。画像または「代替テキスト」への字幕 - 利用可能なネットワークの重要な部分では、しばしば無視され、マイクロソフトは自動的に生成された字幕を提供することによってこの問題を解決したいと考えています。

マイクロソフトはAzure Cognitive Servicesを使用して、欠けている「代替テキスト」を使って画像を分析して説明します。エッジがマークされていないイメージを検出すると、処理のためにMicrosoftサーバーに送信します。機械学習アルゴリズムは、JPEG、PNG、GIF、WebPなどの最も一般的なフォーマットで動作して、5つの言語で説明的なレポートを提供できます。さらに、マイクロソフトは120以上の言語で画像のテキストを分析できます。

他の自動化されたシステムのように、Microsoft Edgeの自動生成された字幕は完璧ではなく、マイクロソフトは品質が異なると警告します。このため、当社はWeb開発者とコンテンツマネージャを呼び出して、Webサイト上の画像にカスタム代替テキストがあることを確認します。

さらに、マイクロソフトは装飾的な画像、50×50ピクセル未満の画像、巨大な画像、そして率直な内容(ポルノ、性的、または血まみれの含有量)の説明を作成しません。

Microsoft Edgeで自動的に生成された字幕を試したい場合は、ブラウザを最新のバージョンに更新して[設定]> [特殊機能]に移動してから、[画面から読み取るためにMicrosoftから画像の説明を取得]をオンにします。現時点では、Windows、Linux、MacOS用のMicrosoft Edgeで入手できます。