
Во сложените околини, луѓето можат да го разберат значењето на говорот подобро од АИ, затоа што ние ги користиме не само нашите уши, туку и нашите очи.
На пример, гледаме како нечија уста се движи и може интуитивно да знаеме дека звукот што го слушаме мора да доаѓа од таа личност.
Мета АИ работи на нов систем за дијалог АИ, а тоа е да се научи АИ да научи да препознава суптилни корелации помеѓу она што го гледа и слуша во разговорот.
VisualVoice учи на сличен начин како луѓето учат да совладаат нови вештини, овозможувајќи аудио-визуелно раздвојување на говорот со учење визуелни и аудитивни знаци од видеа што не се обележани.
За машините, ова создава подобра перцепција, додека човечката перцепција се подобрува.
Замислете да бидете во можност да учествувате на групни состаноци во метаверот со колегите од целиот свет, придружувајќи се на помали групни состаноци додека се движат низ виртуелниот простор, за време на кои звуците што се појавуваат и Тимбрес на местото на настанот, според околината соодветно се прилагодуваат.
Односно, може да добие информации за аудио, видео и текст во исто време и има побогат модел на разбирање на животната средина, дозволувајќи им на корисниците да имаат „многу WOW“ звучно искуство.
Време на објавување: јули-20-2022