Новият езиков модел с лекота може да превърне мислите ви в текст!

Помислете за думите, които се въртят в главата ви: онази безвкусна шега, която мъдро запазихте за себе си по време на вечеря; неизказаното ви впечатление за новия партньор на най-добрия ви приятел. А сега си представете, че някой може да ви слуша.

В понеделник учени от Тексаския университет в Остин направиха още една крачка в тази посока. В проучване изследователите описват изкуствен интелект, който може да превежда личните мисли на хората чрез анализ на сканирането на fMRI, което измерва притока на кръв към различни области на мозъка.

Изследователите вече са разработили методи за декодиране на езика, за да уловят опитите за говорене на хора, които са загубили способността си да говорят, и да позволят на парализирани хора да пишат, докато само мислят за писане. Но новият декодер на езика е един от първите, които не разчитат на импланти. В проучването той е в състояние да превърне въображаемата реч на човек в действителна реч, а когато на изследваните лица са показвани неми филми, той може да генерира сравнително точни описания на случващото се на екрана.

“Това не е просто езиков стимул”, казва Александър Хут, невролог от университета, който е помогнал за провеждането на изследването. “Достигаме до значение, нещо свързано с идеята за това, което се случва. И фактът, че това е възможно, е много вълнуващ.”

Проучването е съсредоточено върху трима участници, които идват в лабораторията на д-р Хът в продължение на 16 часа в продължение на няколко дни, за да слушат “Молецът” и други повествователни подкастове. Докато слушали, скенер за ядрено-магнитен резонанс записвал нивата на насищане с кислород на части от мозъка им. След това изследователите използваха голям езиков модел, за да съпоставят моделите в мозъчната активност с думите и фразите, които участниците са чули.

Големи езикови модели като GPT-4 на OpenAI и Bard на Google се обучават върху огромни количества писмени текстове, за да предскажат следващата дума в изречение или фраза. В процеса на работа моделите създават карти, които показват как думите се отнасят една към друга. Преди няколко години д-р Хът забеляза, че определени части от тези карти – т.нар. контекстни вграждания, които отразяват семантичните характеристики или значенията на фразите – могат да се използват за предсказване на начина, по който мозъкът се активира в отговор на езика.

В основни линии, казва Шинджи Нишимото, невролог от университета в Осака, който не е участвал в изследването, “мозъчната дейност е вид кодиран сигнал, а езиковите модели предоставят начини за неговото дешифриране”.

В своето изследване д-р Хът и колегите му ефективно обръщат процеса, като използват друг изкуствен интелект, за да преведат изображенията от fMRI на участниците в думи и фрази. Изследователите тестват декодера, като карат участниците да слушат нови записи, след което проверяват доколко преводът съответства на действителния запис.

Участниците също така можеха да закрият вътрешните си монолози, като заблуждават дешифратора, мислейки за други неща. Изкуственият интелект може би ще може да чете мислите ни, но засега ще трябва да ги чете една по една и с наше разрешение.