Технологията, която беше тествана с четирима души, все още е в начален стадий, но един ден може да помогне на хората да общуват или да декодират сънища, казват изследователите.
Въпреки, че звучи като нещо от научнофантастичен роман, изследователите успешно са обучили система с изкуствен интелект да пресъздава изображения, които хората са гледали въз основа на мозъчните си сканирания. A.I. генерирани снимки на обекти, включително плюшено мече, часовникова кула и самолет, след като участниците са гледали подобни изображения.
„Точността на този нов метод е впечатляваща“, казва Айрис Гроен, невролог от университета в Амстердам, която не е участвала в изследването, пред Камал Нахас от Science.
Все още технологията далеч не е готова за обществена употреба, но изследователите казват, че някой ден може да се окаже полезна за разбирането на случващото се в умовете на хората. След като учените усъвършенстват концепцията малко повече, лекарите евентуално могат да я използват, за да помогнат на хората, като тези, страдащи от парализа, да общуват. Може също да помогне на невролозите да тълкуват сънища или дори да разберат как другите видове възприемат света около тях.
Изследователите от университета в Осака в Япония са сред учените, използващи A.I. за да осмислим сканирането на човешкия мозък. Техният подход към това обаче е първият, който използва генератора на текст към изображение Stable Diffusion, който дойде на бързо развиващия се A.I., излязъл през август 2022 г. Техният модел също е много по-прост, изискващ само хиляди, вместо милиони, параметри или стойности, научени по време на обучение.
Екипът сподели повече подробности в нова статия, която не е била рецензирана, публикувана на сървъра за предпечат bioRxiv. Те също планират да представят откритията си на предстояща конференция за компютърно зрение, според Science.
И така, как работи всичко? Обикновено потребителят въвежда дума или фраза, която Stable Diffusion — или други подобни технологии, като DALL-E 2 и Midjourney — трансформира в изображение. Този процес работи, защото A.I. технологиите са проучили много съществуващи изображения и придружаващите ги текстови надписи – с течение на времето това обучение позволява на технологията да идентифицира модели, които след това може да пресъздаде въз основа на подкана.
Изследователите направиха това обучение с една крачка напред, като преподаваха A.I. модел за свързване на данни от функционален магнитен резонанс (fMRI) с изображения. По-конкретно, изследователите са използвали fMRI сканиранията на четирима участници, които са разгледали 10 000 различни изображения на хора, пейзажи и предмети като част от по-ранно, несвързано проучване. Те също така обучиха втори A.I. модел за свързване на мозъчната активност в данните от fMRI с текстови описания на снимките, които участниците в проучването са гледали.
Заедно тези два модела позволиха на Stable Diffusion да превърнат fMRI данните в относително точни имитации на изображения, които не са част от A.I. тренировъчния комплект. Въз основа на мозъчните сканирания, първият модел може да пресъздаде перспективата и оформлението, които участникът е видял, но генерираните от него изображения са с мътни и неспецифични фигури. Но тогава се включва вторият модел и той можеше да разпознае какъв обект гледат хората, използвайки текстовите описания от изображенията за обучение. Така че, ако получи мозъчно сканиране, което прилича на това от обучението му, маркирано като човек, който гледа самолет, то ще постави самолет в генерираното изображение, следвайки перспективата от първия модел. Технологията постига приблизително 80 процента точност.
Наистина, пресъздадените изображения изглеждат зловещо подобни на оригиналите, макар и с някои забележими разлики. Генерираната от A.I.версия на локомотив, например, е обвита в мътна сива мъгла, вместо да показва веселото, ярко синьо небе на действителното изображение. И изображението на A.I. на часовникова кула изглежда по-скоро като абстрактно произведение на изкуството, отколкото като действителна снимка на такова.
Технологията е обещаваща, но все още има някои ограничения. Тя може само да пресъздава изображения на обекти, включени в учебния му материал. И тъй като A.I. обработи мозъчната активност само на четирима души, разширяването й, за да включи и други, би изисквало обучение на модела върху мозъчните сканирания на всеки нов индивид – скъп и отнемащ време процес. Като такава, технологията няма вероятност да стане широко достъпна за обществеността - поне в сегашната си форма.
„Това изобщо не е практично за ежедневна употреба“, казва Сикун Лин, компютърен учен от Калифорнийския университет в Санта Барбара, който не е участвал в проекта, пред Кариса Уонг от New Scientist.
Намалявайки мащаба, хората имат по-широки притеснения около ИИ технологии като цяло. Дали те крадат от хората на изкуството или нарушават законите за авторското право? Ще направят ли полицията по-предубедена към определени групи хора, ще допринесат ли за дезинформация или ще нахлуят в личния ни живот? Инженерите и етиците все още се борят с тези и много други въпроси и тези дискусии вероятно ще продължат в обозримо бъдеще, дори когато учените измислят нови — и потенциално полезни — начини за използване на ИИ.
„Когато става въпрос за много мощни технологии – и очевидно A.I. ще бъде един от най-мощните досега – трябва да внимаваме“, каза Демис Хасабис, главен изпълнителен директор на A.I. изследователската лаборатория DeepMind, на Били Периго от списание Time миналата година. „Това са експериментатори, много от които не осъзнават, че държат опасен материал.“