Мультимодальность, генеративный ИИ, AGI и Gemini: как эти термины связаны между собой и почему нейросети изменят Digital и другие сферы до неузнаваемости в ближайшие 20 лет

AffTimes 0 22 апреля, 2024

Искусственный интеллект в 2024 году — не только про тексты, картинки и дипфейки. Нейросети умеют оценивать риск беременности, а некоторые скоро отберут «хлеб» у программистов, копирайтеров, дизайнеров. По крайней мере так говорят многие эксперты и представители этих профессий. 

Рассказываем, к чему приготовиться обитателям диджитала и чем обернется развитие нейросетей по мнению Билла Гейтса, Сундара Пичаи и Демиса Хассабиса.

Мультимодальность, генеративный ИИ, AGI и Gemini: как эти термины связаны между собой и почему нейросети изменят Digital и другие сферы до неузнаваемости в ближайшие 20 лет

У ChatGPT и Copilot появился конкурент: что нового в мире нейросетей 

С 2022 года на рынке ИИ правили 2 чат-бота — ChatGPT и Microsoft Copilot. В основе обеих нейросетей лежит языковая модель Open AI. В 2024 году на сцену вышел Gemini от Google.

Как прогорел Bard от Google

Компания Google решила примкнуть к числу монополистов и выкатила своего чат-бота Bard в феврале 2023. Нейросеть презентовали, как более разговорную и мощную версию ChatGPT. На презентации в Париже Bard допустил ошибку, которую не простили ни критики, ни рядовые фанаты. ИИ заявил, что космическая обсерватория JWST впервые сфотографировала планету, находящуюся за пределами солнечной системы. Эксперты заметили, что первый подобный снимок сделали в 2004 году. «Дочка» компании Google, Alphabet потеряла $100 миллиардов, а ее акции подешевели на 9%.

Реанимация и ребрендинг: как Bard превратился в Gemini

Генеральный директор Google Inc, Сундар Пичаи заявил, что чат-бот Bard и ИИ-модель переименованы в Gemini. На момент написания статьи Google запустила 4-версии нейросети.

Gemini Ultra. Платная версия нейросети с расширенным функционалом, в ее основе лежит модель 1.0 Ultra. Доступ к модели открывается по подписке Advanced, которая стоит $20. По словам разработчиков, нейросеть умеет имитировать репетитора, пишет сложные коды и тексты. 

Gemini Pro. Базовая версия нейросети. 15 февраля 2024 года Google представила модель 1.5 Pro. Контекстное окно в обновленной версии расширилось до 1 миллиона токенов, а это в 8 раз больше, чем у ChatGPT 4 Turbo. Предполагается, что модель 1.5 Pro мощнее, чем 1.0 Ultra. Токен — единица измерения (слово, символ или картинка), на которые  разбивается промт. Чем больше токенов вмещает контекстное окно, тем точнее и полнее будет ответ.

Мультимодальность, генеративный ИИ, AGI и Gemini: как эти термины связаны между собой и почему нейросети изменят Digital и другие сферы до неузнаваемости в ближайшие 20 лет

Gemini Nano. Облегченная версия нейросети, которая предустановлена в смартфоны от Google. Она слабее, чем базовые и расширенные модели, но может работать автономно.

Gemma. Модель ИИ с открытым исходным кодом — «пластилин», из которого можно слепить свои нейросети для решения узкоспециализированных задач. Например, для рисования аниме-картинок или обучения персонала.

Мультимодальность, генеративный ИИ, AGI и Gemini: как эти термины связаны между собой и почему нейросети изменят Digital и другие сферы до неузнаваемости в ближайшие 20 лет

Gemini vs поисковики

Планируется, что ИИ интегрируют с Google Search на IOS. Кликать по ссылкам и пробираться сквозь рекламу больше не придется. На место привычного поиска придет диалог с чат-ботом — технология называется «генеративный поиск». 

«Gemini бросит вызов поисковикам, но не заменит их полностью»

Лиз Рид, вице-президент Google по поиску.  

Чтобы не повторить курьез с фактчекингом, Google работает над выстраиванием баланса между качеством, задержками и фактичностью в моделях Gemini.

Мультимодальность: что это такое и почему Gemini лучше, чем ChatGPT и Copilot

Gemini — мультимодальная нейросеть, которая «училась» через обработку текстов, изображений, аудио и кодов. В отличие от ChatGPT и других одномодальных сервисов, ИИ-модель от Google умеет отвечать голосом, картинками, а также обрабатывать аудио и графические промты. 

Одномодальная ИИ-модель заточена под конкретный формат контента, а мультимодальная под несколько.

Мультимодальность, генеративный ИИ, AGI и Gemini: как эти термины связаны между собой и почему нейросети изменят Digital и другие сферы до неузнаваемости в ближайшие 20 лет

«Мультимодальность это то, что отличает Gemini от “внутренностей” ChatGPT и Copilot» 

Сундар Пичаи, генеральный директор Alphabet.

Gemini — подобие человеческого мозга от мира нейросетей. Как и человек, ИИ-модель не застрахована от ошибок. Сундар Пичаи призывает не воспринимать ответы Gemini, как 100% истину.

Читать также:
Таргетинг по интересам в рекламной сети HillTopAds

Не только digital: в какие сферы скоро придут нейросети

Развитие нейросетей не остановится на текстах, картинках видео и поиске. 

В интервью изданию The Times Of India Билл Гейтс сказал, что ИИ поможет человечеству во многих областях:

  • фармацевтике;
  • дизайне;
  • медицине;
  • подготовке репетиторов и учителей;
  • программировании;
  • сельском хозяйстве.

В пример основатель компании Microsoft привел ультразвуковую ИИ-модель, которая умеет оценивать риск беременности — впервые нейросеть опробуют в Индии. 

«В ближайшие 20 лет наибольшие изменения произойдут в здравоохранении и образовании»  

основатель Microsoft, Билл Гейтс.

У всех ИИ-моделей хромает точность. Периодически нейросети выдумывают и искажают факты. Миллиардер заострил внимание на медицине, где ошибки недопустимы. Чтобы консультировать пациентов без врачей, планку точности нужно поднять до максимума. Развитие идет к тому, что ИИ будет накидывать варианты болезней, а доктор чекать факты — то же касается и других сфер.

AGI: когда его разработают, люди будут не нужны

Термин «AGI» появился на стыке 20 и 21 веков. Его сформулировал новозеландский ученый, Шейн Легг. В обиход понятие вошло после того, как была опубликована книга Бена Герцеля, «Artificial General Intelligence».

AGI — это общий искусственный интеллект, который сможет справляться с задачами не хуже или лучше человека — без его участия. В отличие от нынешних нейросетей, AGI будет заточен под решение широкого круга когнитивных задач.

Мультимодальность, генеративный ИИ, AGI и Gemini: как эти термины связаны между собой и почему нейросети изменят Digital и другие сферы до неузнаваемости в ближайшие 20 лет

Нынешние нейросети относят к категории слабых и узких ИИ. Они могут решать ограниченный спектр задач и только под руководством человека. 

Конкретных сроков создания общего искусственного интеллекта не называется. Предполагается, что ИИ-модели, приближенные к AGI, будут разработаны в следующем десятилетии. 

«Чтобы распознать AGI, придется провести тысячи тестов»

генеральный директор Google Deepmind, Демис Хассабис.

Помощник, вредитель или «человекозаменитель»: какие риски связаны с развитием ИИ

Польза нейросетей — спорный вопрос. Не факт, что ИИ остановится на «человекозамещении» в профессиональной деятельности.

Неготовность человечества к изменениям

Билл Гейтс считает, что нейросети — палка о двух концах. Одной «рукой» ИИ восполняет нехватку кадров, сокращает рабочую неделю и увеличивает производительность труда. Другой «рукой» провоцирует изменения в профессиональных сферах — не факт, что человечество к ним готово.

 «Люди умнее, но это не отменяет того факта, что ИИ может повысить эффективность»

основатель Microsoft, Билл Гейтс.

У искусственного интеллекта безграничный потенциал. Неизвестно, как быстро и до какого предела они будут развиваться. Человечеству придется пересмотреть свое отношение к работе и внести коррективы, чтобы подстроиться под новые реалии. В противном случае потенциал ИИ не раскроется на полную.

Порабощение человечества и другие экзистенциальные риски

Неконтролируемое развитие ИИ связано с рисками порабощения человечества, но они незначительны. Тостеры, смартфоны или компьютеры навряд ли начнут истреблять своих владельцев. 

«Рассчитать вероятность экзистенциальных рисков в процентах невозможно, но она не нулевая» 

генеральный директор Google Deepmind, Демис Хассабис.

Несмотря на минимальную вероятность катастрофы, Демис Хассабис считает, что факторы риска нужно оценить и быть готовым к непредвиденным сценариям.

Сосредоточение власти в одних руках

Если AGI не поработит человечество, это могут сделать люди в чьих руках окажется сильный ИИ. Против сосредоточения власти в одних руках играют сразу 2 фактора: 

  • конкуренция между разработчиками нейросетей;
  • ИИ-модели с открытым исходным кодом. 

Если бы заговор корпораций существовал, наверное нейросети не попали бы в руки рядовых обывателей. О несостоятельности теории говорит то, что с большинством нейросетей можно работать бесплатно.

Частичная замена человека

Если специалист открыт к креативному мышлению, ИИ не заменит его — творческий потенциал будет помножен на силу искусственного интеллекта. Адептам шаблонных решений, скорее всего, придется сменить работу. 

Когда нейросеть возьмет монотонные задачи на себя, социальные профессии будут ценится выше, чем сейчас. Эмпаты точно не останутся без работы.

Мультимодальность, генеративный ИИ, AGI и Gemini: как эти термины связаны между собой и почему нейросети изменят Digital и другие сферы до неузнаваемости в ближайшие 20 лет

Итог 

Демис Хассабис предполагает, что AGI позволит человечеству:

  • понять природу и законы физики;
  • заниматься экстремальными видами спорта;
  • путешествовать на звездолетах. 

Предсказать, как AGI изменит мир невозможно. Что ждет digital и другие сферы — вопрос времени, ответ на который человечество узнает в следующем десятилетии. Одно известно наверняка, специалистам с шаблонным мышлением не место в AGI-эпохе.

Последние посты

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь