16 терминов, чтобы лучше разбираться в нейро­сетях

12
Аватар автора

Екатерина Лебедева

натуральный интеллект

Страница автора

Институт русского языка имени Пушкина признал словом 2023 года «нейросеть», а Кембриджский словарь — «галлюцинировать». Терминология из области ИИ действительно стала гораздо актуальнее и часто встречается в интернете.

В сети выложили красивую картинку, а в комментариях спрашивают, что за промпт? Друзья файнтюнят модель, а вы не знаете, на каком датасете? Объясняем главные термины, чтобы не теряться при обсуждении нейросетей.

🦾 Модель

Конкретная версия нейросети. Например, сервис ChatGPT работает на двух разных моделях: стандартной GPT-3.5 и более продвинутой GPT-4

🗄️ Датасет

Данные, на которых обучили модель, — набор текстов, изображений или видео. От датасета зависит результат, который выдает нейросеть. Если ее учили на аниме, она будет рисовать аниме. Чем больше датасет, тем лучше результат

🔍️ Генеративно-состязательная нейросеть, GAN

Состоит из двух частей: первая создает контент, а вторая сравнивает его с образцом и отбраковывает плохие генерации. Во время состязания обе части учатся лучше справляться со своей задачей

🖼︎ Диффузионная нейросеть

Создает изображения из случайного шума. Сначала нейросеть добавляет его к настоящим фото и делает их неразличимыми, а затем учится восстанавливать исходные картинки. После обучения она будет создавать уже уникальные изображения

💻 Искусственный интеллект, ИИ

Область связана с созданием программ, которые выполняют задачи аналогично человеческому интеллекту. Это более общее понятие, чем нейросеть: в одном ИИ их может быть несколько

🤖 Общий искусственный интеллект, AGI

«Узкие» ИИ выполняют конкретную задачу, тогда как общий искусственный интеллект может рассуждать, творить и воспринимать информацию на уровне человека. AGI — пока только теоретический концепт. Это что-то близкое к ИИ из фантастики, который умеет все

💬 ИИ-чат-бот

Программа, которая сама общается с пользователем в чате. У обычных чат-ботов за реплики отвечают более примитивные алгоритмы и прописанные фразы. А в основе ИИ-чат-ботов — нейросети. Продвинутые версии запоминают контекст разговора и имитируют эмоции

🖊️ Промпт

Запрос к нейросети — инструкция, где вы формулируете задачу и говорите, какой результат хотите получить. Например, текстовое описание картинки, которую нужно нарисовать

⚙️ Машинное и глубокое обучение нейросети

Машинное обучение — раздел ИИ, связанный с разработкой алгоритмов, которые позволяют компьютерам учиться на данных и принимать решения на их основе. Оно не ограничивается нейросетями. Глубокое обучение затрагивает сложные по структуре нейросети и большие объемы данных

➕ Веса и параметры

Показатели, которые нейросеть настраивает в процессе своего обучения. Они определяют то, с какой силой один вычислительный элемент влияет на другой, и иные нюансы их взаимодействия. Цель — приблизить результат нейросети к заданному эталонному

🔧 Файнтюнинг

Дополнительная настройка уже обученной модели на новом наборе данных, которую проводит ML-специалист. Например, чтобы адаптировать под свой стиль нейросеть, которая генерирует картинки. В процессе тюнинга модель сохраняет знания из общего датасета, но лучше разбирается в конкретной задаче

❓ Галлюцинации ИИ

Процесс, когда нейросеть глючит и с уверенным видом выдает бред. Галлюцинацией может быть выдуманный исторический факт, ошибка в вычислении, подмена понятий. Эту проблему пока не решили, так что ответы нейросетей стоит проверять

📄 Text-to-image, text-to-text и прочее

Способы взаимодействия с нейросетями. Первое слово — входные данные, то, что нейросети нужно от вас. Второе — выходные данные, то, чем она ответит. Например, вы пишете запрос текстом и по нему получаете изображение — это text-to-image

🧠 Мультимодальная нейросеть

Может обрабатывать разные типы данных: текст, изображения, звук, видео. Такие нейросети могут решать больше задач, например распознавать образы, отвечать на вопросы по картинке или на голосовое сообщение одновременно

🧩 Инпейнтинг и аутпейнтинг

При инпейнтинге нейросеть как бы дорисовывает картинку на основе существующей внутри ее границ. При аутпейнтинге, напротив, выходит за границы изображения. Обе технологии учитывают контекст — новые участки сочетаются с имеющимися

👀 Компьютерное зрение

Алгоритмы, которые обрабатывают визуальную информацию — например, с камер видеонаблюдения. Они распознают, что изображено на загруженных кадрах, и дальше работают с этой информацией: анализируют КТ-снимок или угрозы на дороге

👾 Больше о нейросетях

В нашей рассылке «Капча». Рассказываем, как пользоваться нейросетями и с их помощью экономить время на работе и в повседневной жизни

Продолжить знакомство с нейросетями:

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult

Екатерина ЛебедеваКакие еще слова вам непонятны в новостях про ИИ?
  • МаксимВот вы все говорите, что это всё абсолютно безопасно. А будет такая кнопка выключения, чтобы в случае чего выключить AGI безвозвратно? Кажется, что сейчас доверия роботам больше, чем людям.0
  • Иван ДрагоМаксим, нет, никто не говорит что это безопасно, наоборот, сотни ведущих ML-специалистов пишут коллективные письма и даже книги об опасности AGI. Но все эти призывы - в пустоту, тоже самое, что "остановите изобретение ядерной бомбы!" На словах может и "остановят", а по факту удвоят бюджеты и скорость разработки. И да, кнопки выключения у AGI, разумеется, не будет.2
  • МаксимИван, нет, ну как никто. Даже тут мнение большинства в том, что опасность раздута и вообще всё новое воспринимается как угроза. Просто «Матрица» всё менее и менее с каждым годом кажется фантастическим фильмом.1
  • Иван ДрагоМаксим, "мнение большинства", как обычно, нерелевантно, на то оно и большинство. Логичнее интересоваться мнением тех, кто в теме, и вот специалисты как раз не на шутку встревожены. Да, шансы, что рванет в этом или следующем году невелики (но не равны нулю). Но общий тренд год-к-году вполне явный, и что будет уже через 5 лет - никто не знает. А значит есть уже вполне реальные риски...2
  • Катя ЛебедеваИван, строго говоря, из тезиса "никто не знает" не следует "есть уже вполне реальные риски". Именно потому, что никто не знает.1
  • KirillНу, не прошло и трех лет, как люди начали узнавать про нейросети) Хотя век ИИ уже лет 10, как идет1
  • Иван ДрагоКатя, Давайте не будем передергивать. "Никто не знает" не вообще, а конкретные сроки. Вот гора, на ней нанесло 20 метров снега. Снег начинает медленно ползти. Сойдет лавина через 20 секунд или через 5 минут - никто не знает. Но то, что она сойдет - совершенно очевидно.1
  • Иван ДрагоKirill, Век ИИ идет как минимум с 1956 года, и данная область успела пережить рождение, два бума и две "зимы"... С 2011 года идет нынешняя фаза Deep learning.1
  • Евгений БондаренкоХорошая статья, мне не хватило Питона и Кераса)2
  • Евгений МироновKirill, первые искусственные нейросети были созданы в 40-х годах 20-го века. Но они не нашли практического применения. Первые нейросети, которые нашли практическое применение, были созданы в 50-х годах 20-го века. Это были нейросети с архитектурой однослойного персептрона, с которой сейчас начинаются многие учебники по нейросетям для программистов. Такая нейросеть применялась для распознавания образов, в том числе и цифр индекса на почтовых конвертах. В конце 80-х годов у меня на компе была маленькая программа, которую можно было обучать распознавать искривленные и зашумленные буквы и искаженные геометрические фигуры. В эту программу была встроена нейросеть Хопфилда. Глубокое обучение было открыто в конце 80-х годов (в том числе и в СССР!). А что касается того прогресса в разработке нейросетей, который мы наблюдаем в последние 10 лет, то он связан с двумя причинами: 1. Появление Интернета и контента в нем. У разработчиков нейросетей датасеты выросли в миллионы и миллиарды раз. Они их просто стали скачивать из Интернета. Вместо того, чтобы 10 лет создавать тысячи фоток разных пород кошечек в разном окружении, теперь можно за неделю скачать миллионы фоток этих кошечек. 2. Майнинг криптовалют и разработка компьютерных игр с реалистичным дизайном привела к огромному прогрессу в разработке видеокарт. Обучение нейросетей хорошо распараллеливается на видеокартах, что приводит к ускорению обучения в тысячи раз.3
  • Катя ЛебедеваИван, неудачная метафора подобна котенку с дверцей. Откуда "совершенно очевидно", что AGI опасен, что это вообще лавина, а не солнечный свет, к примеру? Просто боязнь нового и неизвестного?0
  • zariа как можно использовать функцию живое фото0