16 терминов, чтобы лучше разбираться в нейросетях

Екатерина Лебедева

натуральный интеллект

Институт русского языка имени Пушкина признал словом 2023 года «нейросеть», а Кембриджский словарь — «галлюцинировать». Терминология из области ИИ действительно стала гораздо актуальнее и часто встречается в интернете.

В сети выложили красивую картинку, а в комментариях спрашивают, что за промпт? Друзья файнтюнят модель, а вы не знаете, на каком датасете? Объясняем главные термины, чтобы не теряться при обсуждении нейросетей.

🦾 Модель

Конкретная версия нейросети. Например, сервис ChatGPT работает на двух разных моделях: стандартной GPT-3.5 и более продвинутой GPT-4

🗄️ Датасет

Данные, на которых обучили модель, — набор текстов, изображений или видео. От датасета зависит результат, который выдает нейросеть. Если ее учили на аниме, она будет рисовать аниме. Чем больше датасет, тем лучше результат

🔍️ Генеративно-состязательная нейросеть, GAN

Состоит из двух частей: первая создает контент, а вторая сравнивает его с образцом и отбраковывает плохие генерации. Во время состязания обе части учатся лучше справляться со своей задачей

🖼︎ Диффузионная нейросеть

Создает изображения из случайного шума. Сначала нейросеть добавляет его к настоящим фото и делает их неразличимыми, а затем учится восстанавливать исходные картинки. После обучения она будет создавать уже уникальные изображения

💻 Искусственный интеллект, ИИ

Область связана с созданием программ, которые выполняют задачи аналогично человеческому интеллекту. Это более общее понятие, чем нейросеть: в одном ИИ их может быть несколько

🤖 Общий искусственный интеллект, AGI

«Узкие» ИИ выполняют конкретную задачу, тогда как общий искусственный интеллект может рассуждать, творить и воспринимать информацию на уровне человека. AGI — пока только теоретический концепт. Это что-то близкое к ИИ из фантастики, который умеет все

💬 ИИ-чат-бот

Программа, которая сама общается с пользователем в чате. У обычных чат-ботов за реплики отвечают более примитивные алгоритмы и прописанные фразы. А в основе ИИ-чат-ботов — нейросети. Продвинутые версии запоминают контекст разговора и имитируют эмоции

🖊️ Промпт

Запрос к нейросети — инструкция, где вы формулируете задачу и говорите, какой результат хотите получить. Например, текстовое описание картинки, которую нужно нарисовать

⚙️ Машинное и глубокое обучение нейросети

Машинное обучение — раздел ИИ, связанный с разработкой алгоритмов, которые позволяют компьютерам учиться на данных и принимать решения на их основе. Оно не ограничивается нейросетями. Глубокое обучение затрагивает сложные по структуре нейросети и большие объемы данных

➕ Веса и параметры

Показатели, которые нейросеть настраивает в процессе своего обучения. Они определяют то, с какой силой один вычислительный элемент влияет на другой, и иные нюансы их взаимодействия. Цель — приблизить результат нейросети к заданному эталонному

🔧 Файнтюнинг

Дополнительная настройка уже обученной модели на новом наборе данных, которую проводит ML-специалист. Например, чтобы адаптировать под свой стиль нейросеть, которая генерирует картинки. В процессе тюнинга модель сохраняет знания из общего датасета, но лучше разбирается в конкретной задаче

❓ Галлюцинации ИИ

Процесс, когда нейросеть глючит и с уверенным видом выдает бред. Галлюцинацией может быть выдуманный исторический факт, ошибка в вычислении, подмена понятий. Эту проблему пока не решили, так что ответы нейросетей стоит проверять

📄 Text-to-image, text-to-text и прочее

Способы взаимодействия с нейросетями. Первое слово — входные данные, то, что нейросети нужно от вас. Второе — выходные данные, то, чем она ответит. Например, вы пишете запрос текстом и по нему получаете изображение — это text-to-image

🧠 Мультимодальная нейросеть

Может обрабатывать разные типы данных: текст, изображения, звук, видео. Такие нейросети могут решать больше задач, например распознавать образы, отвечать на вопросы по картинке или на голосовое сообщение одновременно

🧩 Инпейнтинг и аутпейнтинг

При инпейнтинге нейросеть как бы дорисовывает картинку на основе существующей внутри ее границ. При аутпейнтинге, напротив, выходит за границы изображения. Обе технологии учитывают контекст — новые участки сочетаются с имеющимися

👀 Компьютерное зрение

Алгоритмы, которые обрабатывают визуальную информацию — например, с камер видеонаблюдения. Они распознают, что изображено на загруженных кадрах, и дальше работают с этой информацией: анализируют КТ-снимок или угрозы на дороге

👾 Больше о нейросетях

В нашей рассылке «Капча». Рассказываем, как пользоваться нейросетями и с их помощью экономить время на работе и в повседневной жизни

Подписываясь, вы принимаете условия передачи данных и политику конфиденциальности

Продолжить знакомство с нейросетями:

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult

интернет нейросети

Екатерина ЛебедеваКакие еще слова вам непонятны в новостях про ИИ?

МаксимВот вы все говорите, что это всё абсолютно безопасно. А будет такая кнопка выключения, чтобы в случае чего выключить AGI безвозвратно? Кажется, что сейчас доверия роботам больше, чем людям.0
Иван ДрагоМаксим, нет, никто не говорит что это безопасно, наоборот, сотни ведущих ML-специалистов пишут коллективные письма и даже книги об опасности AGI. Но все эти призывы - в пустоту, тоже самое, что "остановите изобретение ядерной бомбы!" На словах может и "остановят", а по факту удвоят бюджеты и скорость разработки. И да, кнопки выключения у AGI, разумеется, не будет.2
МаксимИван, нет, ну как никто. Даже тут мнение большинства в том, что опасность раздута и вообще всё новое воспринимается как угроза. Просто «Матрица» всё менее и менее с каждым годом кажется фантастическим фильмом.1
Иван ДрагоМаксим, "мнение большинства", как обычно, нерелевантно, на то оно и большинство. Логичнее интересоваться мнением тех, кто в теме, и вот специалисты как раз не на шутку встревожены. Да, шансы, что рванет в этом или следующем году невелики (но не равны нулю). Но общий тренд год-к-году вполне явный, и что будет уже через 5 лет - никто не знает. А значит есть уже вполне реальные риски...2
Катя ЛебедеваИван, строго говоря, из тезиса "никто не знает" не следует "есть уже вполне реальные риски". Именно потому, что никто не знает.1
KirillНу, не прошло и трех лет, как люди начали узнавать про нейросети) Хотя век ИИ уже лет 10, как идет1
Иван ДрагоКатя, Давайте не будем передергивать. "Никто не знает" не вообще, а конкретные сроки. Вот гора, на ней нанесло 20 метров снега. Снег начинает медленно ползти. Сойдет лавина через 20 секунд или через 5 минут - никто не знает. Но то, что она сойдет - совершенно очевидно.1
Иван ДрагоKirill, Век ИИ идет как минимум с 1956 года, и данная область успела пережить рождение, два бума и две "зимы"... С 2011 года идет нынешняя фаза Deep learning.1
Евгений БондаренкоХорошая статья, мне не хватило Питона и Кераса)2
Евгений МироновKirill, первые искусственные нейросети были созданы в 40-х годах 20-го века. Но они не нашли практического применения. Первые нейросети, которые нашли практическое применение, были созданы в 50-х годах 20-го века. Это были нейросети с архитектурой однослойного персептрона, с которой сейчас начинаются многие учебники по нейросетям для программистов. Такая нейросеть применялась для распознавания образов, в том числе и цифр индекса на почтовых конвертах. В конце 80-х годов у меня на компе была маленькая программа, которую можно было обучать распознавать искривленные и зашумленные буквы и искаженные геометрические фигуры. В эту программу была встроена нейросеть Хопфилда. Глубокое обучение было открыто в конце 80-х годов (в том числе и в СССР!). А что касается того прогресса в разработке нейросетей, который мы наблюдаем в последние 10 лет, то он связан с двумя причинами: 1. Появление Интернета и контента в нем. У разработчиков нейросетей датасеты выросли в миллионы и миллиарды раз. Они их просто стали скачивать из Интернета. Вместо того, чтобы 10 лет создавать тысячи фоток разных пород кошечек в разном окружении, теперь можно за неделю скачать миллионы фоток этих кошечек. 2. Майнинг криптовалют и разработка компьютерных игр с реалистичным дизайном привела к огромному прогрессу в разработке видеокарт. Обучение нейросетей хорошо распараллеливается на видеокартах, что приводит к ускорению обучения в тысячи раз.3
Катя ЛебедеваИван, неудачная метафора подобна котенку с дверцей. Откуда "совершенно очевидно", что AGI опасен, что это вообще лавина, а не солнечный свет, к примеру? Просто боязнь нового и неизвестного?0
zariа как можно использовать функцию живое фото0