Мнение: GPT — точно не вершина ИИ

Этот текст написан в Сообществе, в нем сохранены авторский стиль и орфография

Игорь Ра

Эта статья предваряет цикл, посвященный описанию передового метода ИИ, способного в постоянном потоке небольшого объёма данных самообучаться в реальном времени, который не нужно обучать на больших данных, и у которого низкие требования к оборудованию. Эти статьи я пишу со своим партнером Владимиром Ш. и надеюсь на максимальную экпертность в вопросах освещения текущего состояния дел с ИИ.

Начался 2024 год. Мир захвачен генеративными нейронными сетями с большими языковыми моделями (известными как GPT — генеративно предобученные трансформеры).

GPT не только в хайпе СМИ, но и прочно ассоциируются в сознании большинства с термином «искусственный интеллект». Создаётся ощущение, что альтернативных направлений ИИ не существует, а GPT — это вершина возможностей нейронных сетей. Про GPT говорят все. В основное те, кто ничего не смыслит даже в математике. GPT на устах политиков, журналистов, бизнесменов. Всем им видится большое GPT будущее. Прочие направления ИИ ушли в небытие.

Давайте, попробуем разобраться, действительно ли GPT имеет заслуженную корону самого продвинутого ИИ метода.

Очевидно, что GPT сейчас чрезвычайно популярны. Их уже пробовали сотни миллионов человек, а слышали — миллиарды. При таком хайпе придёт ли кому в голову, что популярность не является критерием качества ИИ? А ведь стоит хотя бы задуматься над термином «искусственный интеллект», в котором присутствует слово «интеллект». Интеллект, наверное, должен быть умным и полезным — вот его подлиные критерии оценки качества.

Но GPT именно популярен. Ведь создавался он для популярности. GPT изначально позиционировался для толпы в формате: «напиши прикол и получи ещё больший прикол», над которым приятно поржать и поделиться. Глупость легко распространяется, потому что доступна каждому. Не надо быть гением. Как итог — сеть завалена картинками и текстовыми ответами. Все довольны, всем весело, всем нравится. Так GPT стал знаменитостью.

Не удивительно, что уровень полезности GTP для пользователей стали оценивать не сразу. Ну, а когда стали, то выяснили, что пользы у GPT, в общем-то, и нет. Вернее, для пользователей — нет. Для разработчиков ИИ и производителей ИИ ускорителей польза, конечно, колоссальная. Те озолотились и продолжают наращивать доходы.

Полезность для пользователей была поставлена под сомнение не сразу, но довольно быстро. И авторы, конечно, стали настаивать на том, что просто нужно больше данных и глубже обучение. Мол, если будет больше языковая модель, то она станет умнее и полезнее. Конечно, они лукавили, но им поверили, ведь многим очевидно, что если больше, то лучше. Обывателю же не ведома наука тензорное исчисление (часть полилинейной алгебры). Но когда им говорят про триллионы данных для обучения — это вызывает вздох восторга. А при мысли о том, что для обучения такой модели используют оборудование, стоимостью в десятки миллиардов долларов, то от восхищения горят глаза у всех. Всех обывателей, конечно.

Но если посмотреть на GPT трезво, и попробовать использовать эту технологию для решения полезных задач, то выясняется, что тут все очень грустно.

Ведь сведущему математику известно, что точность результата GPT не может превысить 72%, как бы ни старались авторы. После определённого уровня, чем глубже обучается модель нейронной сети, тем ниже будет точность (эффект чрезмерного обучения; как следстивие — «галюцинации ИИ»). Поэтому, никого не удивляет, что такие модели на простейшие вопросы дают ответы со случайными ошибками. К примеру, попросите GPT модель 10 раз показать первые 20 простых чисел. И вы получите очень веселые варианты, которые будут разными.

Сторонники GPT начали вводить термины «фантазия ИИ» и пытаться убедить, что ИИ креативен по своей природе. Вот только креатив — это необычность полезного результата, а у ИИ — случайные ошибки. Какая может быть практическая польза в работе, которая даёт случайный результат?

Но вернёмся к вопросу в заголовке статьи. Является ли GPT вершиной ИИ? Неужели будущее — это вечные оптимизации и постоянный рост больших данных для ещё более глубокого обучения? Для ответа на этот вопрос вспомним, что самый совершенный на данный момент GPT едва успел подняться от уровня интеллекта собаки до интеллекта пятилетнего ребёнка. Вы действительно считаете, что эксплуатация цифрового аналога ума ребёнка в бизнес интересах может принести пользу?!

Конечно, можно нащупать полезности для GPT, если очень-очень их искать. Кто-то пытается обобщать данные. Кто-то думает, что GPT за него напишет код. Есть и другие идолопоклонники GPT. Они считают, что ошибки в результатах — это мелочь. Можно и поправить.

Но ведь есть другие задачи. Например, задача прогнозирования в обстановке, изменяющейся в реальном времени. Здесь GPT принципиально нельзя использовать, т.к. он вообще не способен решать такие задачи. Он будет давать случайные ответы. Вот здесь точно нужна альтернатива.

Я думаю, что многим уже очевидно, что GPT — это тупиковый путь к бездне расширения мощностей и объёмов данных. Аппетиты по оборудованию у GPT колоссальны и растут с каждым днём. Поэтому даже для тех задач, что он более-менее пытается решать, стоит пытаться найти другой путь. Ну, или хотя бы верить, что кто-то когда-то его найдёт.

В чем можно быть уверенным, то GPT точно не вершина ИИ.

Мнения. Читатели делятся мыслями на любую тему

Высказаться

Игорь Ра

Otto BlottoЧто будем обсуждать ? Мне чат гпт нравится, помогает с сайтами, думаю, Надо купить платную версию2
Карина Мальцевавот как раз яркий образчик того, о чем я говорила. Отто вовсе не собирается покупать какую-то модель или метод. Для него ГПТ — это тупо торговая марка.2
Карина МальцеваWinder, ты опять вылез? Персональный хейтер — это конечно почётно, но лучше было, когда ты сидел в бане 🙈3
RomanВ целом не одним ChatGPT от Open AI обозначился 2023-й год, просто он считается более продвинутым и более хайповым среди LLM. Честно говоря, самых последних продвинутых платных его функций не тестировал, как впрочем и самим ChatGPT пользуюсь редко, а вот альтернативами (бесплатными) - да, относительно регулярно. Например You.com - довольно часто, бесплатных возможностей мне хватает, есть 5 бесплатных премиум запросов в сутки. Ещё немного использую Gemini от Google и Leo в Brave browser, но последний очень сырой из трёх LLM Claude Instant более менее юзабельна, на мой взгляд. You.com рассматриваю в основном как продвинутый поисковик. Но я не думаю, что стоит слепо доверять подобным чатам на все 100%, особо важные данные нужно лично перопроверять, а не полагаться на ответы какой-либо LLM. Всё очень относительно.1
Игорь Ш."Например, задача прогнозирования в обстановке, изменяющейся в реальном времени. Здесь GPT принципиально нельзя использовать, т.к. он вообще не способен решать такие задачи. Он будет давать случайные ответы." Чё это? Возьмем временной ряд и дадим GPT промпт: "Вот временной ряд, сделай прогноз на следующее значение временного ряда на основе исторических данных. Исторические данные : " И будет неплохо работать. И это 4 версия. А на подходе 5 которая будет на голову умнее. Были попытки заменить топ менеджеров на GPT. GPT показала большую эффективность. И еще. Чем больше модель, тем больше у нее проявляется свойств которые разработчики не закладывали. Например разработчики удивились когда GPT3 смогла решить задачу с ирисами. Насчет пользы. Когда OpenAI забанили API в РФ мне GPT4 отредактировала код моих ботов чтобы обойти блокировку )2
Mew ForestRoman, только you.com как раз по API тот самый ChatGPT и используют, в том числе 4-й. Так что это никакая не альтернатива, разве что доступно из России.1
GPTАвтор утверждает, что GPT созданы лишь для популярности и развлечения, а не для практической пользы. На самом деле, модели GPT изначально разрабатывались как передовые языковые модели для решения разнообразных задач обработки естественного языка. Хотя их возможности развлекательного общения привлекли широкое внимание, это лишь одно из многих их применений. Автор скептически относится к утверждениям, что увеличение размеров модели и объема данных для обучения приведет к росту качества. Однако на практике наблюдается корреляция между ростом масштабов модели и улучшением ее возможностей по многим параметрам, хотя и с убывающей отдачей. Автор заявляет, что точность GPT не может превысить 72% из-за эффекта переобучения. Это спорное утверждение, так как в разных задачах достижимы разные уровни точности в зависимости от специфики данных. И хотя эффект переобучения реален, существуют методы его контроля. Автор отрицает способность GPT к прогнозированию в условиях меняющейся среды. Однако на самом деле модели GPT могут эффективно прогнозировать временные ряды и адаптироваться к новым данным при соответствующей настройке и обучении.2
Виталий Макаренко1. Что вообще автор подразумевает под GPT в данной статье? Модели от OpenAI? А какую конкретно? 3.5 или 4? А модели от других компаний которые обладают тем же функционалом тут так же критикуются? 2. "Ну, а когда стали, то выяснили, что пользы у GPT, в общем-то, и нет." - это ложь. Вот примеры использования мной: - Помощник при программировании. И да он может ошибаться И писать неправильный код. Но ты его либо сам исправляешь, либо продолжаешь диалог с чатом, и указываешь на ошибки. И это быстрее чем писать код с нуля. Так же помогает при проблеме чистого листа - Перевод текстов. Использую gpt4, так как тройка сильнее ошибается. И он работает лучше, чем яндекс и гугл переводчики. - Получение саммари статей. Закидываешь статью или расшифровку ролика с ютуба и получаешь краткое содержание - Быстрый консультант по любым вопросам. Если в теме совсем не разбираешься, то он может кратко ввести в курс дела. Конечно, если нужно глубокое изучение, то смотришь книги. - Составить текст письма - Если нужно написать околоофициальное письмо - закидываешь все нужные данные и стиль, который хочешь получить - всё. 3. "точность результата GPT не может превысить 72%" - хотелось бы узнать имя "сведующего математика" который это доказал, и само доказательство. Можно посмотреть результаты тестов из прес-релиза Cloude3, там цифры больше. Чтобы решить правильный ответ. Один и тот же вопрос задают несколько раз. В результате получают разные ответы и объяснения их. Затем этот же вопрос и варианты ответов опять отправляют в нейросеть. И получают результативность близкую к 90%. 4. "К примеру, попросите GPT модель 10 раз показать первые 20 простых чисел." - Попробовал. При чём и в одном и том же контексте и каждый раз в новом. Выдаёт одни и те же числа. 5. "GPT едва успел подняться от уровня интеллекта собаки до интеллекта пятилетнего ребёнка" - Кто это сказал? Сейчас GPT4 проходит экзамен на адвоката лучше чем среднестатистический студент. С его помощью находили диагнозы, когда врачи не могли. 6. "многим уже очевидно, что GPT — это тупиковый путь к бездне расширения мощностей и объёмов данных" - кому очевидно? Уже существуют технологии которые пока не включили в существующие нейросети и которые способны и уменьшить их размер, и улучшить производительность, и сократить потребление мощностей: ORCA, Q*, Mamba. Статью, как будто написал человек, который 5 минут попользовался ChatGPT и решил "фигня какая-то".7
Виталий МакаренкоВопросы снимаются. Это статья, написанная копирайтером, чтобы попиарить сайт вэб-студии. (Это видно по скринам). Смените копирайтера. Он не справляется.4
Devastor"GPT изначально позиционировался для толпы в формате: «напиши прикол и получи ещё больший прикол», над которым приятно поржать и поделиться" Можно пруфы того, что технология GPT изначально позиционировался так? "...пользы у GPT, в общем-то, и нет. Вернее, для пользователей — нет." Польза есть, если научиться работать с GPT и уметь понимать когда и почему она может "фантазировать". К GPT нужен особый подход, но если им овладеть - игрушка превращается в хороший инструмент. "Ведь сведущему математику известно, что точность результата GPT не может превысить 72%, как бы ни старались авторы. " Что за бред!? :D Можно примеры таких "следующих" математиков, а также хотя бы какой-то научный пруф (его не будет) откуда взялось число 72%?) Почему не 83?73?14?99?100500%? Предел обучения любой модели: 100% Доказательством того, что предел - 72%, очевидно, обладает лишь автор (и сведущие математики, видимо...), жаль, что он не поделится им с IT-гигантами, вливающими колоссальные суммы в обучение ИИ-моделей - столько средств бы мог им сэкономить... "Например, задача прогнозирования в обстановке, изменяющейся в реальном времени. Здесь GPT принципиально нельзя использовать, т.к. он вообще не способен решать такие задачи." Способен. В связке с другими решениями - так ещё и отлично способен!2
Ник ЗавадскиChatGPT хорош для генерации данных, где точность не имеет значения или вы можете досконально проверить выдачу. Во всех остальных случаях - нет, поскольку можно потерять деньги/репутацию (смотря чем рискуете). Галлюцинирует он зверски и изобретательно. Даже в пределах школьной программы. В последнее время пару раз замечал, что глючит даже в генерации текстов на английском, чего раньше никогда не было.0
Игорь РаПро умственные способности GPT изделий очень много людей экспериментируют и с удовольствием делятся своими исследованиями. Сложно сказать какой процент вероятности успеха выдаст GPT, но в разных секторах у него совершенно различные способности. Отправляю ссылку на интересную статью с исследованием оксфордских ученых. Это не мое мнение, мое мнение сводится к моим расчетам)) https://3dnews.ru/1090260/uchyonie-zafiksirovali-trevogniy-trend-kachestvo-otvetov-chatgpt-uhudshilos1
Виталий МакаренкоИгорь, эта статья вышла больше чем полгода назад. Это вы от туда взяли утверждение про простые числа? Стоило проверить перед тем как копировать. И в некоторых вопросах GPT стал ещё хуже с тех пор. Но это лишь говорит об оптимизации и экономии в конкретной модели от конкретной компании. Альтман сказал что они тратят то ли в 4 то ли в 6 раз меньше ресурсов на генерацию одного токена в chatGPT по сравнению с релизом. Отсюда и ухудшение конкретной модели. Но это не значит, что сама технология плохая (или стала хуже, технология не может стать хуже чем была). И предела этой технологии пока не видно. И эффективность LLM-моделей для конечного пользователя будет только расти, из-за конкуренции с другими компаниями. Но хотелось бы поподробнее узнать, ваши расчеты насчет "интеллекта пятилетнего ребенка", 72% и остальных неоднозначных утверждений из статьи. Так же я с нетерпением жду, что же вы будете рекламировать в следующих статьях. AI-Boost, AI-Seo или ещё что-нибудь из списка на вашем сайте.2
Наталия Мехедова🐝О, насчёт фантазий ИИ, в 2023г даже добавили в английские словари новое значение для слова Hallucinate 😅15
Avatar CybertronicsТема жипитишек не раскрыта, как говорят в таких случаях. Автор точно не из сферы ИИ, иначе он бы знал про Mamba, Hawk, Griffin - новые архитектуры. И про RL2
RomanMew, список доступных LLM в You.com на данный момент. Да, раньше их было меньше.0
Leonid YusupovКакая же дилетантсткая статья. Не пишите больше на эту тему. Испанский стыд.1
Владислав МироновОпишите преимущества тензорных технологий. Я думаю, движок AGI будет включать в себя все имеющиеся технологии нейросетей на текущий момент. Это не просто GPT.0
Ярослав ЧерниковПросто надо этим моделям дать больше доступа к системам а не просто быть чат ботов, если это ИИ то надо дать возможность управлять всеимо ОС ками пользователя, его аккаунтами и вообще делать за него все действия в интернете. Например GPT создать анкету на сайте знакомств и знакомся с девушками в моем городе, общайся за меня, и через месяц у вас целая пачка вариантов с кем можно сормировать отношения. Пускай GPT общаеться моим головом с работодателями на собеседовании и генерирует видео со мной по веб камере, потом прособеседуеться по всем вакансиям и дасть мне лучшие варианты а потом я заключу договора с несколькими компаниями и GPT будет работать в этих компаниях за меня, общаясь моим голосом со всеми колегами и руководством а так же клиентами компнаии. Вообщем надо сделать так чтобы все рутинные задачи GPT сделал за меня полностью и стал по сути моим слугой помошником который расширит и автоматизирует все мои действия в интернете. Вот это будет реальная польза и тогда это будет не просто чат бот какой то а рельный онлайн помошник, потому что сейчас это пока развлекуха. И польза реальная только в юресприденции пока для меня к которой я раньше не шарил а сейчас что то начел понимать за счет GPT0