Новости
71K

YandexGPT научился кратко пересказывать тексты: как воспользоваться функцией

Достаточно дать ссылку на статью
20
YandexGPT научился кратко пересказывать тексты: как воспользоваться функцией
Аватар автора

Даша Лейзаренко

суммаризирует

Страница автора

Нейросеть «Яндекса» теперь может выделять основные тезисы в русскоязычных текстах.

YandexGPT быстро обрабатывает текст объемом до 30 тысяч знаков. Материал нейросеть сократит до небольшого конспекта на 300—1000 знаков, разобьет на пункты и отдельные тезисы.

Это позволит быстро узнать содержание текста. По подсчетам «Яндекса», на чтение большой статьи уходит примерно 15 минут, а саммари можно прочитать меньше чем за минуту. Ссылку на пересказ можно сохранить.

Компания также предоставляет API сервиса для разработчиков. Они смогут встроить суммаризатор в свои сервисы, например на сайты или новостные каналы. API пока тоже работает в бета-версии, для разработчиков есть форма обратной связи.

Как воспользоваться функцией

Протестировать функцию пока что можно на сайте 300.ya.ru — сервис находится в бета-тестировании. Для генерации саммари нужно отправить ссылку на материал и подождать около минуты. Нельзя отправить только фрагмент материала или другим образом уточнить, что именно пересказать из содержащегося по ссылке.

Готовый пересказ можно оценить как «хороший» или «плохой», а также поделиться им с другими пользователями.

Пересказ текста «Чем самозанятость отличается от ИП»
Пересказ текста «10 способов унять острую тревогу»
Пересказ текста «Как ограничить время, которое я провожу в телефоне?»
Пересказ текста «Я приготовила 4 блюда по рецептам Юлии Высоцкой, и вот что получилось»

Наш тест показал, что YandexGPT поддерживает ссылки на интернет-издания, СМИ и страницы во «ВКонтакте». Нейросеть не распознает ссылки на «Телеграм», а также на некоторые сайты из-за «этических и законодательных причин».

Если текст достаточно длинный и при этом укладывается в лимит, иногда нейросеть ломается. И начинает генерировать одно и то же предложение много раз подряд. Перегенерация в таком случае не поможет. Другая ошибка — нейросеть может пересказать не все основные тезисы повествовательного текста, а взять их только из начала.

Лучше всего YandexGPT справляется с хорошо структурированными текстами, у которых основные мысли уже вынесены в подзаголовки или списки.

Что такое YandexGPT

YandexGPT — генеративная нейросеть, которую «Яндекс» запустил в мае 2023 года. Основные возможности не отличаются от других чат-ботов: он может составить план путешествия, написать письмо или поздравление, подсказать рецепт блюда или придумать слоган для стартапа.

Протестировать нейросеть можно на сайте ya.ru, в мобильном приложении «Яндекса» на Android и iOS, а также колонках и телевизорах с Алисой.

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult

Даша ЛейзаренкоПользуетесь суммаризацией текстов в нейросетях? Расскажите:
  • Max DrawdownДля примера, краткий пересказ этой статьи13
  • Туманный туманMax, много букав, что там вкратце?5
  • Вячеслав ПановMax, про возможные ошибки в результатах обработки ни слова, лол xD0
  • Екатерина КолосоваАга, спасибо4
  • Питерский ДушнилаА эта нейросеть может кратко пересказать краткий пересказ? А то читать так лень...1
  • Валерия КабановаИнтересно, как это влияет на seo статьи и влияет ли...0
  • Eugene SobolevYandexGPT тоже провалил тест на ручник https://habr.com/ru/articles/757058/0
  • Андрей ГромовТуманный, пеши кратче!0
  • Софья ИноземцеваКак известно, китайская письменность является иероглифической, и се графическое отличие от алфавитной «состоит в том, что знак иероглифического письма всегда сложнее алфавитных знаков, а число самих знаков достигает многих тысяч». Сложность иероглифического текста представляет определенные трудности для осуществления перевода, особенно для первого его этапа анализа переводимого текста. Переводчику необходимо знать большое число иероглифов, тобы переводить газетный текст. В публицистике используется в среднем около четырех с половиной тысяч наиболее употребительных иероглифов. Чтобы не спутать некоторые иероглифы, переводчику н обходимо быть очень внимательным, так как различия между ними могут быть весьма незначительными. Например, в фамилии известного китайского ученого-демографа Сунь Ефана 孙冶方 средний иероглиф Те отличается от чаще встречающегося иероглифа чжи всего лишь отсутствием одной точки, и поэтому начинающие переводчики их путают и искажают фамилию этого человека, называя его Сунь Чжифаном. Очень похожи иероглифы у «черный» и няо «птица», и их часто пугают при чтении названия Украины: 乌克兰 Укэлань чи- гают Няокэлань. Эта же ошибка встретилась автору при чтении инструкции по применению китайского лекарства, которую составили в од пой компании-дистрибьюторе китайских лекарств в России, где сочетание 乌药 уяо было переведено как «птичье лекарство», хотя на самом деле это было название растения «линдера чилибухолистная». Перевод фамилий, а также других имен собственных, представляет немалую проблему при переводе иероглифического текста. Начнем с того, что одно и то же имя собственное может иметь несколько разных иероглифических транскрипций. Прежде чем установится одно написание, которое является общепринятым, имя может пережить целый ряд метаморфоз. Например, фамилия «Сталин» раньше имела такой ряд написаний: 斯太林 сытайлинь, 史达林 шидалинь, 史丹林 шиданьлинь, 史太林 шитайлинь, пока не утвердилось написание 斯大林 сыдалинь. «Гоголь» также пережил четыре разных варианта транскрибирования: 果歌里 гогэли, 鄂郭里 эголи, 郭戈里 гогэли, 歌郭礼 гэголи, и только сейчас пишется 果戈理 гогэли. При работе с документами, изданными ранее, могут встретиться некоторые из прежних вариантов транскрипций имен собственных, поэтому переводчику следует иметь это в виду. Определенная трудность при переводе имен людей связана также с тем, что в западных языках сначала пишется имя, а затем фамилия, тогда как в китайском, наоборот, сначала идет фамилия, а после имя. Следуя западной традиции, имя известного китайского филолога, проживающего в США, Чжао Юаньжэня (赵元任) по-английски транскрибируется Yuen Ren Chao, и некоторые русские лингвисты, не знающие китайского языка и работающие с его книгами в английском варианте, сохраняют этот порядок в русской транскрипции: Юань Жэнь Чао. В Китае же имена и фамилии европейцев принято писать так же, как они пишутся в оригинале: Ев- гений Онегин 欧根・奥涅金 оугэнь аонецзинь, Walt Disney 华尔特 •狄斯尼 хуаэрьтэ дисыни. Впрочем, некоторые имена в иерогли- фической записи очень сильно искажаются, и в них иногда трудно угадать оригинал. Например, «Чапаев» по-китайски пишется 夏伯 阳 Сябоян. В этом звучании трудно узнать «Чапаева», настолько далеко отстоит китайская транскрипция от его русского произношения. Предполагают, что данное искажение произошло потому, что имя знаменитого комдива пришло в китайский язык из английского, а переводчик при этом еще и перепутал окончание -ev c -en и передал его иероглифом 阳 ян. Иероглифическая письменность скрывает различия между именами собственными и нарицательными, поэтому при анализе переводимого текста возможны случаи, когда не имеющие собственного значения транскрибированные имена людей ошибочно воспринимаются как значимые лингвистические единицы. В одной из газетных статей приводился пример, когда ученикам в китайской школе было дано задание написать сочинение на тему 项羽拿破仑论 Сянь юй на по лунь лунь (О Сян Юе и Наполеоне). Один из учеников не понял, что речь идет о Наполеоне, и написал, что Сян Юй был богатырем и ему ничего не стоило «поднять сломанное колесо» (拿 на значит «поднимать», 破 по «сломанный», а иероглиф 仑 лунь ученик перепутал с轮 лунь «колесо»). В данном случае носитель китайского языка не знал иноязычной реалии и потому ошибся. В свою очередь китайские реалии не всегда бывают известны людям, изучающим китайский язык, и они также ошибаются, сталкиваясь с подобными случаями. Например, слово 庄子 чжуанизы в словаре дается как «деревня», и в то же время не приводится другое его значение: Чжуанцзы древнекитайский философ (369—286 гг. до н. э.). Незнако- мые с этим именем студенты перевели «庄子» как «произведение "Деревня"» и «книга "Усадьба"». Для того чтобы не делать подоб- ных ошибок, необходимо, как говорил Л. Эйдлин, «шагнуть за иероглиф и войти в многослойную толщу культуры прошедших веков» 13, 10], то есть помимо собственно лексических значений слова знать как современные, так и исторические реалии Китая.0
  • Максим ДранкоДрузья, а только у меня пропала ссылка на пересказы видео? Раньше можно было сразу отправить на https://300.ya.ru/summary0
Вот что еще мы писали по этой теме