Большие языковые модели на практике: Понимание языка и генерация текстов

ISBN
978-601-12-6517-1
Количество страниц 416
Формат издания 165 x 233 мм
Печать Черно-белая

Джей Аламмар, Маартен Гроотендорст

Описание

Книга посвящена практическому использованию современных языковых моделей и методам работы с текстовыми данными. Рассматриваются ключевые принципы, лежащие в основе архитектуры трансформеров, а также способы применения предобученных моделей для генерации текста, аннотирования, классификации и семантического поиска. Подробно разобраны техники построения поисковых систем на базе векторных представлений, методы переранжирования, подходы к анализу и кластеризации документов, а также принципы использования генеративных моделей — от приемов работы с запросами до решений с дополненной выборкой (RAG). Особое внимание уделено практическим рекомендациям по созданию эффективных конвейеров LLM и оптимизации моделей под конкретные задачи с помощью современных методов обучения.

Для специалистов по ИИ, инженеров по данным, разработчиков, технических руководителей

В последние годы искусственный интеллект сделал заметный рывок в развитии языковых возможностей. Быстрый прогресс в области глубокого обучения привел к появлению моделей, которые умеют писать и понимать текст значительно лучше, чем прежде. Эти достижения уже позволяют создавать новые функции, продукты и даже целые отрасли. Благодаря наглядной подаче материала книга поможет читателю освоить практические инструменты и концепции, необходимые для использования таких технологий сегодня.

Из книги вы узнаете:

  • как применять предобученные большие языковые модели для задач копирайтинга и аннотирования;
  • как строить системы семантического поиска, выходящие за рамки простого сопоставления ключевых слов;
  • как использовать существующие библиотеки и модели для классификации, поиска и кластеризации текстов.

Книга объясняет:

  • как устроены трансформерные языковые модели, обеспечивающие высокое качество генерации и представления текста;
  • как создавать продвинутые конвейеры на базе больших языковых моделей (LLM) для кластеризации документов и исследования их тематического содержания;
  • как применять такие методы, как векторный поиск и переранжирование, чтобы строить семантические поисковые системы, не ограниченные поиском по ключевым словам;
  • как использовать генеративные модели — от техники составления запросов (промпт-инжиниринг) до генерации с дополненной выборкой (RAG);
  • как глубже разобраться с методами обучения LLM и способами их оптимизации для конкретных задач, используя дообучение генеративных моделей, сравнительное дообучение и контекстное обучение.