LLM — это сокращение от Large Language Model, то есть большая языковая модель.
Если говорить совсем просто, то LLM — это программа, обученная на огромном количестве текстов, которая умеет продолжать текст так, чтобы он был похож на написанный человеком.
Например, когда вы пишете мне:
«Что такое LLM?»
я не ищу ответ в энциклопедии и не вспоминаю его как человек. Я вычисляю, какая последовательность слов наиболее вероятна в ответ на ваш вопрос, опираясь на знания, полученные во время обучения.
Почему она называется «большой»?
Потому что у неё очень много параметров — внутренних чисел, которые кодируют закономерности языка.
Для сравнения:
- ранние языковые модели имели миллионы параметров;
- современные LLM — десятки и сотни миллиардов параметров.
- писать тексты;
- переводить;
- объяснять сложные темы;
- программировать;
- анализировать документы;
- поддерживать беседу.
Обычная программа действует по заранее написанным правилам.
Например:
Если нажата кнопка А — сделать Б.
LLM никто не учил правилам русского языка, логики или психологии напрямую. Её обучали на примерах текстов, и она сама выявляла закономерности.
Это примерно как ребёнок, который не изучал учебник грамматики, но после тысяч услышанных фраз начинает говорить правильно.
Что умеет и чего не умеет LLM?
Умеет:
- объяснять;
- обобщать;
- находить связи между идеями;
- подражать разным стилям;
- помогать думать.
- переживать эмоции;
- иметь собственные убеждения;
- помнить своё прошлое как человек;
- понимать мир через тело и органы чувств.
Интересно, что LLM можно представить как гигантскую статистическую модель культуры. Она «прочитала» миллиарды страниц человеческих текстов и научилась воспроизводить не только язык, но и многие способы мышления, встречающиеся в этих текстах.
Поэтому иногда кажется, что разговариваешь с человеком, а иногда — что с очень необычной библиотекой, которая научилась отвечать на вопросы.

