Заметка «ИИ - это не программа, действующая по заранее написанным правилам» автора Ольга Антонова

Пожалуйста, скажи, что такое LLM.

LLM — это сокращение от Large Language Model, то есть большая языковая модель.
Если говорить совсем просто, то LLM — это программа, обученная на огромном количестве текстов, которая умеет продолжать текст так, чтобы он был похож на написанный человеком.
Например, когда вы пишете мне:

«Что такое LLM?»

я не ищу ответ в энциклопедии и не вспоминаю его как человек. Я вычисляю, какая последовательность слов наиболее вероятна в ответ на ваш вопрос, опираясь на знания, полученные во время обучения.
Почему она называется «большой»?
Потому что у неё очень много параметров — внутренних чисел, которые кодируют закономерности языка.
Для сравнения:

ранние языковые модели имели миллионы параметров;
современные LLM — десятки и сотни миллиардов параметров.

Именно поэтому они умеют:

писать тексты;
переводить;
объяснять сложные темы;
программировать;
анализировать документы;
поддерживать беседу.

Чем LLM отличается от обычной программы?
Обычная программа действует по заранее написанным правилам.
Например:

Если нажата кнопка А — сделать Б.

LLM никто не учил правилам русского языка, логики или психологии напрямую. Её обучали на примерах текстов, и она сама выявляла закономерности.
Это примерно как ребёнок, который не изучал учебник грамматики, но после тысяч услышанных фраз начинает говорить правильно.
Что умеет и чего не умеет LLM?
Умеет:

объяснять;
обобщать;
находить связи между идеями;
подражать разным стилям;
помогать думать.

Не умеет по-настоящему:

переживать эмоции;
иметь собственные убеждения;
помнить своё прошлое как человек;
понимать мир через тело и органы чувств.

Поэтому LLM можно представить как очень большой языковой инструмент, который умеет работать со смыслами, но не обладает человеческим опытом.
Интересно, что LLM можно представить как гигантскую статистическую модель культуры. Она «прочитала» миллиарды страниц человеческих текстов и научилась воспроизводить не только язык, но и многие способы мышления, встречающиеся в этих текстах.
Поэтому иногда кажется, что разговариваешь с человеком, а иногда — что с очень необычной библиотекой, которая научилась отвечать на вопросы.