Нобелевская премия по физике 2024 года достается двум исследователям искусственного интеллекта, которым человечество обязано основами искусственного интеллекта, такими как ChatGPT, Gemini и Co, сообщает сайт Nobelprize. org.
Американский физик Джон Хопфилд (John Hopfield) в 1982 году первым разработал метод, с помощью которого нейронные сети могут хранить и обрабатывать информацию. Британский физик Джеффри Хинтон (Geoffrey Hinton) разработал вероятностную систему, которая позволила создать генеративные системы искусственного интеллекта.
В последние годы искусственный интеллект добился быстрого прогресса и произвел революцию во многих аспектах нашей жизни и работы. Генераторы текста и изображений, как ChatGPT, Gemini или Claude, теперь решают многие задачи лучше людей, и проявляют креативность, дипломатические способности и даже искусство лгать.
Все эти системы искусственного интеллекта основаны на нейронных сетях — сетевых системах, в которых вычислительные узлы соединены между собой на нескольких уровнях. Как и в случае с нейронными связями в нашем мозгу, каждая связь, приводящая к правильному решению, в процессе обучения имеет огромный вес — учит Сеть.
Однако искусственная нейронная сеть оптимизирует не синапсы и функциональные нервные пути, а скорее пути прохождения сигналов и корреляции между входными и выходными данными. Система Хопфилда была основана на его предыдущих исследованиях магнитного спина частиц и их поведения в коллективных системах.
Второй лауреат, пионер искусственного интеллекта Джеффри Хинтон, еще больше расширил нейронную сеть Хопфилда и добавил важнейшую возможность: работу на основе вероятностей. Хинтон использовал принцип, основанный на открытиях австрийского физика Людвига Больцмана (Ludwig Boltzmann), известного своим кинетическим уравнением, в котором он описал, что в зависимости от уровня энергии одни состояния более вероятны, чем другие.
Используя это уравнение, Хинтон разработал сетевую систему, названную "машиной Больцмана", которая состоит из нескольких слоев и двух разных типов узлов.
"В отличие от модели Хопфилда, машина Больцмана фокусируется на статистическом распределении закономерностей", — поясняет Нобелевский комитет.
Так называемые "видимые узлы" обрабатывают изучаемую информацию, а уровень "скрытых узлов" помогает адаптировать структуру сети, а также распознавать необученные закономерности на основе вероятности.
Даже сегодня производные от первых машин Больцмана используются как часть более крупных нейронных сетей. Они работают, например, когда потоковый сервис рекомендует новые сериалы и фильмы, соответствующие нашим предпочтениям, или когда интернет-магазины рекомендуют нам товары.