Эксперты Института дистанционного образования Томского государственного университета (ТГУ) продемонстрировали, как технологии искусственного интеллекта могут анализировать визуальную информацию и принимать решения без доступа к исходному коду программ. Об этом рассказали в ходе открытого вебинара, посвященного современным методам компьютерного зрения.
В качестве демонстрационного примера специалисты использовали популярную головоломку «2048». По словам разработчиков, несмотря на простые правила, игра требует от алгоритма анализа большого количества вариантов развития событий и принятия решений в условиях неопределенности.
Руководитель онлайн-магистратуры ТГУ «Компьютерное зрение и искусственный интеллект», кандидат технических наук Артём Осинцев, а также модератор вебинара Вероника Диброва, эксперт программы «Искусственный интеллект и обработка естественного языка», показали процесс создания интеллектуального агента, способного самостоятельно распознавать игровое поле, анализировать ситуацию и выбирать оптимальные действия.
Как пояснили специалисты, сначала алгоритм определял расположение окна игры на экране компьютера, затем распознавал состояние игрового поля. Вместо традиционной технологии оптического распознавания символов (OCR) разработчики использовали более эффективный подход: система анализировала уникальные цвета игровых плиток, что позволило снизить вычислительную нагрузку и повысить точность определения их значений.
Для выбора оптимального хода применялся алгоритм поиска по дереву Монте-Карло, широко используемый при решении задач с элементами случайности. Такой подход позволяет оценивать вероятность различных сценариев и выбирать наиболее перспективную стратегию действий.
В результате интеллектуальный агент смог автономно достигать игровой цели — собирать плитку номиналом 2048, используя стратегию, основанную на последовательном накоплении крупных значений в одной области игрового поля.
По словам Артёма Осинцева, технологии, продемонстрированные на игровом примере, имеют широкий спектр практического применения. Уже с первого семестра студенты онлайн-магистратуры ТГУ используют методы компьютерного зрения при решении реальных задач, поставленных промышленными партнерами университета.
В частности, будущие специалисты разрабатывают решения для автоматической дефектоскопии на производстве, мониторинга транспортных потоков, биологической идентификации животных в естественной среде обитания, а также анализа медицинских изображений для поддержки принятия врачебных решений.
«Недостаточно просто писать код. Нужно учить машину видеть, анализировать визуальную информацию и принимать взвешенные решения в условиях неопределенности. Это фундаментальный навык, применимый далеко за пределами игровой индустрии», — отметил руководитель онлайн-магистратуры ТГУ «Компьютерное зрение и искусственный интеллект» Артём Осинцев.