Компания Dahua Technology, ведущий мировой поставщик решений и услуг AIoT, ориентированных на видео, запустила Xinghan Large-scale AI Models — систему искусственного интеллекта, которая объединяет крупномасштабный визуальный интеллект с мультимодальными и языковыми возможностями. Разработанная для решения сложных задач в реальных условиях, система Xinghan представляет собой важный шаг вперед в непрерывных инновациях Dahua, расширяя возможности интеллектуальной трансформации в различных секторах.
С миссией, позволяющей машинам по-настоящему понимать мир, система модели Xinghan продолжает развиваться, соединяя передовые исследования с реальными приложениями. Названная в честь китайского слова «галактика», модель Xinghan предоставляет матрицу возможностей полного стека, основанную на синергии периферийного облака, обеспечивая масштабируемый адаптивный интеллект в разных отраслях. Модернизированная архитектура Xinghan включает в себя три основных модельных ряда: L, V и M. Модель L-серии фокусируется на понимании и взаимодействии естественного языка, в то время как две других занимаются более конкретными применениями:
Визуальные модели Xinghan (Серия V), ориентированная на передовой визуальный интеллект и видеоаналитику, упрощает целевые категории, фокусируясь на ключевых целях (например, людях, автотранспортных средствах и немоторных транспортных средствах), чтобы уменьшить сложность модели при сохранении высокой точности.
Покрытие расширяется за счет точного определения целей меньшего размера (даже до 20×20 пикселей) по сравнению с традиционными моделями ИИ на основе CNN, уменьшения ложных тревог и увеличения дальности обнаружения камер больших моделей.
WizTracking предлагает интеллектуальный алгоритм отслеживания следующего поколения, который может обрабатывать сложные окклюзии и изменения в целевой позе, достигая 50% повышения точности.
Краудмэппинг значительно улучшает обнаружение малых целей на больших расстояниях (до 2 раз дальше) и имеет зонтичную компенсацию, повышая точность на 80% в дождливую погоду. Он также предлагает 2,5-кратное увеличение диапазона анализа, поддерживает обнаружение до 5000 человек и обеспечивает надежную производительность в плотных толпах и условиях низкой освещенности.
Адаптивный сценарий — AI WDR. Использует ситуационную осведомленность для анализа как пространственных, так и контекстуальных характеристик места, обеспечивая интеллектуальную и автоматизированную конфигурацию камеры.
AI Rule Assist. Предназначен для автоматического разграничения правил вторжения защиты периметра, предлагая доступ в один клик, высокоточное распознавание места, автоматический анализ и многое другое.
Мультимодальные модели (Серия M: мультимодальные модели Xinghan) — это передовые системы искусственного интеллекта, способные одновременно обрабатывать и глубоко интегрировать несколько разнородных типов данных (например, текст, изображения, аудио и видео). Это значительно повышает эффективность обработки информации, обеспечивает более естественное взаимодействие человека с компьютером и открывает более широкий спектр сценариев применения.