@ARTICLE{26583223_1110857380_2025, author = {А. С. Панфилова and Е. А. Валуева}, keywords = {, креативность, тест Урбана, диагностика креативности, CNN, XAIобъяснимый искусственный интеллект}, title = {Применение методов объяснимого ИИ к модели диагностики креативности по тесту Урбана (Форма В)}, journal = {Психология. Журнал Высшей школы экономики}, year = {2025}, volume = {22}, number = {4}, pages = {721-735}, url = {https://psy-journal.hse.ru/2025-22-4/1110857380.html}, publisher = {}, abstract = {В представленном исследовании разработаны и апробированы методы глубокого обучения для автоматической оценки креативности в невербальных тестах на примере теста Урбана (форма B). Для предсказания суммарного балла креативности на основе рисунков участников (n = 1138; возраст 6-20 лет) были дообучены семь предобученных архитектур: MobileNet V2, AlexNet, ResNet-18, ViT, EfficientNet V2, ResNeXt-101 и DenseNet-121. Данные были разбиты на обучающую (70%), валидационную (15%) и тестовую (15%) выборки, а изображения приводились к единому разрешению 1240 × 1600 px и подвергались случайным аугментациям (отражения, повороты, изменение контраста и насыщенности), затем нормализовывались по статистикам ImageNet. ResNet-18 продемонстрировала наивысшую точность предсказания (R² = 0.69) при исключении из общего балла критерия «Скорость», что сопоставимо с результатами для формы A, несмотря на уменьшение размера выборки и сужение диапазона баллов. Средняя абсолютная ошибка составила 0.52 балла (SD = 4.94), при этом в 70% случаев отклонение от экспертной оценки не превышало 5 баллов. Для анализа механизмов принятия решений моделей применялся метод Grad-CAM, который генерирует тепловые карты на основе градиентов последнего сверточного слоя. Качественный разбор показал, что модели выделяют завершенные элементы незавершенных фигур, соединительные линии, элементы за пределами рамки и подписи, что в целом совпадает с экспертными критериями. Вместе с тем обнаружены визуальные смещения: повторяющиеся элементы и плотная штриховка завышали оценки, тогда как некоторые выходы за рамку оставались незамеченными, приводя к недооценкам. Полученные результаты подтверждают потенциал глубокого обучения и XAI в диагностике креативности, а также указывают на необходимость дальнейшего развития специализированных тестов, методов сегментации и более продвинутых техник объяснимого искусственного интеллекта для повышения точности и надежности автоматизированной оценки.}, annote = {В представленном исследовании разработаны и апробированы методы глубокого обучения для автоматической оценки креативности в невербальных тестах на примере теста Урбана (форма B). Для предсказания суммарного балла креативности на основе рисунков участников (n = 1138; возраст 6-20 лет) были дообучены семь предобученных архитектур: MobileNet V2, AlexNet, ResNet-18, ViT, EfficientNet V2, ResNeXt-101 и DenseNet-121. Данные были разбиты на обучающую (70%), валидационную (15%) и тестовую (15%) выборки, а изображения приводились к единому разрешению 1240 × 1600 px и подвергались случайным аугментациям (отражения, повороты, изменение контраста и насыщенности), затем нормализовывались по статистикам ImageNet. ResNet-18 продемонстрировала наивысшую точность предсказания (R² = 0.69) при исключении из общего балла критерия «Скорость», что сопоставимо с результатами для формы A, несмотря на уменьшение размера выборки и сужение диапазона баллов. Средняя абсолютная ошибка составила 0.52 балла (SD = 4.94), при этом в 70% случаев отклонение от экспертной оценки не превышало 5 баллов. Для анализа механизмов принятия решений моделей применялся метод Grad-CAM, который генерирует тепловые карты на основе градиентов последнего сверточного слоя. Качественный разбор показал, что модели выделяют завершенные элементы незавершенных фигур, соединительные линии, элементы за пределами рамки и подписи, что в целом совпадает с экспертными критериями. Вместе с тем обнаружены визуальные смещения: повторяющиеся элементы и плотная штриховка завышали оценки, тогда как некоторые выходы за рамку оставались незамеченными, приводя к недооценкам. Полученные результаты подтверждают потенциал глубокого обучения и XAI в диагностике креативности, а также указывают на необходимость дальнейшего развития специализированных тестов, методов сегментации и более продвинутых техник объяснимого искусственного интеллекта для повышения точности и надежности автоматизированной оценки.} }