OpenAI создала программу под названием MLE-bench, которая состоит из 75 задач, взятых с платформы Kaggle. Эти задания предназначены для того, чтобы проверить умение искусственного интеллекта изменять и улучшать собственный код без участия человека.
OpenAI создала 75 тестов Kaggle, предназначенных для оценки эффективности алгоритмов машинного обучения в решении различных задач. Каждая задача в MLE-bench имеет практическое значение. Например, проект OpenVaccine направлен на разработку мРНК-вакцины против COVID-19, а Vesuvius Challenge связан с расшифровкой древних свитков.
Исследователи считают, что искусственный интеллект, способный успешно пройти все 75 тестов MLE-bench, может считаться достаточно мощным для достижения уровня общего искусственного интеллекта (AGI) — гипотетической системы с интеллектом, превосходящим человеческий. Такой автономный ИИ также сможет ускорить научные достижения в областях здравоохранения и климатологии.