Вчені створили конкурента моделі «міркувань» OpenAI o1 менш ніж за 50 дол

Дослідники штучного інтелекту зі Стенфордського та Вашингтонського університетів змогли навчити модель «міркувань» ШІ менш ніж за 50 доларів за допомогою хмарних обчислень, повідомляється в науковій статті. Модель, відома як s1, працює подібно до передових моделей міркувань, таких як o1 від OpenAI та R1 від DeepSeek, на тестах, що вимірюють математичні здібності та навички кодування. Модель s1 доступна на GitHub, разом з даними та кодом, які використовуються для її навчання.
Нагадаємо, що OpenAI o1 — це нова модель штучного інтелекту, розроблена для вирішення складних бізнес-завдань за допомогою глибокого аналізу та міркування. Вона здатна пояснювати користувачу ход своїх думок.
Команда розробників s1 розповіла, що вони почали з готової базової моделі, а потім допрацювали її за допомогою дистиляції − процесу вилучення «міркувальних» здібностей з іншої моделі ШІ шляхом навчання на її відповідях. Дослідники кажуть, що s1 створений на основі однієї з моделей міркувань Google, Gemini 2.0 Flash Thinking Experimental. Дистиляція − це той самий підхід, який дослідники з Берклі використали для створення моделі міркувань ШІ вартістю близько 450 доларів минулого місяця.