Китайський стартап DeepSeek представив нову модель штучного інтелекту DeepSeek-R1, яка демонструє продуктивність на рівні o1 від OpenAI у задачах з математики, програмування та логічного мислення. Головна перевага нової розробки – її вартість на 90-95% нижча за конкурента.
Про це пише VentureBeat. DeepSeek-R1 базується на моделі DeepSeek V3 і використовує комбінацію навчання з підкріпленням та контрольованого навчання. Під час тестування модель перевершила успіхи 96.3% програмістів.
Процес розробки починався з моделі DeepSeek-R1-Zero, яка навчалася без використання контрольованих даних. Хоча ця версія показала хороші результати, вона мала проблеми з читабельністю та змішуванням мов. Тому команда вдосконалила модель, додавши етап контрольованого навчання.
Вартість використання DeepSeek Reasoner (базується на R1) становить $0.55 за мільйон вхідних токенів та $2.19 за мільйон вихідних токенів, тоді як OpenAI o1 коштує $15 та $60 відповідно. Це робить технологію значно доступнішою для розробників та бізнесу.
Нагадаємо – компанія OpenAI знаходиться на порозі запуску проривної технології – “суперагентів рівня Ph.D.”, які зможуть виконувати комплексні завдання з точністю, що перевищує людські можливості. Сем Альтман планує провести закритий брифінг для представників уряду США 30 січня, де обговорюватимуться потенційні застосування та ризики нової технології.