Китайський стартап DeepSeek представив нове покоління флагманських моделей штучного інтелекту V4 Flash і V4 Pro. Компанія позиціонує їх як найпотужнішу open-source платформу, яка має конкурувати з рішеннями OpenAI та Anthropic.
Про це пише Bloomberg. Моделі орієнтовані на покращення програмування, складних логічних завдань та агентних сценаріїв. У DeepSeek розповіли про підхід Hybrid Attention Architecture, який покращує обробку довгих запитів і запам’ятовування контексту.
За результатами внутрішніх тестів, модель V4 може показувати кращі досягнення у завданнях з кодування, ніж рішення конкурентів. Йдеться про здатність ефективніше писати, аналізувати та виправляти програмний код.
DeepSeek очікує зниження вартості моделі після запуску нових обчислювальних кластерів на базі чипів Huawei Ascend 950 у другій половині року. Також компанія веде переговори про інвестиції з Tencent та Alibaba.

