Китайська компанія DeepSeek представила оновлену версію своєї флагманської моделі штучного інтелекту V3. Оптимізована модель може працювати з китайськими процесорами та демонструє підвищену швидкість обробки даних.
Нова функція оптимізації для вітчизняних чипів може свідчити про стратегічне позиціювання продуктів DeepSeek у рамках розвитку власної напівпровідникової екосистеми Китаю. Про це пише Reuters.
DeepSeek-V3.1 підтримує формат UE8M0 FP8 для роботи з майбутніми процесорами китайського виробництва, хоча компанія не розкрила конкретних виробників чи моделей чипів. Формат FP8 дозволяє моделям ШІ працювати ефективніше, використовуючи менше пам’яті та забезпечуючи вищу швидкість порівняно з традиційними методами обробки даних.
Оновлена модель отримала гібридну структуру, що дає змогу переключатися між режимами логічного мислення та звичайної роботи. Користувачі можуть активувати режим “глибокого мислення” через спеціальну кнопку в офіційному додатку та веб-платформі компанії, які вже працюють на версії V3.1.
Раніше у червні ми повідомляли, що DeepSeek звинуватили у використанні даних Google Gemini для навчання своєї нової моделі R1-0528. Хоча DeepSeek офіційно не розкриває джерела навчальних даних, деякі дослідники вказують на схожість у стилі та виразах між R1-0528 та Gemini 2.5 Pro.

