Китайську компанію DeepSeek звинуватили у використанні даних Google Gemini для навчання своєї нової моделі R1-0528. Хоча DeepSeek офіційно не розкриває джерела навчальних даних, деякі дослідники вказують на схожість у стилі та виразах між R1-0528 та Gemini 2.5 Pro, пише TechCrunch.
Австралійський розробник Сем Пейч опублікував у соцмережі X спостереження, що R1-0528 використовує фрази, характерні для Gemini. Інший дослідник, відомий під псевдонімом SpeechMap, зазначив, що процеси міркування моделі DeepSeek нагадують ті, що притаманні Gemini.
Це не перший випадок, коли DeepSeek підозрюють у використанні даних конкурентів. У грудні минулого року деякі розробники помітили, що попередня модель DeepSeek V3 іноді ідентифікує себе як ChatGPT, що може свідчити про навчання на основі логів чатів OpenAI. Раніше OpenAI повідомляла про виявлення доказів використання DeepSeek техніки дистиляції — методу навчання моделей шляхом копіювання поведінки більш потужних систем.
Умови використання сервісів OpenAI та Google забороняють використання їхніх моделей для створення конкурентних продуктів. Раніше у квітні спеціальний комітет Палати представників США визнав китайську компанію DeepSeek загрозою для національної безпеки та рекомендував уряду вжити заходів проти ризиків, пов’язаних з китайськими моделями штучного інтелекту. Комітет рекомендує розширити контроль за експортом та запобігати стратегічним несподіванкам, пов’язаним з розвинутим ШІ.