Китайський стартап у сфері штучного інтелекту DeepSeek анонсував нову версію свого великого мовного моделі V3.1, яка підтримуватиме нові «домашні» чіпи наступного покоління, що незабаром з’являться на ринку. У повідомленні на офіційній сторінці в WeChat компанія зазначила, що формат точності «UE8M0 FP8» адаптований для нових чіпів, які розроблені в Китаї.

FP8, або 8-бітний плаваючий формат, підвищує ефективність обробки даних під час навчання та інференції великих моделей глибокого навчання. Це може стати важливим кроком у розвитку місцевого екосистеми чіпів у відповідь на обмеження експорту напівпровідників з боку США.

DeepSeek зазначив, що нова модель має «значні зміни», включаючи швидший час реагування та гібридну архітектуру, яка підтримує як моди розуміння, так і не розуміння. Компанія також повідомила про зміни в цінах на API моделі, які почнуть діяти з 6 вересня.

Цей анонс відбувається на фоні закликів китайського уряду до місцевих розробників використовувати вітчизняні альтернативи графічним процесорам Nvidia для навчання AI. Незважаючи на те, що китайські виробники чіпів відстають від Nvidia в технологічному розвитку, компанії, такі як Huawei, продовжують робити прогрес.

DeepSeek раніше вразив технологічний світ, випустивши свою модель R1, яка продемонструвала можливості, що порівнюються з конкурентами з Заходу, такими як OpenAI, незважаючи на обмеження на використання чіпів Nvidia.