ディープシーク、スパースアテンションを導入した新モデルを発表、長文処理効率を最適化しAPI料金も大幅引き下げ

CRI online    
facebook X mail url copy

拡大

中国のAI開発企業・ディープシークは9月29日、実験的な新モデル「DeepSeek-V3.2-Exp」を発表しました。

中国の人工知能(AI)開発企業・DeepSeek(深度求索、ディープシーク)は9月29日、実験的な新モデル「DeepSeek-V3.2-Exp」を発表しました。本モデルは、V3.1-Terminusを発展させたもので、「次世代アーキテクチャーに向けた中間ステップ」と位置付けられています。

最大の特徴は「DeepSeek Sparse Attention(ディープシーク・スパースアテンション)」の導入です。これは長文処理における訓練と推論の効率化を目指した仕組みで、既存のモデルでは膨大な計算資源を必要とする長文解析を、より負荷を軽くし、迅速に処理できるよう最適化しています。ディープシークは、この取り組みを「探索的な検証」と説明し、今後のAIモデル開発の基盤技術としての可能性を示しました。

さらに、今回のアップデートではユーザーに直接的なメリットも提示されています。公式アプリやウェブ版、アプレットがすでにV3.2-Expへ更新され、併せてAPI利用料金が大幅に引き下げられました。開発者にとっては、これまでより少ない負担で最新モデルを活用できる環境が整ったといえます。

ディープシークはまた、中国の半導体メーカーと協力しながらV3.2-Expを開発していることも示唆しており、技術と産業の連携を深めつつ、自国のAI分野における競争力強化を図っているとみられます。シリコンバレーを驚かせたR1モデルに続き、今回の取り組みは同社が中国AI業界でのリーダーシップを固める一歩となりそうです。(提供/CRI

※本記事はニュース提供社の記事であり、RecordChinaの立場を代表するものではありません。すべてのコンテンツの著作権は、ニュース提供社に帰属します。

noteに華流エンタメ情報を配信中!詳しくはこちら


   

we`re

RecordChina

お問い合わせ

Record China・記事へのご意見・お問い合わせはこちら

お問い合わせ

業務提携

Record Chinaへの業務提携に関するお問い合わせはこちら

業務提携