DeepSeek(ディープシーク)という名前がこの1週間で話題となりました。
正確に情報を報道できているメディアは少なく、また誤解を与えるような恣意的メディアも多くみられます。最初出たときはITに詳しい人達だけで「また面白いもんでたぞ」ぐらいだったのがあれよあれよと、世界はもちろん日本国内でも話題となりすごい速度で日本経済新聞や地上波などまで一気に波及しました。
なぜこのLLM一つでここまで話題になっているのか、中立的にそして建設的にそのポイントなどをまとめてみます。

この記事でわかること

・DeepSeekがなぜここまで話題になったのか
・どうしたら安全に利用できるのか

DeepSeekとは?

deepseek

DeepSeekとは大規模言語モデル(LLM)を開発している組織です。梁文峰(Liang Wenfeng氏 1985年~)による運営がされており、ここより作られたLLMモデルには様々なパターンがあります。今回特に話題になっているのが2024年12月にでた「DeepSeek-V3」と2025年1月20日にでた「DeepSeek-R1」です。
現状でDeepSeekといえばこのモデルたち自体を指すことが多いです。クジラのロゴがかわいいです。

そして特にDeepSeek-R1に関してはOpenAIが提供する「o1」モデルと同等の程度の性能を持つと報告されています。実際に日本語による回答も可能でナチュラルで高性能さがうかがえます。
このモデルはReasoning(和訳:推論)がポイントであり、推論とは「前提や証拠に基づいて、論理的に思考すること」です。具体的には、「なぜなぜ?と問いながら思考を深めたり、要素間の関連性を考えたりするプロセス」がその方法の一つです。
単に即答することを避けることで精度の高い結論を導くことができるというものです。

なぜここまで話題になったのか

初期段階では主に3点が大きかったと思います。

①高性能にも関わらず低額の投資でこのモデルが生まれたと主張されている点

具体的にはOpenAIのo1の10分の1の投資額である、560万ドルで開発したという噂が話題となりました。ただし、この数値には疑問が呈されています。
またGPUの量をそこまでいらずに開発できたとのうわさもありますが、実際には大規模なGPUクラスターを使用しているといった内容もあり、真偽は不明です。
ただし、これらの数値は推定であり、ここについては懐疑的な内容の報道も多く憶測が多いです。そもそも後発で出る以上どんどん安価に高性能に作れるようになるのはごくごく自然なことではあります。

オープンウェイト型であること

自身のパソコンにそのモデルをインストールして利用することで誰でも無料で(電気代などはかかりますが)利用できるというものです。あとは自身の管理するクラウドサーバーを利用するなどです。サーバー費用はもちろん自分負担です。

そして、そのこのモデルの回答を利用して別のモデルの「Qwen(クウェン)」を強化したりといったこともされ始めています。実際に日本のサイバーエージェントは「DeepSeek-R1-Distill-Qwen-14B/32B-Japanese」を数日後にすぐに出すなどが行われています。


これによりいままで生成AI=WEBで提供者のサーバーで使うものという大衆の意識が変わる可能性もあります。OpenAIを文字って、まさにOpenSeekとClosedAIだ。という皮肉まで生まれた次第です。

③無料で提供を開始したこと

しかもそれを無料で提供したことも大きいです。iphoneアプリも提供しており、アメリカのApp Store総合順位では無料アプリ1位を「DeepSeek」 が取るなど爆発的な人気まで生みました。以下の画像の通り現在日本のランキングでも1位でした。

2025/01/30現在

API料金についても破格の金額であることから注目をあつめました。ただしこの無料でWEBサイトやアプリから利用する方法や、APIから利用する点についてはリスクもありますので後ほどまとめます。

アメリカと中国との政治的問題

アメリカ現大統領はドナルド・ジョン・トランプ氏です。そしてさまざまな政策が実行されています。その中の一つには米政府は懸念国(country of concern)に対して、AI半導体に新たな輸出規制をかけるというものがあります。実際に中国はその一つです。
いつその規制がより強くなるかもわからない状況で、いわゆる「地政学的リスク」を抱えている状況なのは否定できない状況です。また逆を言えばいつでもアメリカの輸出規制によりアメリカ一強な状況を作り出すことも可能である点です。

そんな生成AI市場をその不利的状況である立場から揺るがしてきたDeepSeekには注目が集まりやすかったというのも今回のポイントかもしれません。

アメリカ株式市場への波及

さらに大衆にここまで情報が普及した点として「株式市場への波及」も大きかったと思います。
今回資金面もそうですが、その結果GPUがそこまで必要ないのではないかという話題からNVIDIAをはじめとする企業の株価を下落させ大きな影響をおよぼしました。瞬間的ではありますが約90兆円近い影響を与えたともいわれています。

deepseek-nvidia
引用:google

ただ正直なところGPUの影響による下落は憶測による連れ下げ的要素もあると思います。
そもそもとしてGPU関係なく「生成AIアメリカ一強状態が崩れる」可能性が出たことによる、いままで生成AI企業に多額の投資をしてきたIT、AI、半導体関連企業の投資状況に悪影響がでるのではないかという懸念による影響の方が大きいのかなと思います。今後どのような影響を及ぼすかは未知数です。

中国にある「安全()」なサーバー

さらに話題となった点として利用規約とそのサーバーの所在地です。
DeepSeekの規約やプライバシーポリシーではさまざまな点について記載されています。その一つとして中国本土のサーバーに保存するという内容です。

Where We Store Your Information
The personal information we collect from you may be stored on a server located outside of the country where you live. We store the information we collect in secure servers located in the People’s Republic of China .
Where we transfer any personal information out of the country where you live, including for one or more of the purposes as set out in this Policy, we will do so in accordance with the requirements of applicable data protection laws.

日本語訳:
情報の保存場所
お客様から収集した個人情報は、お客様がお住まいの国以外にあるサーバーに保存される場合があります。収集した情報は、中華人民共和国にある安全なサーバーに保存します。
また、本ポリシーに記載された目的のいずれかのために、お客様の個人情報をお住まいの国の外へ移転する場合、適用されるデータ保護法の要件に従って行います。

「in secure servers located in the People’s Republic of China」の部分の和訳が「中国にある安全なサーバー」と解釈できます。

検閲問題などは世界の知るところです。そのため個人情報などの情報を入力すればそのリスクにさらされる可能性があると噂されているからです。

だからと言って注意しないといけないのはDeepSeek(LLM)=すべて検閲・中国サーバーではないという点です。その点を以下の二つに大きくわけて解説します。

①WEBサイト(アプリ)or 公式WebAPI利用

今回の規約の対象になるのはこのサービスです。そのためアプリを入れて利用したりもしもWEBサイト上からや公式APIを用いて入力すればその情報すべて先ほどの「in secure servers」に行きます。
またAPIに関しては他のLLMの場合は明確に分離している規約がある会社もありますが、公式のWebAPIを使う以上このサーバーを経由を避けることはできないので、これはDeepSeekがどうするというよりサーバーの場所を変えない以上どうしようにもないため同義ととらえれます。これがどうしても気になるのであればこの利用をやめればいいだけです。

②オープンウェイトとしての利用

以下で記述しますが、自身のパソコンに入れることです。ローカルLLMというものです。セルフホスティングするとも言われます。
モデルは公開されていますし、それを利用してほかのモデルをトレーニングしたりしたモデルも多くあります。そうなれば「in secure servers」を経由しないのでこの規約のサーバーはもちろん経由することもありません。

実際にPerplexityGroqなどは自社のサーバーにホスティングしたり、DeepSeekを使ってトレーニングしたモデルをセルフホスティングしサービスを展開しています。Perplexityの場合あまりにも①のような意見が多いからか意図的に「米国にホストされた」と記載してあります。

deepseek-perplexity
deepseek-groq

さらにAzureに関しても自分たちで稼働しているということを強調しています。

https://azure.microsoft.com/en-us/blog/deepseek-r1-is-now-available-on-azure-ai-foundry-and-github/

ポスト日本語訳:
DeepSeek R1 は Azure AI Foundry と GitHub で稼働中です。最小限のインフラストラクチャ投資で、信頼できるスケーラブルな AI プラットフォームで高度な推論の力を体験してください。

なお、中国の歴史的な内容を打ち込むと回答を拒否されるというのが問題に関しては、個人的見解を述べますが、正直生成AIがでてこの2年間この話題がでるまで、正直なところ別に私は中国の歴史的な内容を一度もLLMに入力したりしようと思ったことがありません。なので別にそのようなことに回答されなくても何ら困ることはありません。今後もエンタメ目的以外で別に生成AIにわざわざ頻繁に聞こうとも思うこともありません。

さらに中立的回答をしてくれないとする点も、一度も出力を自身で解釈せずに生成AIの意見を鵜呑みしたこともありません。別に中立的でないなと判断したときに使用をやめればいい話だと思います。
もしもコードにバックドア的なコードが。というのであればそれはコードを読めばわかります。しかもそれは今回のDeepSeekに限らずすべてのAIに言える問題です。リスクは利用する側のリテラシーの問題であると思います。

どうしたら安全に利用できるのか。-DeepSeekを自身のパソコンで使う-

これには多少専門的な知識も伴いますし、一般的な家庭用のパソコンの性能で十分に担保された速度でうまく機能するほどのものはなかなか難しいです。高性能ゲーミングPCやMac Proぐらいの高額なスペックの機体であれば動くのでそういった知識があればスペックを整えて可能です。
もちろんモデルの精度を落とせば使えるものもあります。ただし回答レベルが落ちます。とはいえ家庭でも多少のお金を出せば手に入るスペックで動くということがすごい点です。

これであれば上記サーバーを経由されることもないため、むしろ一般的な生成AIよりもより個人的に利用することも可能です。

具体的にはLMstudioOllamaJanあたりを使ったセルフホスティングが有名です。話題になった影響で使い方のいろいろな情報がふえていますのでやり方はそちらをご確認ください。

私もそこまでスペックの高くないPCでサイバーエージェントの14Bを動かそうとしたら、「おはよう」の回答に5分かかって、渾身の回答(笑)がかえってきました。いいPCがとてもほしくなりました。

学習に他のモデルの出力内容を使った可能性

まだまだ話題は尽きません。OpenAIの出力内容を学習に使ったのではないかという噂が出ています。これもただの噂に過ぎない反面と、OpenAIが抽出の証拠までつかんだとの噂もあります。

ただしこれはDeepSeekにたずねたらOpenAIという文字が返ってきたという短絡的な話ではありません。
生成AIをよく利用している方こそわかると思いますが、簡単に言わせたり、禁止させたりが可能です。
逆もそうです。そんなの簡単にプロンプトや学習で言わないように制御かけたりできます。
ここについては難しいところでそのデータを直接使っていなくてもネット上にはすでに多くのChatGPTにより出力されたテキストがあるわけで、そこをどのように制御かけるのか…

今後OpenAIは、その証拠をどうやって直接的に利用した証拠を証明するのか、法律的にも技術的にも気になるところではあります。

画像生成AIモデルも公開

今まで話はテキストチャットの話です。さらに別に画像生成モデル「Janus-Pro」も2025年1月27日に発表しました。
GitHub : https://github.com/deepseek-ai/Janus

まとめ

今後、このようなオープンモデルによる公開が続くとなると現状のOpenAIAnthropicはどのように動くのかが読めません。
純粋に競争が激化して世界的にみたときにより安価で進化で早く進むのであればこういったDeepSeekのような動きは望ましいものですが、逆に市場的に厳しいと判断されれば、最近では不老長寿などの医学や製薬の研究を進めている噂もあり、また機関向けなどのサービスに重きを置く可能性もゼロではないと思います。

すくなくても今回Appstoreで1瞬にして1位になった様子を見るとすでに生成AIがいかに大衆化してきているかというのも感じますので、今後の動きがさらに期待できるものなった可能性もあります。

この記事を書いた人

スムーズロゴ
SMOOZ
enterprise-smooz

資料
ダウンロード

マスタデータのメンテナンスに関わる機能をまとめたSaaS「SMOOZ
SMOOZはリレーショナルデータベースの課題を解決するサービスです。
オンラインデモで気軽に試すことが可能です。