中国発のAI企業Deepseekを徹底解説。最新モデルからAPIの使い方まで
Deepseekとは?
Deepseekは2023年に中国で設立されたAI企業です。創業者のZhao Yonggang(趙永剛)氏は元ByteDanceのAI研究者で、同社のAIモデル開発を牽引してきた実力者として知られています。
以前もDeepseek社はAIモデルのコストパフォーマンスの良さから話題になったことを記憶してる方もいるかもしれません。
そんなDeepseek社ですが、今回は2024年11月20日に新しい言語モデル「DeepSeek-R1-Lite-Preview」をリリースしました。
このモデルは特にo1-previewレベルの数学的推論能力をベンチマークで示しており注目を集めています。
Deepseek-R1-Lite-Previewモデルとは?
1. 卓越した数学的推論力
AIME(American Invitational Mathematics Examination)ベンチマークで高いパフォーマンスを実現
MATH benchmarkでもo1-previewレベルの性能を達成
2. 思考プロセスの透明性
リアルタイムでの思考過程の可視化が可能
より詳細な推論ステップを確認できる
3. オープンソースなどの提供に関する取り組み
モデルのオープンソース化を予定
API提供も近日開始予定
実際に最新モデルを利用してみよう
Deepseekアプリにログイン
こちらのサイトにアクセスしてStart Nowを選択してください。
新規登録・ログインをしてください。
ログインすると、以下のように新規チャット画面が開きます。ここでDeep Thinkをオンにすると、最新のDeepseek-R1-Lite-Previewモデルが利用できます。
1日に無料で50回使えるので、課金は不要です。
それでは、実際に試してみましょう。
試験的に、Slackのようなチャットアプリの設計をしてもらいます。
このように、o1-previewと同様の思考のアウトプットを挟んでから実際のアウトプットを開始します。
かなり思考部分も長く、しっかり考えていることが見て取れます。
アウトプットもかなりボリュームが多く、様々な観点を考慮していることが読み取れます。
稀に中国語が混じるのが気になりますが、基本的に利用する分には問題となるほどではなさそうな頻度です。
思考が英語であることからも基本的には英語でアウトプットしてもらい、適宜必要な箇所をLLMなどで翻訳することで性能の良さを活かしつつ使うことができそうです。
以下はもう少し軽めにして社内で使う程度の用途向けに変更してもらった結果です。
和訳すると、以下のように実用性と軽度な開発という意図の2軸に沿ったアウトプットがしっかり出来ているようです。
また、実際にアウトプットしてもらうと性能も良さそうですが速度もo1-miniと同じくらいと無料で50回使え、オープンソース化やAPI公開が予定されているものとしてはかなり破格な性能となっているように感じます。
Deepseek APIについて
料金プラン
現状Deepseek APIで利用できるAIモデルはdeepseek-coder、deepseek-chatの2つです。どちらも入力は$0.14 / 1M tokens、出力は$0.28/1M tokensであり、かなり安価であることが分かります。
コンテキストキャッシュ機能
DeepseekのAPIでチャット履歴などを元にテキスト生成を行う場合、例えばsystemプロンプトが同じ場合などにコンテキストキャッシュが行われます。
コンテキストキャッシュ機能は全ユーザーに対してデフォルトで有効になっているので、特に設定することなく同じプロンプトに対しては料金が10分の1になります。
この機能は、会話履歴を渡す際にこれまでの会話履歴+新規メッセージを送信する際も会話履歴分はキャッシュされ、安く利用することができますしfew-shotなど同じプロンプトを複数回渡し、最後の入力のみを変更して回答を生成する場合などにも有効です。
注意点としては、同じプロンプトであっても100%必ずキャッシュにヒットするわけではないようです。