引用元:Dify(https://dify.ai/jp)
Dify(デファイ)。一言で言うなら生成AIプログラム構築のためのノーコードツールという感じです。
いままで生成AIを利用しようとするとAPIを発行しプログラムを作り・・・。と決してハードルは低くはありませんでした。
それを簡単にしかもノーコードで。さらにはコードも記載できることで複雑な仕様にも対応できるというサービスです。では、どのようなことができるのか。そして実際に作成してみた内容を解説します。
あわせて読みたい注目記事
コンテンツ
Dify(ディファイ)とは?
Dify(ディファイ)とは「LangGenius, Inc.」が提供するサービスです。オープンソースのLLMアプリ開発プラットフォームです。
RAGを使用してエージェント形式のチャットボットから複雑なAIワークフローなどをノーコードで。つまりLLMアプリを簡単に作れるサービスです。
LangChainをご存じの方であれば、それをもっとノーコードで簡単にしたものととらえていただければと思います。
Difyのサイトにも「LangChainよりも本番環境に適しています」と記載が。
なお、LangGenius, Inc.についてですが、LangGenius, Inc.は、アメリカのデラウェア州(651 N BROAD ST SUITE 201, Delaware, USA )にある企業です。CEOはLuyu Zhang 氏が代表を務める企業です。
Difyの読み方についてですが「ディファイ」です。DifyのYouTube公式動画にある過去の発言をもとに確認しました。(下記動画1:27参考)
なお、名前の由来は動画上にある「Do It For You」の頭文字でDifyのようです。
Dify何がそんなにすごいのか。
1.利用料金が無料から(というかほぼ無料)
まず料金無料から始められます。googleアカウントやgithubアカウントのみで開始することできます。
そのため今すぐにでも始めることができる点です。
もちろんChat GPTやClaudeなどの生成AIを利用する場合は、そのAPIを利用する料金は発生します。
そして、「オープンソース」であることです。ここがすごいです。オープンソースとは無償でプログラムが公開されていることです。
Dockerを利用したことがあればすぐにGithubからダウンロードし利用可能です。
そのためローカルにダウンロードすることで生成AIならではでのセキュリティ・学習面を意識しなくていい点もすごいポイントです。
とは言ってもすぐに使いたい方に対しても利用可能で、機能制限付きでクラウドサービスとしてログインするだけですぐつかえ試せるようにもなっています。とりあえず試しに使いたい方にも便利です。SaaSとして環境を用意せずにサーバレスで利用したい場合も料金払って利用できるので便利です。
料金プラン:https://dify.ai/pricing
2.日本語対応。UXも非常に直感的。
料金プランページは現状英語でしたが、トップページやサービス自体は日本語の最適化がされてます。これは日本人にとってはうれしいところです。UXもドラッグ&ドロップの操作性。つまり、マニュアルなしでも直感的な操作が可能です。
3.ナレッジ機能によりRAGの作成が簡単。
RAGのためのナレッジ機能が搭載されているという点です。このことにより簡単に独自情報を組み込んですぐに利用できる点です。
というのが一般的な長所ですが、ほかにはワークフローの中にコードが使える点です。
ノーコードで正直そこそこのことはできてしまいます。ただそれをプログラムに理解がある人であればさらに拡張できる点です。
さらに、好評されているアップデート予定に「繰り返し処理」などの複雑な処理が可能になるようです。そうなってくると、単にRAG作成ツールの域ではなく、生成AIプログラムプログラムを作る際のツールとまでなりえるのではないかという点です。
※2024年5月28日
Difyに繰り返し処理こと「Iteration(イテレーション」機能が追加されていました。
その結果、長いフローを書かずに繰り返し処理ができます。これから活用事例がいろいろ上がってくると思われます。
ちなみに、これのさらに繰り返しのLoop(ループ)というものもあるようですがこれはまだこれからのようです。
Difyを早速操作してみた
これが画面です。非常に直感的な操作性です。これを作成するのは数十分で可能でした。
試しにすべてのAIをつないでAIにどのAI使うか判断させて回答させてみようとしましたが、まだまだプロンプトをコントロールしないとClaudeにすべて流してしまうという状況です。Difyというより私としてのフローの改良が必要そうです。
あとwikipediaを検索させてからと思いましたがこれも単語で認識しないので打ち込んだ文章のままだと検索なしになってしまうため選択後に単語抽出してwikipedia検索をするなどのもう少し踏み込んだ仕様を理解したひと工夫が必要そうです。
ただこれがマウス操作で実現する事実に驚きです。
※追記2024.05.15
Open AIからGPT-4o(ジーピーティーフォーオー)が発表されました。早速Difyを確認したところ追加されていました。料金面を考えてもGPT4-Torboを使う理由は今後なさそうです。
ナレッジ機能について
ナレッジ機能についてはデフォルトでNotionとの連帯が可能です。例えば会議資料やその他資料がNotion上にある場合反映するだけですぐにRAGとして機能させることが可能です
もちろんデータが画像だらけよりかは構造化された状態の方が精度があがるのは従来のRAG同様です。
さらには、Webhook経由でつなぐことも可能です。データソース先には困らなそうです。
まとめ
おそらく今の使いみちはRAGとしての使いみちが無難だと思います。とはいえ、さまざま活用テンプレートがDify上にもあるので、それを参考にするだけでもビジネスに生かすアイディアの種になるかもしれません。
簡単に利用できますので、さっそく利用してみることをオススメします。
なお今後、繰り返し処理などの複雑な処理が実装される予定です。そうなると、たとえばホームページなどとAPIでつなぎ、自動で記事を生成し投稿。そして再度作成…そのようなさまざまな展開が見えてきます。
今後、生成AIの活用方法がいろいろ出てくるとおもますので一つの方法として覚えておくのがいいのかもしれません。
なお、当社でも生成AIを利用した開発も進めています。お問い合わせよりお気軽にお問合せください。