生成AIサービスが生成AIの進化により提供速度やアップデートがブーストされている感じまでする今日この頃です。アップデートの速度も異常に早い。そしてこれだけサービスが増えてきていると、そろそろついてこれなくなってきます。
こうなると新しいサービスを把握するのにていっぱいです。そうなると把握するのが目的になるといった本質を見失わう場合も。あくまでも「したいことがありそれを達成するために利用する」。このスタンスは崩したくないですね。
とはいえどのようなことができるかがわからないと発想の種にはなりません。ひとまず思いついたものを整理を兼ねて挙げてみました。特に先月2024年8月はかなり話題の多い月でした。
ひとまず20個あげました。細かくいえばもっとありますし、いまも増え続けたり注目を浴び始めています。どこまでご存じでしょうか。一部個人的意見コミコミです。
生成AIサービス初級編
・ChatGPT(チャットジーピーティー)
言わずもがな元祖対話型生成AIサービスといっても過言ではないサービスです。このブームを作り出したといってもあまりありません。OpenAI社が提供するサービスです。昨今では4o-miniのAPI価格の安さからローカルLLMよりもコスパとしては逆によくなるのではないかというケースも生まれています。もちろんローカルLLMは機密な情報を利用するケースなどで確実に残り続けます。無料から利用でき、有料プランは月額20ドルからです。
・Claude(クロード)
Anthropic(アンソロピック)社が提供する生成AIサービスです。AWS内でBedrockのモデルとしても利用可能です。Claude 2までは実際つかいましたが日本語が少々つたない。日本語では使えないな。というのが正直な感想でした。ただ、claude 3から本格的に日本語に対応しいける!という感じになりました。
また、「Artifact」機能では簡単なゲーム程度なら作れるようになりました。AIで0→1のポンだしの先駆者といえるべきサービスかと思います。特徴としては文章校正力やReact.jsのコーディングに優れている印象です。
こちらも無料から利用でき、有料プランは同じく月額20ドルからです。
・Gemini(ジェミニ)
Googleが提供する対話型生成AIサービスです。特徴はGoogleサービスとの連帯のしやすさ。そして一番のポイントは最大トークン数の多さから長文入力を可能にした長文対応力です。
ほかにはflashモデルでは4o-miniよりも安い価格で価格面での競争にもなっています。
この料金の安さはのちに説明するDifyといったワークフローツールなどを使うことで恩恵を受けやすいです。複雑なフローを作るとどうしてもLLM連打になるので適切に低料金モデルをつかうと便利です。
あとはやはりGoogleの広いサービス、例えばスプレッドシートやスライド、Googleドライブとの対応のしやすさは今後も特徴となると思われます。
なお読み方「ジェミニ」「ジェミナイ」論争が一時期ありましたが、Geminiの読み方は(ジェミニ)です。
Gemini的にはふたご座を指すジェミナイはわかりますが、以下Google Japan公式のポストの通り(ジェミニ)です。
・Grok(グロック)
Xこと旧twitterが提供する生成AIです。特徴はX内をしらべれるところ強みです。また先日画像関連の新機能として、FLUX.1を用いた画像生成も可能です。
Xプレミアムおよびプレミアムプラスの加入者へのサービスとなるため生成AIとしての料金だけではありませんが、利用するためにはX有料プランへの加入が必要です。
なおGrok-3が今後提供されると発表されており、さらなる性能向上が予定されています。
・MidJourney(ミッドジャーニー)
MidJourney(ミッドジャーニー)は、テキストプロンプトから高品質な画像生成をする画像生成AIツールです。Discordを通じて利用し、多様なスタイルの画像を短時間で作成できます。商用利用が可能で、マーケティングやデザイン分野で広く活用されています。
月額10ドルから利用可能です。discord上で生成できるためインストール不要で気軽利用可能です。
ただAPIを使いたい場合は物足りないかもしれません。
・Notion AI(ノーションエーアイ)
NotionAI(ノーションエーアイ)は、Notionに統合されたAIアシスタント機能です。
NotionAIというサービスがあるというよりNotionの機能としてという感じです。
文章作成、編集、要約、翻訳などが可能です。Notionの既存機能と組み合わせることで、ドキュメント管理やプロジェクト管理をより効果的に行えます。
Notionは多機能なオールインワンのワークスペースツールという感じです。Microsoft OneNoteが印象としては近いかもしれません。
最近では会議議事録や静的ページが作れる機能でスタートアップ企業のホームページの代わりつかわれるなどのケースもでてきました。Notionだけなら無料でも十分に利用することができます。AI機能を使い続けるためには有料プランへの加入が必要です。
・Stable Diffusion(ステーブルディフュージョン)
MidJourneyとならぶ元祖画像生成AIのイメージです。テキストから高品質な画像を生成するAIモデルです。OSS(オープンソースソフトウェア)で、インストールする知識があれば月額利用料金なしで利用可能です。商用利用もOKです。またモデルを差し替えることでいろいろな形式の画像が作成できるため、広告や幅広い分野で利用されています。
生成AIサービス中級編
・miibo(ミーボ)
miibo(ミーボ)は会話型AI構築プラットフォームです。
株式会社miiboは渋谷区道玄坂にある日本の企業が提供する生成AIのためのサービスです。生成AIためのフロントエンドサービスとでもいうべきでしょうか。次のDifyが近いところがあります。
いろいろな各社モデルをGUIで簡単に作ることができるため社内チャット。ほかにはPoc検証など様々なことに利用可能です。無料からでも制限はありますが利用することが可能です。
このような生成AIをさらに使いやすくするサービスは、あらたなサービスがどんどん出てくるこの時代では、自社で対応するよりも素早く対応することに最適です。また保守性も挙げてくれるので取りまとめてくれるプラットフォーム的なサービスはありがたいです。
・Dify(ディファイ)
さきほどのmiiboをよりエンジニアライク?に自由度を高めた印象のサービスです。
なによりこれもOSS(オープンソースソフトウェア)でAWSのEC2に組み込んだりAzuru、ローカルサーバーなどにdokerで導入するなど様々な利用方法が見込まれます。
なお先日XserverがDifyを使えるプランを提供しました。
https://prtimes.jp/main/html/rd/p/000000127.000076849.html
おそらく今後ですがホームページ作成のワードプレスのように普遍的になる可能性を秘めています。
アップデートも頻繁です。例えば、直近のアップデート0.8.0では並列処理を可能になりました。また、httpリクエストが可能なため知識がある人は他のAPIサービスとの連帯も簡単です。例えばAWSのLambdaなどで自身のAPIを構築すれば柔軟性はほぼ無限大です。
・Perplexity AI(パープレキシティ エーアイ)
検索型対話型生成AIです。昔よりもWEBコンテンツが増えた影響で必要情報やページを探すのに手間がかかります
それをまさに生成AIが行ってくれるサービスです。
基本機能は無料で利用可能です。Pro版は月額20ドル(年間契約で月額16ドル)です。
またさらには先日ソフトバンクは提携を発表し、いまならソフトバンクユーザーは1年間無料で利用可能です。なお有料プランに加入すれば毎月5ドルのAPI費用がついてくるので、先ほどのDifyなどと合わせて活用も可能です。
GPTなどもWEB検索を行ってくれますが、ハルシネーションによる問題もあります。そこでその「調査」に特化したことにより存在しないURLを提供しにくいのが特徴的です。「ググる」から「パプる」なんて時代もくるのかもしれません。
・v0(ブイゼロ)
Vercel社が開発した生成AIサービスです。この2024年8月に特に話題となりました。
ソフトウェアエンジニア業界ではVercel社は有名です。あのNext.jsの開発元であるということもあり、Next.jsでのコーディング能力が特にすぐれています。つまり「今一番モダンなUIデザインとフロントエンドコード生成AIツール」といっても過言ではありません。また出来上がったコードはすぐにローカルにインストールできる機能がついていたり、ClaudeのArtifactでは文字数制限がありましたがその何倍も長い1000行近いコードの生成が一発で可能です。アップデートも頻繁で個人的には今一押しのサービスではあります。
・Create.xyz(クリエイト)
自然言語だけでWEBコンテンツが作れるWebサイトやアプリケーション開発ツールです。
そのままホストすることもできるところが特徴です。モックアップ作成などで使うことが可能です。
・Satto(サット)
Satto(サット)はソフトバンク株式会社が提供する生成AIサービスです。さっとできるを特徴に様々なタスクをこなすことに特化したノーコード型サービスです。
2024年8月23日に限定先行ユーザーの登録受け付けをウェイトリスト形式で開始したばっかりなのでサービスとしてはまだですが、プロンプトなしでさっと使える生成AIであったり他のサービスとの連帯ができるとのことです。どこまで普及するかが注目です。
https://www.softbank.jp/corp/news/press/sbkk/2024/20240823_01/
・Mapify(マップファイ)
マインドマップを手軽に生成できるサービスです。マインドマップとは思考の表現方法を図と言語化し整理するものです。図的にはこんなものです。
パワポ向きですね。これを使うことで資料がより魅力的なものになります。
なお、Mapify読み方ですが、正式な読み方を探すべく公式のYoutubeにあった動画の以下27秒時点あたりを聞くと、日本語にするのが難しいですが、マッピな気もしますが、日本語で発音するなら「マップファイ」の方が近い印象をかんじました。そもそもカタカナにするなという話かもしれませんが「マップィファイ」が発音的には一番近いのかなと。
・tl;dv(ティーエルディーブイ)
会議の内容を文字起こし議事録化するサービスです。こういったサービスは多くあります。そのため目新しさはないですが、無料から使えるサービスということでスタートアップや個人などで使いやすいサービスではあるのであげてみました。
有料プランではワードプレスや、Salesforce、Notion、Zapier経由の統合などの連帯も可能です。
料金表:https://tldv.io/app/pricing/
・Runway(ランウェイ)
動画生成AIサービスです。今一番ナチュラルでリアルな動画が作りやすいサービスです。Gen-3モデルになりとくにリアル度が増しました。
最近では生成AIによるCM作成などがやっと成り立つかな?というレベルまで来た状況です。
とはいっても個人的にはなんかずっと見てると、なんかAIが作った動画はまだ酔う印象があります….
おそらく構図の統一感などの影響もあるのかもしれませんが。
なおテキストや画像から動画を生成したり、既存の動画から編集してくれたりも可能です。
無料で試すことができます。ただ、より高度な機能や生成回数の増加には有料プランへの加入が必要です。
生成AIサービス上級編
・Corsor(カーソル)
ソースコードエディタです。Visual Studio Code(VSCode)のAI付ととらえるといいかもしれません。
普通のテキストエディタとして利用できます。ただソースコードエディタなのでコードを書いたりする人しかあまり触れる機会はないかもしれませんが、現状のCorsorの最強機能「Composer」が未来を感じます。Composerは複数のファイルを認識した上で自動で修正を行ってくれるため自動で作成される状況は圧巻そのものです。
さらにGithub copilotのようなコード補完提案機能も込みで月額で利用できるためCorsor(カーソル)の利用が許される環境であれば、VScodeでGithub copilotよりもCorsor(カーソル)を試してみる価値ありです。
ちなみに月額に入らなくても無料から使えて自分のAPIを使えば高度なAIもお試し的に従量課金で使えます。百聞は一見に如かずです。ぜひ試してみてください。
・SakanaAI(サカナエーアイ)
2023年8月に東京で設立された日本のAI企業です。ただ、日本企業…とはなっていますが正直なところ、日本に拠点を置く実質上元GoogleのAI研究者であるLlion Jones氏とDavid Ha氏のアメリカの創業者たちが提供するサービス。といった方が正確まであります。
複数の小規模AIモデルを組み合わせてより高度な処理をすることを実現しています。
最近ではNVIDIAからも出資を受けたと発表し話題となっています。
現状ではhuggingface上から利用することが可能です。
https://huggingface.co/SakanaAI
・FLUX.1(フラックス)
https://blackforestlabs.ai/
画像生成AIです。まさにステーブルデュフュージョンの上位互換のようにでてきました。
いままでの画像生成におきがちな画像としての破綻が少ないとのことです。
商用利用もできますが一部モデル(FLUX.1 Dev)モデルは規約の確認が必要で基本非商用です。
API利用したいのであればfal.aiという企業が提供しているAPIをつかうのが使いやすいです。
https://fal.ai/dashboard
huggingface上からもお試し的に利用することも可能です。
https://huggingface.co/black-forest-labs
~画僧生成AIについて補足~
なお画像生成AIや特にこのFLUXについてですが、まだ新しいのもあり利用の仕方について詳しく記載されているものが少ない印象です。そこで概念について説明します。同じような名前のサービスが多く語弊がありそうな紹介記事も多い印象です。
まずStability AIはStable Diffusionという画像生成AIサービス。Black Forest LabsはFLUX.1という画像生成AIモデルを開発しています。これらのモデルの一部はオープンソースソフトウェア(OSS)として公開されています。そのため知識がある人ならGitHubからダウンロードしてローカル環境で使用できます。これが前提です。
しかしローカル使用には適切なGPUと技術的知識が必要です。そして実際に通常のPCでは限界があります。たとえばFLUXを使おうとすると普通のPCのグラボのVRAMでは足りないことがあります。
そこでfal.aiなどがこれらのモデルをAPI化し一般ユーザーにも使いやすい形で従量課金制で提供しています。API化されていることでシステムにも組み込みやすいです。
そして、すべてのモデルがOSSで提供されているわけではありません。具体的にはFLUX.1の[pro]です。これはOSSでの提供は今はされていません。そこでfal.aiのようなサービスを介することで利用可能になるわけです。そして商用利用は先ほど申し上げたFLUX.1 Devは注意が必要です。結論としてはまずは始めたいのであればfal.aiなどのAPIを使うのが一つの選択肢といった形です。
・GPTengineer.app(ジーピーティーエンジニア)
GPTengineer.app(ジーピーティーエンジニア)は、自然言語による指示だけでWebアプリケーションを開発できるAIツールです。このサービスでは、チャットインターフェースを通じてAIとやり取りしながら、Webアプリを短時間で作成することができます。ユーザーは作成されたアプリのプレビューを確認しながら改善点を指示したりできます。そして、Git経由に直接コード連帯できる点がポイントです。
Create.xyz(クリエイト)がサービス的には近いかなと思います。
・genspark.ai(ジェンスパーク)
AI検索エンジンです。Perplexity AI(パープレキシティ エーアイ)が近いです。ニュアンスとしてはパープレキシティのほうが一般的。そして、genspark.ai(ジェンスパーク)の方がもう少し検索を掘る感じが個人的感想です。自分は両方で調べてみたりして精度上げてます。なのでパプッて、ジェネることもありますが、ジェネって微妙だとおもったらパプり返すこともあります。
これは好みが出そうなので両方使ってみるといいです。無料で使えます。
・Napkin AI(ナプキンエーアイ)
図形生成AIです。いままでもサービスとしてはありました。ただつい先日日本語に対応したことで本格的に日本人が利用しやすくなりました。
これで生成AIで作ったスライドはなんかダサいの時代は終了するかもしれません。
テキスト生成に関しては何とも言えないところもあるので、前述のサービスでいくと
・Perplexity AIやgenspark.aiで調査。
・ClaudeやGeminiなどでそれを整理。
・Napkin AIやMapifyをつかいさらに図でわかりやすく。
いまのところこんな感じがベストポートフォリオかなと思います。
v0のビジュアル力と結合して動的なものを作り出したりもできる。そして、全部をつないでAIエージェント化して任せたらスライドが出来上がる。それをAIエージェント化して再評価する。なんてこともできるようになるかもしれません。
まとめ
いかがでしたか?まだサービスとして出たてのものも多くあるのでこれからが楽しみではあります。
最近では、PMF(プロダクトマーケットフィット)ならぬJMF(ジャパンマーケットフィット)と評されて、日本の市場に合うかどうかがサービスの分岐点のようにとらえる海外企業が増えてきたようです。
そのため多くのサービスが日本語を対応してくれるのはありがたいです。
無料で試せるサービスもおおいですからまずは個人レベルで試すところ初めて見るといいかもです。
私は、
・Corsor(カーソル)
・Claude(クロード)
・v0(ブイゼロ)
・Dify(ディファイ)
・Perplexity AI(パープレキシティエーアイ)
・FLUX.1(フラックス)
あたりが押しです。
なお当社でも生成AIサービスを利用した受託開発も進めています。お気軽にフォームよりお問合せください。