2025年になったし、本格的にAIを使おうかなと思っているんだけど、どこから始めたら良いかわからない。

2025年になったし、本格的にAIを使おうかなと思っているんだけど、どこから始めたら良いかわからない。

やっぱり、Geminiかなぁ。

 

①ChatGPT:OpenAIが開発し、世界中で最も使われているAIツール
②Copilot:Microsoft×OpenAIが実装するAIアシスタント
③Gemini:マルチモーダル機能を備え「GPTを超える」と言われているGoogleの対話型AI
④Stable Diffusion:オープンソースとして無料で公開されている画像生成AI
⑤Midjourney:Discord上で利用できるハイクオリティな画像生成AI
⑥DALL・E2:OpenAIが提供するクリエイティブな画像生成AI
⑦VALL-E:感情の起伏や抑揚も再現するMicrosoftの音声合成AI
⑧Voicevox:アニメキャラクターが音声を読み上げる日本発の音声合成ソフトウェア
⑨Sora:物理法則も正確に再現した専門家も驚愕の動画生成AI
⑩Lumiere:Googleが開発した自由な編集が可能な動画生成AI

https://metaversesouken.com/ai/generative_ai/comparison/

 

ちなみに、Geminiの説明は以下のようになっています。

Geminiとは、Googleが2023年12月に発表した対話型AIです。文章だけでなく、画像や動画、音声も理解できる”マルチモーダル機能”を備えている点が特徴で、複雑な数学の問題やプログラミング言語の理解など、難しいタスクもこなすことができると発表されています。

Geminiは性能に応じて3つのモデル「Gemini Ultra」、「Gemini Pro」、「Gemini Nano」に分かれています。最も性能の高いGemini Ultraは、数学、物理学、歴史、法律、医学、倫理など、あらゆる科目の知識・問題解決能力テストで人間の専門家を上回るパフォーマンスを発揮したと発表されています。

Googleは、GeminiがGPT-4を上回る性能を持つと強調しており、ChatGPTの有力な対抗馬として注目されています。

専門的で高度な内容を扱う研究職・専門職の方にとって、強力な味方になります。

https://metaversesouken.com/ai/generative_ai/comparison/