ChatGPTに音声機能と画像認識機能を新たに追加

当ページのリンクには広告が含まれています。
ChatGPT-image

OpenAIがChatGPTの最新機能を発表しました。

音声会話機能画像認識機能

ChatGPT can now see, hear, and speak

今後2週間以内に有料プラン「ChatGPT Plus」と「ChatGPT Enterprise」の加入者に対して新機能を提供予定とのこと。このうち、画像認識機能は全プラットフォームで利用可能になり、音声コミュニケーション機能はiOS版ChatGPTとAndroid版ChatGPTでのみ利用可能になる予定です。

1. 音声会話機能

音声会話機能により、ユーザーは文字を入力することなく、ChatGPTと音声でコミュニケーションをとることが可能になります。これにはOpenAIのオープンソースの音声認識システム「Whisper」が使用され、ユーザーの音声をリアルタイムでテキストに変換します。また、返答としては新しいテキスト読み上げモデルを採用。数秒のサンプル音声から人間らしい音声が生成されることが特徴です。この機能はiOS版とAndroid版のChatGPTでのみ利用可能となります。

2. 画像認識機能

もう一つの注目の機能が、ChatGPTが画像の内容を認識する「画像認識機能」です。ユーザーはキャプチャした画像を選択し、それをChatGPTに送信することで、画像の内容に関する質問や説明を受け取ることができます。さらに、描画ツールを利用して画像上に補足的な説明や注釈を加えることも可能です。この機能は、マルチモーダルGPT-3.5およびGPT-4によって強化されており、これらのモデルは言語推論スキルを様々な画像にも適用することができるとされています。この機能はすべてのプラットフォームでの利用が可能です。

画像認識機能では、Webサービスのスクショからコードを書いてもらうことができるなどの話もあったので、かなり期待しています。

まとめ

OpenAIのChatGPTが、音声と画像機能を搭載してきました。会話も可能となり、AIとのコミュニケーションが可能となることから大変興味深く変化を期待しています。まもなく、新機能が利用可能になるので楽しみに待ちたいと思います。

目次

関連記事

あわせて読みたい
ChatGPTの文字数制限をクリアする方法 ChatGPTの文字数制限に悩んでいる方に、解決策を紹介します。ChatGPTの文字数制限を突破するための具体的な手順を学びます。テキスト分割のプロンプトの作り方や、ChatG...
あわせて読みたい
ChatGPTが途中で止まるのはなぜ?対策まとめ&続きを出す裏ワザも紹介 ChatGPTを使っていて「文章の途中で止まってしまった」「続きが出てこない」という経験はありませんか?本記事では、なぜChatGPTの回答が途切れるのか、その原因と具体...
あわせて読みたい
ChatGPTのトークン圧縮の可能性を探る ChatGPTのトークンはAPIコストや、入力制限の影響を与えるため、トークンを圧縮・解凍する方法があればその限界を克服できる可能性が高まります。APIのコスト削減にも役...
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

こんにちは、現役医師のDr. Harvです。
このブログは、医師特有の「論理的思考」を武器に、多忙な同業の仲間たちの人生における3大テーマ【キャリア・お金・QOL】を最適化するための、戦略と実践録を発信するプラットフォームです。
単なる情報ではなく「思考のOS」をアップデートする、信頼できるナビゲーターでありたいと考えています。

目次