ハノイのオンラインショップのオーナーであるミン・クアン氏は、以前はChatGPTで画像を作成すると、文字の部分が誤り、フォントのずれ、または読みにくくなることがよくあったと述べています。
「商品を販売するためにバナーを作成するたびに、バナーから製品写真まで、文字はスタンプの間違い、フォントのずれ、または読みにくいため、ほぼすべて修正する必要があります。文字を修正するだけで1時間もかかる日もあり、自分でデザインするよりも時間がかかります。そのため、私はこの作業にChatGPTをほとんど使用しません」とクアンさんは言います。
これらの制限のために、クアン氏や他の多くのユーザーは、文字入りの写真を生成する必要がある場合に、GoogleのGeminiなどの他のツールに徐々に移行しています。以前のChatGPTと比較して、このツールのテキスト表示機能はより安定していると評価されています。

しかし、このエクスペリエンスはChatGPTのImages 2.0アップデート後に変更されました。バナーを作成するために再試行したとき、クアン氏は結果が「以前とは全く異なる」と述べました。ベトナム語の文字は明確に表示され、記号が正しく、あまり編集せずにすぐに使用できます。
ハノイのグラフィックデザイナーであるトゥー・ハンさんは、最初は見直すためだけに試してみたが、結果に驚いたと語った。「インフォグラフィックを作っているので、文字の間違いが非常に怖いです。以前は、修正しすぎたため、ChatGPTをほとんど使用していませんでした。今回試してみると、文字は大部分が正しく、レイアウトも維持でき、軽く調整するだけで使用できます」とハンさんは語った。
一方、ソーシャルネットワークのコンテンツクリエイターであるドゥック・アイン氏も、新しいImages 2.0アップデートを体験して驚きを表明しました。「ベトナム語で引用された一連の写真を試してみましたが、返された結果はかなり良好に表示され、修正をあまりせずにすぐに使用できます」とドゥック・アイン氏は共有しました。
OpenAIによると、Images 2.0は、テキスト、アイコン、複雑なレイアウトなどの小さな詳細をより適切に処理するように改善されています。モデルには推論機能も統合されており、表示前に結果を自動的にチェックおよび最適化できるため、テキストなどの難しいコンポーネントでのエラーを減らすことができます。

AIがテキストを正確に表示することは、拡散技術の特殊性により大きな課題であり、小さな詳細よりも全体的な画像の再作成を優先することがよくあります。これにより、文字、特にベトナム語のような記号付き言語は、歪みやすくなります。
実際のテストでは、新しいバージョンがこの制限を大幅に改善したことが示されています。長いテキストは、多くの場合、明確さとスペルミスを維持しています。
それでも、ツールはまだ完全に安定していません。複雑なレイアウトや情報量の多いグラフでも、エラーが発生する可能性があります。
ベトナム語では「使う価値がない」と見なされていたChatGPTは、徐々にユーザーの信頼を取り戻しつつあります。正確な文字表示能力は、AIが実際のアプリケーションに入るかどうかを決定する重要な要素と見なされています。